URI | http://purl.tuc.gr/dl/dias/A14031E6-2685-4574-881F-77A04017278C | - |
Identifier | http://www.robolab.tuc.gr/ASSETS/PAPERS_PDF/PAPERS_2009/HEROC_2009/022_Vlas_Kon_Pip.pdf | - |
Language | el | - |
Extent | 6 σελίδες | el |
Title | Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού | el |
Creator | Vlassis Nikolaos | en |
Creator | Βλασσης Νικολαος | el |
Creator | Kontes Georgios | en |
Creator | Κοντες Γεωργιος | el |
Creator | Piperidis Savvas | en |
Creator | Πιπεριδης Σαββας | el |
Content Summary | Παρουσιάζουμε μία νέα προσέγγιση στο πρόβλημα της αυτόματης μάθησης ρομποτικού ελέγ-
χου με Ενισχυτική Μάθηση (Reinforcement Learning, RL). Πρόσφατες εργασίες στη βιβλιο-
γραφία έχουν δείξει ότι ένα πρόβλημα Βέλτιστου Ελέγχου Διακριτού Χρόνου (Discrete Time
Optimal Control) μπορεί να αναχθεί σε ένα πρόβλημα Πιθανοτικού Συμπερασμού (Probabilistic
Inference) και να λυθεί με αντίστοιχες τεχνικές. Στην παρούσα εργασία δείχνουμε ότι μια τέτοια
αναγωγή είναι επίσης δυνατή στην περίπτωση που το δυναμικό μοντέλου του συστήματος είναι
άγνωστο, οπότε η μάθηση του ρομποτικού ελέγχου θα πρέπει να γίνει με μεθοδολογίες δοκιμής-
και-σφάλματος (trial-and-error). Η ανάλυση που προτείνουμε οδηγεί σε ένα Monte-Carlo αλ-
γόριθμο Προσδοκίας-Μεγιστοποίησης (Expectation-Maximization, EM) σε ένα μοντέλο μικτής
κατανομής πιθανότητας (probabilistic mixture model). Παραθέτουμε αποτελέσματα από την ε-
φαρμογή του προτεινόμενου αλγορίθμου σε ένα πρόβλημα ισορροπίας κινούμενου ρομπότ. | el |
Type of Item | Πλήρης Δημοσίευση σε Συνέδριο | el |
Type of Item | Conference Full Paper | en |
License | http://creativecommons.org/licenses/by/4.0/ | en |
Date of Item | 2015-11-13 | - |
Date of Publication | 2009 | - |
Subject | Industrial robots | en |
Subject | robots industrial | en |
Subject | industrial robots | en |
Bibliographic Citation | Ν. Βλάσσης, Γ. Κόντες, Σ. Πιπερίδης, "Ενισχυτική Μάθηση Ρομποτικού Ελέγχου Μέσω Πιθανοτικού Συμπερασμού," στο 1ο Πανελλήνιο Συνέδριο Ρομποτικής, 23-24 Φεβρουαρίου, 2009. | el |