URI | http://purl.tuc.gr/dl/dias/A14031E6-2685-4574-881F-77A04017278C | - |
Αναγνωριστικό | http://www.robolab.tuc.gr/ASSETS/PAPERS_PDF/PAPERS_2009/HEROC_2009/022_Vlas_Kon_Pip.pdf | - |
Γλώσσα | el | - |
Μέγεθος | 6 σελίδες | el |
Τίτλος | Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού | el |
Δημιουργός | Vlassis Nikolaos | en |
Δημιουργός | Βλασσης Νικολαος | el |
Δημιουργός | Kontes Georgios | en |
Δημιουργός | Κοντες Γεωργιος | el |
Δημιουργός | Piperidis Savvas | en |
Δημιουργός | Πιπεριδης Σαββας | el |
Περίληψη | Παρουσιάζουμε μία νέα προσέγγιση στο πρόβλημα της αυτόματης μάθησης ρομποτικού ελέγ-
χου με Ενισχυτική Μάθηση (Reinforcement Learning, RL). Πρόσφατες εργασίες στη βιβλιο-
γραφία έχουν δείξει ότι ένα πρόβλημα Βέλτιστου Ελέγχου Διακριτού Χρόνου (Discrete Time
Optimal Control) μπορεί να αναχθεί σε ένα πρόβλημα Πιθανοτικού Συμπερασμού (Probabilistic
Inference) και να λυθεί με αντίστοιχες τεχνικές. Στην παρούσα εργασία δείχνουμε ότι μια τέτοια
αναγωγή είναι επίσης δυνατή στην περίπτωση που το δυναμικό μοντέλου του συστήματος είναι
άγνωστο, οπότε η μάθηση του ρομποτικού ελέγχου θα πρέπει να γίνει με μεθοδολογίες δοκιμής-
και-σφάλματος (trial-and-error). Η ανάλυση που προτείνουμε οδηγεί σε ένα Monte-Carlo αλ-
γόριθμο Προσδοκίας-Μεγιστοποίησης (Expectation-Maximization, EM) σε ένα μοντέλο μικτής
κατανομής πιθανότητας (probabilistic mixture model). Παραθέτουμε αποτελέσματα από την ε-
φαρμογή του προτεινόμενου αλγορίθμου σε ένα πρόβλημα ισορροπίας κινούμενου ρομπότ. | el |
Τύπος | Πλήρης Δημοσίευση σε Συνέδριο | el |
Τύπος | Conference Full Paper | en |
Άδεια Χρήσης | http://creativecommons.org/licenses/by/4.0/ | en |
Ημερομηνία | 2015-11-13 | - |
Ημερομηνία Δημοσίευσης | 2009 | - |
Θεματική Κατηγορία | Industrial robots | en |
Θεματική Κατηγορία | robots industrial | en |
Θεματική Κατηγορία | industrial robots | en |
Βιβλιογραφική Αναφορά | Ν. Βλάσσης, Γ. Κόντες, Σ. Πιπερίδης, "Ενισχυτική Μάθηση Ρομποτικού Ελέγχου Μέσω Πιθανοτικού Συμπερασμού," στο 1ο Πανελλήνιο Συνέδριο Ρομποτικής, 23-24 Φεβρουαρίου, 2009. | el |