Ιδρυματικό Αποθετήριο [SANDBOX]
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού

Vlassis Nikolaos, Kontes Georgios, Piperidis Savvas

Απλή Εγγραφή


URIhttp://purl.tuc.gr/dl/dias/A14031E6-2685-4574-881F-77A04017278C-
Αναγνωριστικόhttp://www.robolab.tuc.gr/ASSETS/PAPERS_PDF/PAPERS_2009/HEROC_2009/022_Vlas_Kon_Pip.pdf-
Γλώσσαel-
Μέγεθος6 σελίδεςel
ΤίτλοςΕνισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμούel
ΔημιουργόςVlassis Nikolaosen
ΔημιουργόςΒλασσης Νικολαοςel
ΔημιουργόςKontes Georgiosen
ΔημιουργόςΚοντες Γεωργιοςel
ΔημιουργόςPiperidis Savvasen
ΔημιουργόςΠιπεριδης Σαββαςel
ΠερίληψηΠαρουσιάζουμε μία νέα προσέγγιση στο πρόβλημα της αυτόματης μάθησης ρομποτικού ελέγ- χου με Ενισχυτική Μάθηση (Reinforcement Learning, RL). Πρόσφατες εργασίες στη βιβλιο- γραφία έχουν δείξει ότι ένα πρόβλημα Βέλτιστου Ελέγχου Διακριτού Χρόνου (Discrete Time Optimal Control) μπορεί να αναχθεί σε ένα πρόβλημα Πιθανοτικού Συμπερασμού (Probabilistic Inference) και να λυθεί με αντίστοιχες τεχνικές. Στην παρούσα εργασία δείχνουμε ότι μια τέτοια αναγωγή είναι επίσης δυνατή στην περίπτωση που το δυναμικό μοντέλου του συστήματος είναι άγνωστο, οπότε η μάθηση του ρομποτικού ελέγχου θα πρέπει να γίνει με μεθοδολογίες δοκιμής- και-σφάλματος (trial-and-error). Η ανάλυση που προτείνουμε οδηγεί σε ένα Monte-Carlo αλ- γόριθμο Προσδοκίας-Μεγιστοποίησης (Expectation-Maximization, EM) σε ένα μοντέλο μικτής κατανομής πιθανότητας (probabilistic mixture model). Παραθέτουμε αποτελέσματα από την ε- φαρμογή του προτεινόμενου αλγορίθμου σε ένα πρόβλημα ισορροπίας κινούμενου ρομπότ.el
ΤύποςΠλήρης Δημοσίευση σε Συνέδριοel
ΤύποςConference Full Paperen
Άδεια Χρήσηςhttp://creativecommons.org/licenses/by/4.0/en
Ημερομηνία2015-11-13-
Ημερομηνία Δημοσίευσης2009-
Θεματική ΚατηγορίαIndustrial robotsen
Θεματική Κατηγορίαrobots industrialen
Θεματική Κατηγορίαindustrial robotsen
Βιβλιογραφική ΑναφοράΝ. Βλάσσης, Γ. Κόντες, Σ. Πιπερίδης, "Ενισχυτική Μάθηση Ρομποτικού Ελέγχου Μέσω Πιθανοτικού Συμπερασμού," στο 1ο Πανελλήνιο Συνέδριο Ρομποτικής, 23-24 Φεβρουαρίου, 2009.el

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά