Ιδρυματικό Αποθετήριο [SANDBOX]
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού

Vlassis Nikolaos, Kontes Georgios, Piperidis Savvas

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/A14031E6-2685-4574-881F-77A04017278C
Έτος 2009
Τύπος Πλήρης Δημοσίευση σε Συνέδριο
Άδεια Χρήσης
Λεπτομέρειες
Βιβλιογραφική Αναφορά Ν. Βλάσσης, Γ. Κόντες, Σ. Πιπερίδης, "Ενισχυτική Μάθηση Ρομποτικού Ελέγχου Μέσω Πιθανοτικού Συμπερασμού," στο 1ο Πανελλήνιο Συνέδριο Ρομποτικής, 23-24 Φεβρουαρίου, 2009.
Εμφανίζεται στις Συλλογές

Περίληψη

Παρουσιάζουμε μία νέα προσέγγιση στο πρόβλημα της αυτόματης μάθησης ρομποτικού ελέγ-χου με Ενισχυτική Μάθηση (Reinforcement Learning, RL). Πρόσφατες εργασίες στη βιβλιο-γραφία έχουν δείξει ότι ένα πρόβλημα Βέλτιστου Ελέγχου Διακριτού Χρόνου (Discrete TimeOptimal Control) μπορεί να αναχθεί σε ένα πρόβλημα Πιθανοτικού Συμπερασμού (ProbabilisticInference) και να λυθεί με αντίστοιχες τεχνικές. Στην παρούσα εργασία δείχνουμε ότι μια τέτοιααναγωγή είναι επίσης δυνατή στην περίπτωση που το δυναμικό μοντέλου του συστήματος είναιάγνωστο, οπότε η μάθηση του ρομποτικού ελέγχου θα πρέπει να γίνει με μεθοδολογίες δοκιμής-και-σφάλματος (trial-and-error). Η ανάλυση που προτείνουμε οδηγεί σε ένα Monte-Carlo αλ-γόριθμο Προσδοκίας-Μεγιστοποίησης (Expectation-Maximization, EM) σε ένα μοντέλο μικτήςκατανομής πιθανότητας (probabilistic mixture model). Παραθέτουμε αποτελέσματα από την ε-φαρμογή του προτεινόμενου αλγορίθμου σε ένα πρόβλημα ισορροπίας κινούμενου ρομπότ.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά