Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού

Vlassis Nikolaos, Kontes Georgios, Piperidis Savvas

URI	http://purl.tuc.gr/dl/dias/A14031E6-2685-4574-881F-77A04017278C	-
Identifier	http://www.robolab.tuc.gr/ASSETS/PAPERS_PDF/PAPERS_2009/HEROC_2009/022_Vlas_Kon_Pip.pdf	-
Language	el	-
Extent	6 σελίδες	el
Title	Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού	el
Creator	Vlassis Nikolaos	en
Creator	Βλασσης Νικολαος	el
Creator	Kontes Georgios	en
Creator	Κοντες Γεωργιος	el
Creator	Piperidis Savvas	en
Creator	Πιπεριδης Σαββας	el
Content Summary	Παρουσιάζουμε μία νέα προσέγγιση στο πρόβλημα της αυτόματης μάθησης ρομποτικού ελέγ- χου με Ενισχυτική Μάθηση (Reinforcement Learning, RL). Πρόσφατες εργασίες στη βιβλιο- γραφία έχουν δείξει ότι ένα πρόβλημα Βέλτιστου Ελέγχου Διακριτού Χρόνου (Discrete Time Optimal Control) μπορεί να αναχθεί σε ένα πρόβλημα Πιθανοτικού Συμπερασμού (Probabilistic Inference) και να λυθεί με αντίστοιχες τεχνικές. Στην παρούσα εργασία δείχνουμε ότι μια τέτοια αναγωγή είναι επίσης δυνατή στην περίπτωση που το δυναμικό μοντέλου του συστήματος είναι άγνωστο, οπότε η μάθηση του ρομποτικού ελέγχου θα πρέπει να γίνει με μεθοδολογίες δοκιμής- και-σφάλματος (trial-and-error). Η ανάλυση που προτείνουμε οδηγεί σε ένα Monte-Carlo αλ- γόριθμο Προσδοκίας-Μεγιστοποίησης (Expectation-Maximization, EM) σε ένα μοντέλο μικτής κατανομής πιθανότητας (probabilistic mixture model). Παραθέτουμε αποτελέσματα από την ε- φαρμογή του προτεινόμενου αλγορίθμου σε ένα πρόβλημα ισορροπίας κινούμενου ρομπότ.	el
Type of Item	Πλήρης Δημοσίευση σε Συνέδριο	el
Type of Item	Conference Full Paper	en
License	http://creativecommons.org/licenses/by/4.0/	en
Date of Item	2015-11-13	-
Date of Publication	2009	-
Subject	Industrial robots	en
Subject	robots industrial	en
Subject	industrial robots	en
Bibliographic Citation	Ν. Βλάσσης, Γ. Κόντες, Σ. Πιπερίδης, "Ενισχυτική Μάθηση Ρομποτικού Ελέγχου Μέσω Πιθανοτικού Συμπερασμού," στο 1ο Πανελλήνιο Συνέδριο Ρομποτικής, 23-24 Φεβρουαρίου, 2009.	el

Search

Browse

My Space

Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού

Vlassis Nikolaos, Kontes Georgios, Piperidis Savvas

Available Files

Services

Export

Share

Statistics

Metadata & Content in a METS Package:

Metadata in Format: