URI | http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B | - |
Αναγνωριστικό | https://doi.org/10.26233/heallink.tuc.102570 | - |
Γλώσσα | en | - |
Μέγεθος | 64 pages | en |
Τίτλος | Building configurable reinforcement learning robotic environments
| en |
Τίτλος | Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης | el |
Δημιουργός | Kallinteris Andreas | en |
Δημιουργός | Καλλιντερης Ανδρεας | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Lagoudakis Michail | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Λαγουδακης Μιχαηλ | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Spyropoulos Thrasyvoulos | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Σπυροπουλος Θρασυβουλος | el |
Συντελεστής [Επιβλέπων Καθηγητής] | Chalkiadakis Georgios | en |
Συντελεστής [Επιβλέπων Καθηγητής] | Χαλκιαδακης Γεωργιος | el |
Εκδότης | Πολυτεχνείο Κρήτης | el |
Εκδότης | Technical University of Crete | en |
Ακαδημαϊκή Μονάδα | Technical University of Crete::School of Electrical and Computer Engineering | en |
Ακαδημαϊκή Μονάδα | Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
Περιγραφή | A technical report on the subjects of (1) Gymnasium/MuJoCo-v5, (2) Offline Minari RL datasets for Gymnasium/MuJoCo-v5, (3) Gymnasium-Robotics/Maze-v5, (4) Gymnasium-Robotics/MaMuJoCo, (5) along with a couple of interesting experiments. | en |
Περίληψη | The creation of standardized environment implementations and an Application Programming Interface (API) for OpenAI/Gym has had a transformative impact on reinforcement learning (RL) research. However, the current set of standardized environments has to be extended, so as to contribute to the further advancement of reinforcement learning algorithms. In this diploma thesis, we have developed, and we provide a plethora of novel environments and frameworks for robotic reinforcement learning, including Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, and Gymnasium-Robotics /MaMuJoCo, along with offline RL datasets for Gymnasium/MuJoCo environments with the Minari API. These advancements can potentially enable researchers to develop and test new algorithms in more realistic and challenging environments, which will ultimately lead to more robust and generalizable reinforcement learning algorithms.
| en |
Περίληψη | Η δημιουργία τυποποιημένων υλοποιήσεων περιβάλλοντος και ενός Application Programming Interface (API) για το OpenAI/Gym, έπαιξε καθοριστικό ρόλο στην πρόσφατη πρόοδο της έρευνας για reinforcement learning (RL). Ωστόσο, το περιορισμένο σε αριθμό και δυνατότητες τρέχον σύνολο τυποποιημένων περιβαλλόντων αποτελεί εν δυνάμει εμπόδιο για την περαιτέρω πρόοδο των αλγορίθμων ενισχυτικής μάθησης. Στην παρούσα διπλωματική εργασία, έχουμε αναπτύξει και παρέχουμε μια πληθώρα νέων περιβαλλόντων και πλαισίων για ρομποτική ενισχυτική μάθηση, συμπεριλαμβανομένων των Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, και Gymnasium-Robotics/MaMuJoCo, μαζί με σύνολα δεδομένων για χρήση από offline RL μεθόδους σε περιβάλλοντα Gymnasium/MuJoCo με το Minari API. Οι συνεισφορές μας αυτές μπορούν δυνητικά να επιτρέψουν στους ερευνητές να αναπτύξουν και να δοκιμάσουν νέους αλγορίθμους σε πιο ρεαλιστικά και δύσκολά περιβάλλοντα, το οποίο τελικά θα οδηγήσει σε πιο ισχυρούς και γενικεύσιμους αλγορίθμους ενισχυτικής μάθησης. | el |
Τύπος | Διπλωματική Εργασία | el |
Τύπος | Diploma Work | en |
Άδεια Χρήσης | http://creativecommons.org/licenses/by/4.0/ | en |
Ημερομηνία | 2025-03-10 | - |
Ημερομηνία Δημοσίευσης | 2025 | - |
Θεματική Κατηγορία | Reinforcment Learning | en |
Θεματική Κατηγορία | Gymnasium | en |
Θεματική Κατηγορία | Robotics | en |
Βιβλιογραφική Αναφορά | Andreas Kallinteris, " Building Configurable Reinforcement Learning Robotic Environments", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2025 | en |
Βιβλιογραφική Αναφορά | Ανδρέας Καλλιντέρης, "Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025 | el |