Ιδρυματικό Αποθετήριο [SANDBOX]
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης

Kallinteris Andreas

Απλή Εγγραφή


URIhttp://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B-
Αναγνωριστικόhttps://doi.org/10.26233/heallink.tuc.102570-
Γλώσσαen-
Μέγεθος64 pagesen
ΤίτλοςBuilding configurable reinforcement learning robotic environments en
ΤίτλοςΔημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησηςel
ΔημιουργόςKallinteris Andreasen
ΔημιουργόςΚαλλιντερης Ανδρεαςel
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Lagoudakis Michailen
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Λαγουδακης Μιχαηλel
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Spyropoulos Thrasyvoulosen
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Σπυροπουλος Θρασυβουλοςel
Συντελεστής [Επιβλέπων Καθηγητής]Chalkiadakis Georgiosen
Συντελεστής [Επιβλέπων Καθηγητής]Χαλκιαδακης Γεωργιοςel
ΕκδότηςΠολυτεχνείο Κρήτηςel
ΕκδότηςTechnical University of Creteen
Ακαδημαϊκή ΜονάδαTechnical University of Crete::School of Electrical and Computer Engineeringen
Ακαδημαϊκή ΜονάδαΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
ΠεριγραφήA technical report on the subjects of (1) Gymnasium/MuJoCo-v5, (2) Offline Minari RL datasets for Gymnasium/MuJoCo-v5, (3) Gymnasium-Robotics/Maze-v5, (4) Gymnasium-Robotics/MaMuJoCo, (5) along with a couple of interesting experiments.en
ΠερίληψηThe creation of standardized environment implementations and an Application Programming Interface (API) for OpenAI/Gym has had a transformative impact on reinforcement learning (RL) research. However, the current set of standardized environments has to be extended, so as to contribute to the further advancement of reinforcement learning algorithms. In this diploma thesis, we have developed, and we provide a plethora of novel environments and frameworks for robotic reinforcement learning, including Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, and Gymnasium-Robotics /MaMuJoCo, along with offline RL datasets for Gymnasium/MuJoCo environments with the Minari API. These advancements can potentially enable researchers to develop and test new algorithms in more realistic and challenging environments, which will ultimately lead to more robust and generalizable reinforcement learning algorithms. en
ΠερίληψηΗ δημιουργία τυποποιημένων υλοποιήσεων περιβάλλοντος και ενός Application Programming Interface (API) για το OpenAI/Gym, έπαιξε καθοριστικό ρόλο στην πρόσφατη πρόοδο της έρευνας για reinforcement learning (RL). Ωστόσο, το περιορισμένο σε αριθμό και δυνατότητες τρέχον σύνολο τυποποιημένων περιβαλλόντων αποτελεί εν δυνάμει εμπόδιο για την περαιτέρω πρόοδο των αλγορίθμων ενισχυτικής μάθησης. Στην παρούσα διπλωματική εργασία, έχουμε αναπτύξει και παρέχουμε μια πληθώρα νέων περιβαλλόντων και πλαισίων για ρομποτική ενισχυτική μάθηση, συμπεριλαμβανομένων των Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, και Gymnasium-Robotics/MaMuJoCo, μαζί με σύνολα δεδομένων για χρήση από offline RL μεθόδους σε περιβάλλοντα Gymnasium/MuJoCo με το Minari API. Οι συνεισφορές μας αυτές μπορούν δυνητικά να επιτρέψουν στους ερευνητές να αναπτύξουν και να δοκιμάσουν νέους αλγορίθμους σε πιο ρεαλιστικά και δύσκολά περιβάλλοντα, το οποίο τελικά θα οδηγήσει σε πιο ισχυρούς και γενικεύσιμους αλγορίθμους ενισχυτικής μάθησης.el
ΤύποςΔιπλωματική Εργασίαel
ΤύποςDiploma Worken
Άδεια Χρήσηςhttp://creativecommons.org/licenses/by/4.0/en
Ημερομηνία2025-03-10-
Ημερομηνία Δημοσίευσης2025-
Θεματική ΚατηγορίαReinforcment Learningen
Θεματική ΚατηγορίαGymnasiumen
Θεματική ΚατηγορίαRoboticsen
Βιβλιογραφική ΑναφοράAndreas Kallinteris, " Building Configurable Reinforcement Learning Robotic Environments", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2025en
Βιβλιογραφική ΑναφοράΑνδρέας Καλλιντέρης, "Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025el

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά