<efrbr:recordSet xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:efrbr="http://vfrbr.info/efrbr/1.1" xmlns:efrbr-work="http://vfrbr.info/efrbr/1.1/work" xmlns:efrbr-expression="http://vfrbr.info/efrbr/1.1/expression" xmlns:efrbr-manifestation="http://vfrbr.info/efrbr/1.1/manifestation" xmlns:efrbr-person="http://vfrbr.info/efrbr/1.1/person" xmlns:efrbr-corporateBody="http://vfrbr.info/efrbr/1.1/corporateBody" xmlns:efrbr-concept="http://vfrbr.info/efrbr/1.1/concept" xmlns:efrbr-structure="http://vfrbr.info/efrbr/1.1/structure" xmlns:efrbr-responsible="http://vfrbr.info/efrbr/1.1/responsible" xmlns:efrbr-subject="http://vfrbr.info/efrbr/1.1/subject" xmlns:efrbr-other="http://vfrbr.info/efrbr/1.1/other" xsi:schemaLocation="http://vfrbr.info/efrbr/1.1 http://vfrbr.info/schemas/1.1/efrbr.xsd"><efrbr:entities><efrbr-work:work identifier="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B"><efrbr-work:titleOfTheWork>Building configurable reinforcement learning robotic environments
</efrbr-work:titleOfTheWork></efrbr-work:work><efrbr-expression:expression identifier="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B"><efrbr-expression:titleOfTheExpression>Building configurable reinforcement learning robotic environments
</efrbr-expression:titleOfTheExpression><efrbr-expression:titleOfTheExpression>Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης</efrbr-expression:titleOfTheExpression><efrbr-expression:formOfExpression vocabulary="DIAS:TYPES">
            Διπλωματική Εργασία
            Diploma Work
         </efrbr-expression:formOfExpression><efrbr-expression:dateOfExpression type="issued">2025-03-10</efrbr-expression:dateOfExpression><efrbr-expression:dateOfExpression type="published">2025</efrbr-expression:dateOfExpression><efrbr-expression:languageOfExpression vocabulary="iso639-1">en</efrbr-expression:languageOfExpression><efrbr-expression:summarizationOfContent>The creation of standardized environment implementations and an Application Programming Interface (API) for OpenAI/Gym has had a transformative impact on reinforcement learning (RL) research. However, the current set of standardized environments has to be extended, so as to contribute to the further advancement of reinforcement learning algorithms. In this diploma thesis, we have developed, and we provide a plethora of novel environments and frameworks for robotic reinforcement learning, including Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, and Gymnasium-Robotics /MaMuJoCo, along with offline RL datasets for Gymnasium/MuJoCo environments with the Minari API. These advancements can potentially enable researchers to develop and test new algorithms in more realistic and challenging environments, which will ultimately lead to more robust and generalizable reinforcement learning algorithms.
</efrbr-expression:summarizationOfContent><efrbr-expression:summarizationOfContent>Η δημιουργία τυποποιημένων υλοποιήσεων περιβάλλοντος και ενός Application Programming Interface (API) για το OpenAI/Gym, έπαιξε καθοριστικό ρόλο στην πρόσφατη πρόοδο της έρευνας για reinforcement learning (RL). Ωστόσο, το περιορισμένο σε αριθμό και δυνατότητες τρέχον σύνολο τυποποιημένων περιβαλλόντων αποτελεί εν δυνάμει εμπόδιο για την περαιτέρω πρόοδο των αλγορίθμων ενισχυτικής μάθησης. Στην παρούσα διπλωματική εργασία, έχουμε αναπτύξει και παρέχουμε μια πληθώρα νέων περιβαλλόντων και πλαισίων για ρομποτική ενισχυτική μάθηση, συμπεριλαμβανομένων των Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, και Gymnasium-Robotics/MaMuJoCo, μαζί με σύνολα δεδομένων για χρήση από offline RL μεθόδους σε περιβάλλοντα Gymnasium/MuJoCo με το Minari API. Οι συνεισφορές μας αυτές μπορούν δυνητικά να επιτρέψουν στους ερευνητές να αναπτύξουν και να δοκιμάσουν νέους αλγορίθμους σε πιο ρεαλιστικά και δύσκολά περιβάλλοντα, το οποίο τελικά θα οδηγήσει σε πιο ισχυρούς και γενικεύσιμους αλγορίθμους ενισχυτικής μάθησης.</efrbr-expression:summarizationOfContent><efrbr-expression:contextForTheExpression>A technical report on the subjects of (1) Gymnasium/MuJoCo-v5, (2) Offline Minari RL datasets for Gymnasium/MuJoCo-v5, (3) Gymnasium-Robotics/Maze-v5, (4) Gymnasium-Robotics/MaMuJoCo, (5) along with a couple of interesting experiments.</efrbr-expression:contextForTheExpression><efrbr-expression:useRestrictionsOnTheExpression type="creative-commons">http://creativecommons.org/licenses/by/4.0/</efrbr-expression:useRestrictionsOnTheExpression><efrbr-expression:note type="academic unit">Technical University of Crete::School of Electrical and Computer Engineering</efrbr-expression:note></efrbr-expression:expression><efrbr-manifestation:manifestation identifier="https://dias.library.tuc.gr/view/102593"><efrbr-manifestation:titleOfTheManifestation>Kallinteris_Andreas_Dip_2025.pdf</efrbr-manifestation:titleOfTheManifestation><efrbr-manifestation:publicationDistribution><efrbr-manifestation:placeOfPublicationDistribution type="distribution">Chania [Greece]</efrbr-manifestation:placeOfPublicationDistribution><efrbr-manifestation:publisherDistributor type="distributor">Library of TUC</efrbr-manifestation:publisherDistributor><efrbr-manifestation:dateOfPublicationDistribution>2025-03-09</efrbr-manifestation:dateOfPublicationDistribution></efrbr-manifestation:publicationDistribution><efrbr-manifestation:formOfCarrier>application/pdf</efrbr-manifestation:formOfCarrier><efrbr-manifestation:extentOfTheCarrier>2.8 MB</efrbr-manifestation:extentOfTheCarrier><efrbr-manifestation:accessRestrictionsOnTheManifestation>free</efrbr-manifestation:accessRestrictionsOnTheManifestation></efrbr-manifestation:manifestation><efrbr-person:person identifier="http://users.isc.tuc.gr/~akallinteris"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Kallinteris Andreas
            Καλλιντερης Ανδρεας
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~lagoudakis"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Lagoudakis Michail
            Λαγουδακης Μιχαηλ
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~spyropoulos"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Spyropoulos Thrasyvoulos
            Σπυροπουλος Θρασυβουλος
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~gchalkiadakis"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Chalkiadakis Georgios
            Χαλκιαδακης Γεωργιος
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-corporateBody:corporateBody identifier="21C59DD1-3D47-4900-9EA2-39BA436ABC63"><efrbr-corporateBody:nameOfTheCorporateBody vocabulary="">
            Πολυτεχνείο Κρήτης
            Technical University of Crete
         </efrbr-corporateBody:nameOfTheCorporateBody></efrbr-corporateBody:corporateBody><efrbr-concept:concept identifier="35CBF5D6-1AD7-49AB-953B-A0D0735835D3"><efrbr-concept:termForTheConcept>
            Reinforcment Learning
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="04219CA6-A6E8-42D3-B293-CB0E447CF87E"><efrbr-concept:termForTheConcept>
            Gymnasium
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="5BA94BEA-908C-45FE-AD06-2847B0A308B8"><efrbr-concept:termForTheConcept>
            Robotics
         </efrbr-concept:termForTheConcept></efrbr-concept:concept></efrbr:entities><efrbr:relationships><efrbr-structure:structureRelations><efrbr-structure:realizedThrough sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="expression" targetURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B"/><efrbr-structure:embodiedIn sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="manifestation" targetURI="http://purl.tuc.gr/dl/dias/BDE09B5B-7CA3-4910-9B50-52458FC02803"/></efrbr-structure:structureRelations><efrbr-responsible:responsibleRelations><efrbr-responsible:createdBy sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="person" targetURI="http://users.isc.tuc.gr/~akallinteris"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="person" targetURI="http://users.isc.tuc.gr/~akallinteris" role="author"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="person" targetURI="http://users.isc.tuc.gr/~lagoudakis" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/2"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="person" targetURI="http://users.isc.tuc.gr/~spyropoulos" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/2"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="person" targetURI="http://users.isc.tuc.gr/~gchalkiadakis" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/1"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="person" targetURI="21C59DD1-3D47-4900-9EA2-39BA436ABC63" role="publisher"/></efrbr-responsible:responsibleRelations><efrbr-subject:subjectRelations><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="concept" targetURI="35CBF5D6-1AD7-49AB-953B-A0D0735835D3"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="concept" targetURI="04219CA6-A6E8-42D3-B293-CB0E447CF87E"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B" targetEntity="concept" targetURI="5BA94BEA-908C-45FE-AD06-2847B0A308B8"/></efrbr-subject:subjectRelations><efrbr-other:otherRelations/></efrbr:relationships></efrbr:recordSet>