Ιδρυματικό Αποθετήριο [SANDBOX]
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Διερεύνηση συμπεριφοριστικών και συναισθηματικών μοντέλων μέσω μίμησης και ενισχυτικής μάθησης

Kapenekakis Antheas

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/6ABCFD10-5CD7-4AC5-9A3E-89A7EFCF3A28
Έτος 2021
Τύπος Διπλωματική Εργασία
Άδεια Χρήσης
Λεπτομέρειες
Βιβλιογραφική Αναφορά Antheas Kapenekakis, "Investigating behavioural and affective cloning via imitation and reinforcement learning", Diploma Work, School of Electrical Engineering and Computer Engineering, Technical University of Crete, Chania, Greece, 2021 https://doi.org/10.26233/heallink.tuc.89437
Εμφανίζεται στις Συλλογές

Περίληψη

Τα τελευταία χρόνια, η έρευνα της συναισθηματικής εμπειρίας στις αλληλεπιδράσεις μεταξύ υπολογιστών-χρηστών, βιντεοπαιχνιδιών, ακόμη και livestream, γίνεται όλο και πιο επίκαιρη. Η αντικειμενική μέτρηση της συναισθηματικής εμπειρίας ενός κοινού έχει σημαντικές επιπτώσεις στα έσοδα μίας επιχείρησης και στη διατήρηση χρηστών. Ένα πεδίο που είναι σχετικά μη ερευνημένο είναι η μοντελοποίηση των χρηστών σε μία αλληλεπίδραση, ειδικά στο πλαίσιο των βιντεοπαιχνιδιών. Σε αυτή τη διπλωματική, παρουσιάζεται μία διαδικασία για τη δημιουργία ενός συναισθηματικού πράκτορα, η οποία αξιοποιεί συναισθηματικές παρατηρήσεις από χρήστες για να μεταποιήσει τη συμπεριφορά του πράκτορα ως προς την εμφάνιση ενός συγκεκριμένου συναισθήματος, ενώ ο πράκτορας προσπαθεί να ολοκληρώσει ένα στόχο.Για την δημιουργία αυτού του πράκτορα, δημιουργήθηκε ένα εργαλείο για την άντληση σχολιασμών από εθελοντές και χρησιμοποιήθηκε για τη δημιουργία μίας βάσης δεδομένων με συναισθηματικούς σχολιασμούς. Στη συνέχεια, αυτή η βάση δοκιμάστηκε για εγκυρότητα εκτελώντας πειράματα supervised learning. Χρησιμοποιώντας μια μορφή του αλγορίθμου Deep Q Learning, μαζί με τα δεδομένα που συλλέχθηκαν, δημιουργήθηκε ένα σύνολο πρακτόρων, με τον κάθε έναν να έχει διαφορετικό στόχο. Ο πρωτεύων πράκτορας, μέσω Reinforcement Learning, επικεντρώθηκε στην ολοκλήρωση του στόχου στο περιβάλλον, ενώ οι υπόλοιποι επικεντρώθηκαν στη μεγιστοποίηση ενός συναισθήματος. Τελικά, το σύνολο των πρακτόρων συνδυάστηκε σε διάφορες αναλογίες για να σχηματιστούν σύνθετοι πράκτορες που επικεντρώνονταν το συναίσθημα όσο και στη συμπεριφορά, με ορισμένους συνδυασμούς να είναι επιτυχημένοι και στα δύο.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά