Ιδρυματικό Αποθετήριο [SANDBOX]
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Approximate policy iteration using large-margin classifiers

Lagoudakis Michael

Απλή Εγγραφή


URIhttp://purl.tuc.gr/dl/dias/B95FD666-3683-44DB-8681-8CB3C2DFEC7B-
Γλώσσαen-
Μέγεθος3 pagesen
ΤίτλοςApproximate policy iteration using large-margin classifiersen
ΔημιουργόςLagoudakis Michaelen
ΔημιουργόςΛαγουδακης Μιχαηλel
ΠερίληψηWe present an approximate policy iteration algorithm that uses rollouts to estimate the value of each action under a given policy in a subset of states and a classifier to generalize and learn the improved policy over the entire state space. Using a multiclass support vector machine as the classifier, we obtained successful results on the inverted pendulum and the bicycle balancing and riding domains.en
ΤύποςΠλήρης Δημοσίευση σε Συνέδριοel
ΤύποςConference Full Paperen
Άδεια Χρήσηςhttp://creativecommons.org/licenses/by/4.0/en
Ημερομηνία2015-11-13-
Ημερομηνία Δημοσίευσης2003-
Θεματική ΚατηγορίαArtificial Intelligenceen
Βιβλιογραφική ΑναφοράM.G. Lagoudakis and R. Parr, “Approximate policy iteration using large-margin classifiers,” in Proceedings of the 18th International Joint Conference on Artificial Intelligence (IJCAI), 2003, pp. 1432–1434.en

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά