URI | http://purl.tuc.gr/dl/dias/0941C3A3-CF9E-4F93-9538-5D82CE5CDCCA | - |
Identifier | https://doi.org/10.26233/heallink.tuc.66234 | - |
Language | en | - |
Extent | 268,8 kilobytes | en |
Title | Streaming, high performance support vector methods | en |
Title | Υψηλής απόδοσης μέθοδοι διανυσμάτων υποστήριξης σε ροές δεδομένων | el |
Creator | Chrysogelos Periklis | en |
Creator | Χρυσογελος Περικλης | el |
Contributor [Thesis Supervisor] | Garofalakis Minos | en |
Contributor [Thesis Supervisor] | Γαροφαλακης Μινως | el |
Contributor [Committee Member] | Samoladas Vasilis | en |
Contributor [Committee Member] | Σαμολαδας Βασιλης | el |
Contributor [Committee Member] | Deligiannakis Antonios | en |
Contributor [Committee Member] | Δεληγιαννακης Αντωνιος | el |
Publisher | Πολυτεχνείο Κρήτης | el |
Publisher | Technical University of Crete | en |
Academic Unit | Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
Content Summary | We are in an era where data are constantly being generated and machine learning can benefit from this to produce better models. Support vector machines are a popular machine learning model, which can be adapted and used for various tasks, such as classification, regression and clustering. We study the problem of continuously updating L2 Support Vector Machines in a distributed environment where new data constantly arrive in remote sites. We approach this as the problem of tracking a convex function’s minimum over the convex hull of the union of fully dynamic sets, each one located in one of the sites. We give communication efficient solutions for both the exact and approximate variants of the problem and show that they are applicable in the case of a kernelized SVM trained in an explicit feature space. In our proposed methods, the sites communicate only when it is necessary, that is, every time the model has been truly outdated. Also, in case the sites are forced to communicate, we propose two algorithms, one iterative and one with a single stage of communication. | en |
Content Summary | Ζούμε σε μια εποχή όπου δεδομένα δημιουργούνται συνεχώς και η μηχανική μάθηση μπορεί να τα χρησιμοποιήσει για να παράγει καλύτερα μοντέλα. Οι μηχανές διανυσμάτων υποστήριξης (SVMs) είναι ένα δημοφιλές μοντέλο το οποίο μπορεί να προσαρμοστεί και να χρησιμοποιηθεί για διάφορες χρήσεις, όπως για ταξινόμηση, παρεµβολή και ομαδοποίηση. Μελετάμε το πρόβλημα ταυ να ενημερώνουμε συνεχόμενα L2 SVMS σε ένα κατανεμημένο περιβάλλον όπου νέα δεδομένα φτάνουν συνεχώς σε απομακρυσμένους κόμβους. Προσεγγίζουμε το πρόβλημα ως παρακολούθηση του ελαχίστου μίας κυρτής συνάρτησης πάνω στην κυρτή θήκη της ένωσης πλήρως δυναμικών συνόλων, που κάθε ένα από τα οποία βρίσκεται σε έναν από τους κόμβους. Δίνουμε επικοινωνιακά αποτελεσματικές λύσεις για την ακριβή και την προσεγγιστική λύση του προβλήματος και δείχνουμε ότι είναι εφαρμόσημες στην περίπτωση που οι SVM με πυρήνα και εκπαιδεύονται σε έναν υπονοούμενο χώρο. Οι μέθοδοι μας, επικοινωνούν μόνο όταν είναι απαραίτητο, δηλαδή κάθε φορά που το μοντέλο είναι πραγματικά μη ενημερωμένο. Επίσης, στην περίπτωση που χρειάζεται να επικοινωνήσουν, προτείνουμε δυο αλγόριθμους, ένα επαναληπτικό και με ένα στάδιο επικοινωνίας. | el |
Type of Item | Διπλωματική Εργασία | el |
Type of Item | Diploma Work | en |
License | http://creativecommons.org/licenses/by/4.0/ | en |
Date of Item | 2016-08-30 | - |
Date of Publication | 2016 | - |
Subject | Data mining | en |
Subject | Computational geometry | en |
Subject | Distributed algorithms | en |
Bibliographic Citation | Periklis Chrysogelos, "Streaming, high performance support vector methods", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2016 | en |
Bibliographic Citation | Περικλής Χρυσόγελος, "Υψηλής απόδοσης μέθοδοι διανυσμάτων υποστήριξης σε ροές δεδομένων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2016 | el |