Institutional Repository [SANDBOX]
Technical University of Crete
EN  |  EL

Search

Browse

My Space

Streaming, high performance support vector methods

Chrysogelos Periklis

Simple record


URIhttp://purl.tuc.gr/dl/dias/0941C3A3-CF9E-4F93-9538-5D82CE5CDCCA-
Identifierhttps://doi.org/10.26233/heallink.tuc.66234-
Languageen-
Extent268,8 kilobytesen
TitleStreaming, high performance support vector methodsen
TitleΥψηλής απόδοσης μέθοδοι διανυσμάτων υποστήριξης σε ροές δεδομένωνel
CreatorChrysogelos Periklisen
CreatorΧρυσογελος Περικληςel
Contributor [Thesis Supervisor]Garofalakis Minosen
Contributor [Thesis Supervisor]Γαροφαλακης Μινωςel
Contributor [Committee Member]Samoladas Vasilisen
Contributor [Committee Member]Σαμολαδας Βασιληςel
Contributor [Committee Member]Deligiannakis Antoniosen
Contributor [Committee Member]Δεληγιαννακης Αντωνιοςel
PublisherΠολυτεχνείο Κρήτηςel
PublisherTechnical University of Creteen
Academic UnitΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
Content SummaryWe are in an era where data are constantly being generated and machine learning can benefit from this to produce better models. Support vector machines are a popular machine learning model, which can be adapted and used for various tasks, such as classification, regression and clustering. We study the problem of continuously updating L2 Support Vector Machines in a distributed environment where new data constantly arrive in remote sites. We approach this as the problem of tracking a convex function’s minimum over the convex hull of the union of fully dynamic sets, each one located in one of the sites. We give communication efficient solutions for both the exact and approximate variants of the problem and show that they are applicable in the case of a kernelized SVM trained in an explicit feature space. In our proposed methods, the sites communicate only when it is necessary, that is, every time the model has been truly outdated. Also, in case the sites are forced to communicate, we propose two algorithms, one iterative and one with a single stage of communication.en
Content SummaryΖούμε σε μια εποχή όπου δεδομένα δημιουργούνται συνεχώς και η μηχανική μάθηση μπορεί να τα χρησιμοποιήσει για να παράγει καλύτερα μοντέλα. Οι μηχανές διανυσμάτων υποστήριξης (SVMs) είναι ένα δημοφιλές μοντέλο το οποίο μπορεί να προσαρμοστεί και να χρησιμοποιηθεί για διάφορες χρήσεις, όπως για ταξινόμηση, παρεµβολή και ομαδοποίηση. Μελετάμε το πρόβλημα ταυ να ενημερώνουμε συνεχόμενα L2 SVMS σε ένα κατανεμημένο περιβάλλον όπου νέα δεδομένα φτάνουν συνεχώς σε απομακρυσμένους κόμβους. Προσεγγίζουμε το πρόβλημα ως παρακολούθηση του ελαχίστου μίας κυρτής συνάρτησης πάνω στην κυρτή θήκη της ένωσης πλήρως δυναμικών συνόλων, που κάθε ένα από τα οποία βρίσκεται σε έναν από τους κόμβους. Δίνουμε επικοινωνιακά αποτελεσματικές λύσεις για την ακριβή και την προσεγγιστική λύση του προβλήματος και δείχνουμε ότι είναι εφαρμόσημες στην περίπτωση που οι SVM με πυρήνα και εκπαιδεύονται σε έναν υπονοούμενο χώρο. Οι μέθοδοι μας, επικοινωνούν μόνο όταν είναι απαραίτητο, δηλαδή κάθε φορά που το μοντέλο είναι πραγματικά μη ενημερωμένο. Επίσης, στην περίπτωση που χρειάζεται να επικοινωνήσουν, προτείνουμε δυο αλγόριθμους, ένα επαναληπτικό και με ένα στάδιο επικοινωνίας.el
Type of ItemΔιπλωματική Εργασίαel
Type of ItemDiploma Worken
Licensehttp://creativecommons.org/licenses/by/4.0/en
Date of Item2016-08-30-
Date of Publication2016-
SubjectData miningen
SubjectComputational geometryen
SubjectDistributed algorithmsen
Bibliographic CitationPeriklis Chrysogelos, "Streaming, high performance support vector methods", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2016en
Bibliographic CitationΠερικλής Χρυσόγελος, "Υψηλής απόδοσης μέθοδοι διανυσμάτων υποστήριξης σε ροές δεδομένων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2016el

Available Files

Services

Statistics