Institutional Repository [SANDBOX]
Technical University of Crete
EN  |  EL

Search

Browse

My Space

Malware detection using machine learning: a double input architecture

Bellonias Panagiotis

Simple record


URIhttp://purl.tuc.gr/dl/dias/EAA789D2-8A85-490D-B404-083B60FDFBB6-
Identifierhttps://doi.org/10.26233/heallink.tuc.86343-
Languageen-
Extent3.8 megabytesen
Extent57 σελίδεςel
TitleMalware detection using machine learning: a double input architectureen
TitleΑνίχνευση κακόβουλου λογισμικού μέσω μηχανικής μάθησης: αρχιτεκτονική διπλής εισόδουel
CreatorBellonias Panagiotisen
CreatorΜπελλωνιας Παναγιωτηςel
Contributor [Thesis Supervisor]Bletsas Aggelosen
Contributor [Thesis Supervisor]Μπλετσας Αγγελοςel
Contributor [Committee Member]Lagoudakis Michailen
Contributor [Committee Member]Λαγουδακης Μιχαηλel
Contributor [Committee Member]Κάτος, Βασίλειος Ανen
PublisherΠολυτεχνείο Κρήτηςel
PublisherTechnical University of Creteen
Academic UnitTechnical University of Crete::School of Electrical and Computer Engineeringen
Academic UnitΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
Content SummaryThis dissertation evaluates the effectiveness of a double input architecture of a machine learning model on malware detection. The model developed is compared to two different neural network architectures to highlight its effectiveness. The first one uses an image representation of the executable file as an input and the second one utilizes only features from the headers of the file. The implemented neural network, using both inputs, outperformed its contestants with an area under receiver operating characteristic (ROC) curve (AUC) equal to 0.989. Furthermore, state-of-the-art antivirus products were compared to the proposed architecture, even though the latter was trained with a relatively limited dataset. The proposed neural network of this work was placed third with a True Positive Rate of 0.972. Complete sources are provided for reproducing the proposed model and the derived results. The importance of large dataset availability in such domains should not be overlooked.en
Content SummaryΑυτή η εργασία αξιολογεί την αποδοτικότητα ενός μοντέλου μηχανικής μάθησης με διπλή είσοδο για τον εντοπισμό κακόβουλου λογισμικού. Το μοντέλο που υλοποιήθηκε συγκρίνεται με άλλες δύο αρχιτεκτονικές νευρωνικών δικτύων για να εκτιμηθεί η αποτελεσματικότητά του. Το πρώτο νευρωνικό χρησιμοποιεί το εκτελέσιμο αρχείο σε μορφή εικόνας σαν είσοδο ενώ το δεύτερο εκμεταλλεύεται χαρακτηριστικά από τις κεφαλίδες του δείγματος. Το προτεινόμενο νευρωνικό δίκτυο, χρησιμοποιώντας και τις δύο μορφές πληροφορίας σαν είσοδο, έφερε καλύτερα αποτελέσματα σε σχέση με τα υπόλοιπα σημειώνοντας εμβαδό κάτω από την καμπύλη ίσο με 0.989. Επιπλέον, έγιναν πειράματα σύγκρισης της αρχιτεκτονικής με σύγχρονες εμπορικές λύσεις για τον εντοπισμό κακόβουλου λογισμικού, παρόλο που η εκπαίδευση έγινε με σχετικά περιορισμένα δεδομένα. Το προτεινόμενο νευρωνικό δίκτυο της εργασίας σημείωσε το τρίτο καλύτερο ποσοστό αληθώς θετικών δειγμάτων ίσο με 0.972. Με τη διπλωματική περιλαμβάνονται όλα τα εργαλεία και δεδομένα που απαιτούνται για την αναπαραγωγή του προτεινόμενου μοντέλου αλλά και των παραγόμενων αποτελεσμάτων. Η σημασία της διαθεσιμότητας των δεδομένων δεν μπορεί να αμεληθεί.el
Type of ItemΔιπλωματική Εργασίαel
Type of ItemDiploma Worken
Licensehttp://creativecommons.org/licenses/by-nc/4.0/en
Date of Item2020-07-29-
Date of Publication2020-
SubjectΚακόβουλο Λογισμικόel
SubjectΚυβερνοασφάλειαel
SubjectΜηχανική μάθησηel
SubjectMachine learningen
SubjectCyber securityen
SubjectMalwareen
Bibliographic CitationPanagiotis Bellonias, "Malware detection using machine learning: a double input architecture", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2020en
Bibliographic CitationΠαναγιώτης Μπελλώνιας, "Ανίχνευση κακόβουλου λογισμικού μέσω μηχανικής μάθησης: αρχιτεκτονική διπλής εισόδου", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2020el

Available Files

Services

Statistics