Ιδρυματικό Αποθετήριο [SANDBOX]
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Κατανεμημένο σύστημα ανίχνευσης εισβολών δικτύου σε πραγματικό χρόνο στo Apache Spark

Kalosynakis Minas-Diomfeas

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/E8666D35-46BE-4E3D-8B7C-BE8D7D1CD6F8
Έτος 2021
Τύπος Διπλωματική Εργασία
Άδεια Χρήσης
Λεπτομέρειες
Βιβλιογραφική Αναφορά Μηνάς-Διωμφέας Καλωσυνάκης, "Κατανεμημένο σύστημα ανίχνευσης εισβολών δικτύου σε πραγματικό χρόνο στo Apache Spark", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2021 https://doi.org/10.26233/heallink.tuc.90442
Εμφανίζεται στις Συλλογές

Περίληψη

Τα τελευταία χρόνια, η ταχεία αύξηση των υπηρεσιών που βασίζονται στο διαδίκτυο επιφέρει σημαντικές ανησυχίες για την ασφάλεια των πληροφοριών. Μεγάλες ποσότητες δεδομένων κίνησης στο δίκτυο δημιουργούνται σε καθημερινή βαση με υψηλή ταχύτητα ενώ παράλληλα οι απειλές για την ασφάλεια των πληροφοριών γίνονται όλο και πιο περίπλοκες. Ο γρήγορος και αποτελεσματικός εντοπισμός παρεμβατικών δραστηριοτήτων υπό αυτές τις συνθήκες είναι ένα δύσκολο έργο. Για την αντιμετώπιση αυτού του ζητήματος, προτείνουμε ένα κατανεμημένο σύστημα ανίχνευσης εισβολών που χρησιμοποιεί ταξινομητές μηχανικής μάθησης για να αναγνώρισει κακόβουλες δραστηριότητες στο δίκτυο σε πραγμαγματικό χρόνο. Συγκεκριμένα, χρησιμοποιούμε τον αλγόριθμο Chi-Squared για να επιλέξουμε σημαντικά χαρακτηριστικά των δεδομένων εισόδου, βάσει των οποίων εκπαιδεύουμε μοντέλα ταξινόμησης Decision Tree, Random Forest και Extreme Gradient Boosting στην πλατφόρμα επεξεργασίας μεγάλων δεδομένων Apache Spark. Το ανεπτυγμένο σύστημα υποστηρίζει ικανότητα επεκτασιμότητας σε όλα τα μέρη του και παρέχει μία φιλική προς το χρήστη γραφική διεπαφή που απεικονίζει τη δραστηριότητα του δικτύου. Πειραματικά αποτελέσματα απέναντι στο σύνολο δεδομένων NSL-KDD αποδεικνύουν ότι το σύστημα μπορεί να εκτελέσει δυαδική ταξινόμηση με περιοχή κάτω από την καμπύλη ROC 97% χρησιμοποιώντας το μοντέλο μηχανικής μάθησης Random Forest.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά