Το έργο με τίτλο Κατανεμημένο σύστημα ανίχνευσης εισβολών δικτύου σε πραγματικό χρόνο στo Apache Spark από τον/τους δημιουργό/ούς Kalosynakis Minas-Diomfeas διατίθεται με την άδεια Creative Commons Αναφορά Δημιουργού 4.0 Διεθνές
Βιβλιογραφική Αναφορά
Μηνάς-Διωμφέας Καλωσυνάκης, "Κατανεμημένο σύστημα ανίχνευσης εισβολών δικτύου σε πραγματικό χρόνο στo Apache Spark", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2021
https://doi.org/10.26233/heallink.tuc.90442
Τα τελευταία χρόνια, η ταχεία αύξηση των υπηρεσιών που βασίζονται στο διαδίκτυο επιφέρει σημαντικές ανησυχίες για την ασφάλεια των πληροφοριών. Μεγάλες ποσότητες δεδομένων κίνησης στο δίκτυο δημιουργούνται σε καθημερινή βαση με υψηλή ταχύτητα ενώ παράλληλα οι απειλές για την ασφάλεια των πληροφοριών γίνονται όλο και πιο περίπλοκες. Ο γρήγορος και αποτελεσματικός εντοπισμός παρεμβατικών δραστηριοτήτων υπό αυτές τις συνθήκες είναι ένα δύσκολο έργο. Για την αντιμετώπιση αυτού του ζητήματος, προτείνουμε ένα κατανεμημένο σύστημα ανίχνευσης εισβολών που χρησιμοποιεί ταξινομητές μηχανικής μάθησης για να αναγνώρισει κακόβουλες δραστηριότητες στο δίκτυο σε πραγμαγματικό χρόνο. Συγκεκριμένα, χρησιμοποιούμε τον αλγόριθμο Chi-Squared για να επιλέξουμε σημαντικά χαρακτηριστικά των δεδομένων εισόδου, βάσει των οποίων εκπαιδεύουμε μοντέλα ταξινόμησης Decision Tree, Random Forest και Extreme Gradient Boosting στην πλατφόρμα επεξεργασίας μεγάλων δεδομένων Apache Spark. Το ανεπτυγμένο σύστημα υποστηρίζει ικανότητα επεκτασιμότητας σε όλα τα μέρη του και παρέχει μία φιλική προς το χρήστη γραφική διεπαφή που απεικονίζει τη δραστηριότητα του δικτύου. Πειραματικά αποτελέσματα απέναντι στο σύνολο δεδομένων NSL-KDD αποδεικνύουν ότι το σύστημα μπορεί να εκτελέσει δυαδική ταξινόμηση με περιοχή κάτω από την καμπύλη ROC 97% χρησιμοποιώντας το μοντέλο μηχανικής μάθησης Random Forest.