Ιωάννης Λάμπρου, "White-Basilisk: Ένα υβριδικό μοντέλο για την ανίχνευση ευπαθειών κώδικα ", Μεταπτυχιακή Διατριβή, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025
https://doi.org/10.26233/heallink.tuc.104535
Η διάδοση των ευπαθειών λογισμικού αποτελεί σημαντική πρόκληση για την κυβερνοασφάλεια, καθιστώντας αναγκαία την ανάπτυξη αποτελεσματικότερων μεθοδολογιών ανίχνευσης. Παρουσιάζουμε το White-Basilisk, μια καινοτόμο προσέγγιση στην ανίχνευση ευπαθειών που επιδεικνύει ανώτερη απόδοση, αμφισβητώντας παράλληλα τις επικρατούσες υποθέσεις στην κλιμάκωση μοντέλων AI. Χρησιμοποιώντας μια καινοτόμο αρχιτεκτονική που ενσωματώνει Mamba layers, linear self-attention, και ένα πλαίσιο Mixture of Experts, το White-Basilisk επιτυγχάνει κορυφαία αποτελέσματα σε εργασίες ανίχνευσης ευπαθειών με μόλις 200M παραμέτρους. Η ικανότητα του μοντέλου να επεξεργάζεται ακολουθίες πρωτοφανούς μήκους επιτρέπει την ολοκληρωμένη ανάλυση εκτεταμένων βάσεων κώδικα σε ένα πέρασμα, ξεπερνώντας τους περιορισμούς πλαισίου των τρεχόντων Large Language Models (LLMs). Το White-Basilisk επιδεικνύει ισχυρή απόδοση σε μη ισορροπημένα σύνολα δεδομένων του πραγματικού κόσμου, διατηρώντας παράλληλα υπολογιστική αποδοτικότητα που διευκολύνει την ανάπτυξη σε διάφορες οργανωτικές κλίμακες. Αυτή η έρευνα όχι μόνο θέτει νέα σημεία αναφοράς στην ασφάλεια κώδικα, αλλά παρέχει επίσης εμπειρικά στοιχεία ότι τα συμπαγή, αποδοτικά σχεδιασμένα μοντέλα μπορούν να ξεπεράσουν μεγαλύτερα αντίστοιχά τους σε εξειδικευμένες εργασίες, επαναπροσδιορίζοντας πιθανώς τις στρατηγικές βελτιστοποίησης στην ανάπτυξη AI για εφαρμογές συγκεκριμένου τομέα.