Υπόβαθρο και στόχοι της μελέτης: Η μαγνητική τομογραφία (MRI) του εγκεφάλου μαζί με τα δεδομένα παθολογίας των ασθενών μπορούν να βοηθήσουν σε μεγάλο βαθμό τους ακτινολόγους και τους γιατρούς στην παροχή ακριβέστερης διάγνωσης και θεραπείας. Λόγω της απρόβλεπτης εμφάνισης και του σχήματος τους, η κατάτμηση των όγκων του εγκεφάλου από δεδομένα πολλαπλών τρόπων απεικόνισης είναι ένα από τα πιο δύσκολα καθήκοντα στην ανάλυση ιατρικής εικόνας. Η χειροκίνητη ανίχνευση και ταξινόμηση του όγκου του εγκεφάλου από έναν ειδικό θεωρείται ακόμη η πιο αποδεκτή μέθοδος, αλλά είναι πολύ χρονοβόρα, ειδικά λόγω του μεγάλου όγκου δεδομένων που πρέπει να αναλυθούν χειροκίνητα. Ο σκοπός της παρούσας μελέτης είναι να εκπαιδεύσει και να αξιολογήσει αλγόριθμους τεχνητής νοημοσύνης, δηλαδή μηχανική μάθηση (Machine Learning) όπως Support Vector Machine (SVM) και αλγόριθμους νευρωνικών δικτύων όπως αλγόριθμοι CNN, για να ταξινομήσει τις εικόνες μαγνητικής τομογραφίας εγκεφάλων μεταξύ υγιών και μη υγιών. Μέθοδοι: Το σύνολο των εικόνων που χρησιμοποιείται αναφέρονται σε ενήλικους, άντρες και γυναίκες, περιλαμβάνοντας 291 περιπτώσεις από τις οποίες 81 υγιείς και 210 που έχει παρατηρηθεί εγκεφαλικός όγκος. Όλες οι εικόνες έχουν εποπτευθεί οπτικά από τον νευροχειρούργο συνεργάτη μας Δρ. Κρασουδάκη. Οι υγιείς μαγνητικές τομογραφίες παρέχονται από το Γενικό Νοσοκομείο Χανίων «Άγιος Γεώργιος» και οι μη υγιείς παρέχονται από το Multimodal Image Segmentation Challenge (BRATS). Όλες οι εικόνες μαγνητικής τομογραφίας είναι τύπου Τ2, του αξονικού επιπέδου (T2 MRI). Το παραπάνω σύνολο δεδομένων χωρίζεται σε υποσύνολα. Το υποσύνολο που χρησιμοποιείται για την εκπαίδευση των αλγορίθμων αποτελείται από 191 μη υγιείς/66 υγιείς περιπτώσεις, και το υποσύνολο για την αξιολόγηση των αλγορίθμων αποτελείται από 19 μη υγιείς/15 υγιείς περιπτώσεις (56%/44%). Πολλά διαφορετικά σενάρια με διάφορες μεθοδολογίες αναπτύχθηκαν σε αυτην την εργασία. Το κάθε ένα περιέχει συνδυασμούς αλγορίθμων τεχνητής νοημοσύνης, χρησιμοποιώντας διάφορα είδη χαρακτηριστικών και διάφορα μεγέθη συνόλων δεδομένων σαν είσοδο, π.χ ισορροπημένα ή μη ισορροπημένα σύνολα (74% μη υγιής/26% υγιής περιπτώσεις). Επίσης αναπτύχθηκαν διάφορες τεχνικές εκπαίδευσης των αλγορίθμων. Μετρήσεις απόδοσης όπως η ακρίβεια και η ευαισθησία υπολογίζονται για την αξιολόγηση της αποτελεσματικότητας των μεθόδων που αναπτύξαμε. Στο υποσύνολο εκπαίδευσης των αλγορίθμων εφαρμόστηκε Standardization και 10-fold split για grid search χρησιμοποιώντας cross-validation. Το ισορροπημένο σύνολο δεδομένων περιέχει 66 υγιείς και 66 μη υγιής περιπτώσεις ενώ το μη ισορροπημένο σύνολο δεδομένων περιέχει 191 μη υγιείς και 66 υγιείς περιπτώσεις. Η εκπαίδευση των αλγορίθμων πραγματοποιήθηκε χρησιμοποιώντας τις gray scale τιμές των pixel ολόκληρων των εικόνωνς ως είσοδο, χρησιμοποιώντας επίσης τους συντελεστές του discrete wavelet transform τριών επιπέδων ολόκληρων των εικόνων και εναλακτικά χρησιμοποιώντας την τιμή wavelet entropy που υπολογίστηκε από τους συντελεστές του discrete wavelet transform τριών επιπέδων, ολόκληρης της εικόνας (και των τεταρτημορίων που διαιρείται η εικόνα). Σε όλες τις περιπτώσεις η εκπαίδευση των αλγορίθμων πραγματοποιήθηκε με ή χωρίς την εφαρμογή principal components analysis (προκειμένου να μειωθεί η διαστασημότητα των συντελεστών σε 15). Στην περίπτωση του ισορροπημένου συνόλου εφαρμόστηκε η τεχνική augmentation, προκειμένου να δημιουργηθεί ένα σύνολο δεδομένων με 400 υγιείς και 400 μη υγιείς περιπτώσεις για την εκπαίδευση του αλγορίθμου CNΝ. Αποτελέσματα: Ο αλγόριθμος που υλοποιήθηκε με βάση το CNN, εκπαιδεύτηκε από το ισορροπημένο σύνολο δεδομένων, χρησιμοποιώντας τους συντελεστές discrete wavelet transform ολόκληρων των εικόνων, είχε τα καλύτερα αποτελέσματα με τιμές: 100% Sensitivity, 97% Accuracy, 93% Specificity, 95% Precision, 0% FNR and 6% FPR. Ο αλγόριθμος που υλοποιήθηκε με βάση το SVM, εκπαιδεύτηκε από το ισορροπημένο σύνολο δεδομένων, χρησιμοποιώντας τις τιμές των pixel ολόκληρων των εικόνων ως είσοδο είχε τα επόμενα καλύτερα αποτελέσματα με τιμές: 100% Sensitivity, 91% Accuracy, 80% Specificity, 86% Precision, 0% FNR and 20% FPR. Και στους δύο αλγόριθμους, δεν εφαρμόζεται η τεχνική PCA. Επιπλέον, παρατηρείται ότι για το σενάριο όπου η εκπαίδευση υλοποιήθηκε χρησιμοποιώντας το μη ισορροπημένο σύνολο δεδομένων, τα χαρακτηριστικά που εξήχθησαν από τις εικόνες διαιρεμένες σε τέταρτα παρείχαν καλύτερα αποτελέσματα από αυτά που εξήχθησαν ολόκληρης της εικόνας.