Το έργο με τίτλο Τεχνικές μάθησης σε βάθος για ανίχνευση διασταυρώσεων σε δορυφορικές εικόνες από τον/τους δημιουργό/ούς Papadopoulos Theodoros διατίθεται με την άδεια Creative Commons Αναφορά Δημιουργού 4.0 Διεθνές
Βιβλιογραφική Αναφορά
Θεόδωρος Παπαδόπουλος, "Τεχνικές μάθησης σε βάθος για ανίχνευση διασταυρώσεων σε δορυφορικές εικόνες", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2018
https://doi.org/10.26233/heallink.tuc.71011
Απώτερος στόχος της μηχανικής μάθησης, αλλά και της τεχνητής νοημοσύνης γενικότερα, ήταν πάντα η προσπάθεια να δημιουργηθούν έξυπνα μηχανήματα, που μιμούνται τον τρόπο με τον οποίο σκέφτεται ο ανθρώπινος εγκέφαλος. Τα βαθιά νευρωνικά δίκτυα είναι ένα πολλά υποσχόμενο βήμα προς αυτή την κατεύθυνση. Το μειονέκτημά τους είναι ότι απαιτούν τεράστια υπολογιστική ισχύ, αλλά και ένα γιγαντιαίο όγκο δεδομένων για να εκπαιδευτούν σωστά και να αξιοποιήσουν στο έπακρο το τεράστιο δυναμικό τους. Στην παρούσα διπλωματική εργασία μελετάμε την εφαρμογή μεθόδων μάθησης σε βάθος στην ανάλυση δορυφορικών εικόνων με σκοπό την αυτόματη ανίχνευση διασταυρώσεων σε οδικά δίκτυα. Για να ξεπεραστεί το πρόβλημα της εκπαίδευσης, αποφασίσαμε να χρησιμοποιήσουμε μια τεχνική που ονομάζεται Transfer Learning (Μεταφορά της Μάθησης). Για να εφαρμοστεί η τεχνική αυτή, παίρνουμε ένα ήδη εκπαιδευμένο δίκτυο, εξάγουμε την ήδη αποκτηθείσα γνώση (τα βάρη των νευρώνων του δικτύου) και επανεκπαιδεύουμε τα τελευταία επίπεδα του δικτύου με τα δικά μας δεδομένα. Έπειτα μελετάμε τεχνικές ανίχνευσης αντικειμένων σε δορυφορικές εικόνες, αποβλέποντας στην πιθανή εφαρμογή τους σε πολλές δραστηριότητες, όπως αποστολές έρευνας και διάσωσης, πολεοδομικού σχεδιασμού, διαχείρισης καλλιεργειών και δασών, πρόβλεψης καιρού, ανακούφισης πληγέντων από καταστροφές, κλιματικές αλλαγές και πολλά αλλά. Αποφασίσαμε να εστιάσουμε σε ένα μόνο είδος αντικειμένου, τις διασταυρώσεις, επειδή από πλευράς αναγνώρισης παρουσιάζουν μεγάλο ενδιαφέρον, λόγω της ποικιλομορφίας τους ως προς το σχήμα και το χρώμα, όπως και το γεγονός ότι η ορατότητά τους μπορεί να είναι περιορισμένη εξαιτίας δέντρων, κτιρίων, κλπ. Κατασκευάσαμε το σύνολο των δεδομένων εκπαίδευσης χρησιμοποιώντας το Google Maps για την λήψη εικόνων εισόδου και το OpenStreetMaps για να εντοπίσουμε τις ακριβείς συντεταγμένες πραγματικών διασταυρώσεων (ground truth) που μας ενδιαφέρουν. Στη συνέχεια επανεκπαιδεύσαμε ένα δίκτυο κάνοντας χρήση του πακέτου Tensorflow Object Detection. Το τελικό αποτέλεσμα αποδίδει αρκετά καλά σε μια μεγάλη ποικιλία δορυφορικών εικόνων από διάφορες πόλεις σε όλο τον κόσμο. Τέλος, δημιουργήσαμε μια φιλική προς το χρήστη διαδικτυακή εφαρμογή, για να προσφέρουμε μια πλατφόρμα, όπου ακόμα και αρχάριοι χρήστες μπορούν να πλοηγηθούν σε οποιαδήποτε επιθυμητή περιοχή στους χάρτες της Google, να πραγματοποιήσουν αναγνώριση διασταυρώσεων κάνοντας χρήση του ανιχνευτή μας, και να δουν τα αποτελέσματα πάνω στην εικόνα που επέλεξαν ως είσοδο. Η δουλειά μας μπορεί εύκολα να ενσωματωθεί σε άλλες εφαρμογές, αλλά πιο σημαντικό είναι το γεγονός ότι παρέχει τις κατευθυντήριες γραμμές για την κατασκευή ανιχνευτών για οποιοδήποτε άλλο αντικείμενο ενδιαφέροντος σε δορυφορικές εικόνες.