Ιδρυματικό Αποθετήριο [SANDBOX]
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Ανάλυση χρονοσειρών με μεθοδολογίες μηχανικής μάθησης

Paraskakis Nikolaos

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/9ACB7095-6536-4C36-BDC0-538E8F77DF88
Έτος 2023
Τύπος Διπλωματική Εργασία
Άδεια Χρήσης
Λεπτομέρειες
Βιβλιογραφική Αναφορά Νικόλαος Παρασκάκης, "Ανάλυση χρονοσειρών με μεθοδολογίες μηχανικής μάθησης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2023 https://doi.org/10.26233/heallink.tuc.97531
Εμφανίζεται στις Συλλογές

Περίληψη

Αυτή η διπλωματική εργασία διερευνά την εφαρμογή των τεχνικών μηχανικής μάθησης στην ανάλυση χρονοσειρών, εστιάζοντας στο σύνολο δεδομένων του ετήσιου αριθμού των ηλιακών κηλίδων. Η εισαγωγή ξεκινά με μια παρουσίαση θεμελιωδών εννοιών στην ανάλυση χρονοσειρών, που περιλαμβάνει στοχαστικές διαδικασίες, συσχέτιση, στασιμότητα, ετεροσκεδαστικότητα, και μεθόδους αποσύνθεσης χρονοσειρών. Στη συνέχεια, η διατριβή εμβαθύνει σε κρίσιμες πτυχές της πρόβλεψης χρονοσειρών, συμπεριλαμβανομένου του διαχωρισμού δεδομένων, της διασταυρωτικής επικύρωσης, των μετρικών αξιολόγησης, και διαφόρων στρατηγικών πρόβλεψης, δίνοντας έμφαση τόσο στην πρόβλεψη ενός βήματος όσο και στην πρόβλεψη πολλαπλών βημάτων.Βασικό μέρος αυτής της έρευνας αποτελεί η εξέταση των μη γραμμικών μετασχηματισμών στα δεδομένα και ο ρόλος τους στη βελτίωση της προγνωστικής απόδοσης του μοντέλου, επιτυγχάνοντας επιθυμητές ιδιότητες του μετασχηματισμένου συνόλου δεδομένων, όπως είναι η κανονικότητα και η στασιμότητα. Η μελέτη διερευνά, επίσης, τις προηγμένες μεθόδους μηχανικής μάθησης των Γκαουσιανών Διαδικασιών (GPs), Δέντρων Απόφασης Ενίσχυσης Κλίσης (GBDT) και Νευρωνικών Δικτύων Μακράς Βραχύχρονης Μνήμης (LSTM) στο πλαίσιο της πρόβλεψης χρονοσειρών. Παρουσιάζεται μια συγκριτική ανάλυση που εξετάζει τα δυνατά και τα αδύναμα σημεία καθεμιάς από αυτές τις μεθόδους.Αυτή η διατριβή περιέχει μια μελέτη περίπτωσης που περιλαμβάνει την ανάλυση και πρόβλεψη του ετήσιου αριθμού ηλιακών κηλίδων. Πρώτον, εκμεταλλευόμαστε τις GPs, οι οποίες αποτελούν ένα πιθανοκρατικό μη παραμετρικό πλαίσιο παλινδρόμησης. Χρησιμοποιούμε μια σταθερή συνάρτηση μέσης τιμής και έναν εκθετικό πολλαπλασιαζόμενο με έναν περιοδικό πυρήνα συνδιακύμανσης, ενώ υποθέτουμε ανεξάρτητο και πανομοιότυπα κατανεμημένο Γκαουσιανό θόρυβο και Γκαουσιανή πιθανοφάνεια των δεδομένων. Για να συμβαδίζουμε με αυτές τις υποθέσεις, εφαρμόζουμε τον κάπα-λογαριθμικό μετασχηματισμό (Κανιαδάκης Γ., 2009), που διορθώνει την ασυμμετρία, την ετεροσκεδαστικότητα και λαμβάνει υπόψη του τη μη αρνητικότητα των δεδομένων των ηλιακών κηλίδων. Στη συνέχεια, εκπαιδεύουμε το μοντέλο στα μετασχηματισμένα δεδομένα και βελτιστοποιούμε τις υπερπαραμέτρους του χρησιμοποιώντας την εκτίμηση μέγιστης πιθανοφάνειας (MLE). Στη συνέχεια, χρησιμοποιούμε τον αλγόριθμο του LightGBM, ο οποίος αποτελεί ένα πλαίσιο δέντρων παλινδρόμησης ενίσχυσης κλίσης, που είναι γνωστό για την αποδοτικότητα και την ακρίβειά του. Η προσαρμογή των υπερπαραμέτρων πραγματοποιείται με χρήση Μπαϋεσιανής βελτιστοποίησης με στόχο την ελαχιστοποίηση του σφάλματος επικύρωσης. Τέλος, αξιοποιούμε ένα μοντέλο LSTM με πολλαπλά στρώματα ικανά να προβλέψουν τον ετήσιο αριθμό των ηλιακών κηλίδων και επιλέγουμε τις υπερπαραμέτρους του χρησιμοποιώντας την αναζήτηση πλέγματος με στόχο την ελαχιστοποίηση του σφάλματος επικύρωσης. Το LSTM είναι μια ειδική μορφή αναδρομικού νευρωνικού δικτύου (RNN), το οποίο περιλαμβάνει μια αρχιτεκτονική βαθιάς μάθησης, ικανή να συλλαμβάνει μακροχρόνιες εξαρτήσεις και πολύπλοκα μοτίβα. Αποτελείται από τέσσερις πύλες (input, forget, candidate και output) υπεύθυνες για τη ροή της πληροφορίας.Η παλινδρόμηση χρησιμοποιώντας GPs υπερέχει στην ερμηνευσιμότητα, παρέχει εκτιμήσεις αβεβαιότητας παράλληλα με τις σημειακές εκτιμήσεις, και μπορεί να καταγράψει πολύπλοκα μοτίβα χρησιμοποιώντας διαφορετικούς πυρήνες συνδιακύμανσης. Ωστόσο, απαιτεί την υπολογιστικά έντονη αντιστροφή μεγάλων πινάκων συνδιακύμανσης (μεγάλο σύνολο δεδομένων). Το LSTM αποδίδει καλά στην καταγραφή μακροχρόνιων εξαρτήσεων, αλλά χρειάζεται μεγάλο όγκο δεδομένων, χρόνου και πόρων για την προσαρμογή των παραμέτρων και την εκπαίδευση, ενώ επίσης υποφέρει από συσσώρευση σφαλμάτων σε μακροπρόθεσμες προβλέψεις. Το LightGBM μπορεί επίσης να καταγράψει πολύπλοκα μοτίβα και είναι πιο αποδοτικό υπολογιστικά, καθιστώντας την εκπαίδευσή του ταχύτερη.Συμπερασματικά, αυτή η διατριβή παρέχει πληροφορίες για την απόδοση και τα χαρακτηριστικά τριών ισχυρών μεθόδων μηχανικής μάθησης, οι οποίες παράγουν ανταγωνιστικές προβλέψεις για τον ετήσιο αριθμό των ηλιακών κηλίδων. Τα ευρήματά μας συλλογικά σηματοδοτούν ένα σημαντικό βήμα στην εφαρμογή προηγμένων τεχνικών μηχανικής μάθησης με σκοπό την πρόβλεψη και την ανάλυση δεδομένων χρονοσειρών σε διάφορους κλάδους.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά