Στον αιώνα που διανύουμε τα δεδομένα αντιστοιχούν σε πηγή πλούτου. Ο λόγος που αυτό συμβαίνει, είναι η ραγδαία εξέλιξη της τεχνολογίας και ειδικότερα του διαδικτύου. Τα τελευταία χρόνια λόγω της εξάπλωσης της ασθένειας Covid-19, όλο και περισσότεροι χρησιμοποίησαν το διαδίκτυο για αγορές, ακόμα και βασικών ειδών πρώτης ανάγκης, κατά την διάρκεια των lockdown που επιβλήθηκαν παγκοσμίως. Καθεμία συναλλαγή εμπεριέχει δεδομένα για το πρόσωπο που την έκανε, όπως π.χ. φύλο, ηλικία, μέρος καθώς και τα προϊόντα της ίδιας της αγοράς του. Ωστόσο, αυτά τα δεδομένα δεν μπορούν να αξιοποιηθούν αυτούσια χωρίς επεξεργασία. Η επιστήμη της ανάλυσης δεδομένων επικεντρώνεται σε αυτό ακριβώς. Στο πώς, δηλαδή, θα μετατρέψει τα δεδομένα σε πληροφορία αξιοποιώντας τις δυνατότητες της στατιστικής, της εξόρυξης δεδομένων, της πολυκριτήριας ανάλυσης αποφάσεων, της οπτικοποίησης των αποτελεσμάτων, προκειμένου να βοηθηθούν οι εταιρίες να καταφέρουν να μελετήσουν τον ανταγωνισμό, να διαμορφώσουν τις πολιτικές μάρκετινγκ τους, να αυξήσουν τις πωλήσεις τους μέσω πιο στοχευμένων διαφημίσεων, βελτιστοποίησης των ήδη υπάρχοντων προϊόντων ή μέσω δημιουργίας νέων προϊόντων που θα καλύψουν κάποιο κενό στην αγορά. Στόχος της εργασίας αυτής είναι η ανάλυση συμπεριφοράς καταναλωτών μέσω μεθόδων μηχανικής μάθησης και πολυκριτήριας ανάλυσης. Για την συλλογή δεδομένων θα χρησιμοποιηθούν ερωτηματολόγια που θα συμπληρωθούν από καταναλωτές super markets στην περιοχή των Χανίων. Τα δεδομένα θα συλλεχθούν με ερωτηματολόγια που θα διανεμηθούν σε καταναλωτές δια ζώσης και από τα μέσα κοινωνικής δικτύωσης. Για την επεξεργασία των δεδομένων θα χρησιμοποιηθούν αλγόριθμοι συσταδοποίησης όπως ο k-Means, καθώς και μέθοδοι ανάλυσης συσχετίσεων για τη διενέργεια Market Basket Analysis. Το Market Basket Analysis είναι μέθοδος εξόρυξης δεδομένων και χρησιμοποιείται ώστε να ευρεθούν μοτίβα και συσχετίσεις με τα οποία οι καταναλωτές αγοράζουν. Το μοτίβο μπορεί να αναλυθεί χρησιμοποιώντας το ιστορικό αγορών των καταναλωτών ή την ομαδοποίηση των προϊόντων που συνήθως αγοράζονται μαζί. Γι’ αυτό το λόγο, χρησιμοποιούνται αλγόριθμοι συσχέτισης, όπως ο FP Growth. Θα χρησιμοποιηθούν επίσης αλγόριθμοι πολυκριτήριας ανάλυσης, όπως η Utastar για την ανάλυση συμπεριφοράς καταναλωτών με στόχο την μελέτη του ανταγωνισμού.