H ανάλυση συστάδων (cluster analysis) είναι μια μέθοδος που έχει σαν σκοπό να κατατάξει σε ομάδες υπάρχουσες παρατηρήσεις χρησιμοποιώντας την πληροφορία που υπάρχει σε κάποιες μεταβλητές. Κοιτάζοντας δηλαδή τις παρατηρήσεις μπορεί να πει κανείς πόσο “όμοιες” είναι ως προς κάποιον αριθμό μεταβλητών, δημιουργώντας ομάδες (από παρατηρήσεις) που μοιάζουν μεταξύ τους. Μια επιτυχημένη ανάλυση θα πρέπει να καταλήξει σε ομάδες για τις οποίες οι παρατηρήσεις μέσα σε κάθε ομάδα θα είναι όσο γίνεται πιο ομοιογενείς αλλά παρατηρήσεις διαφορετικών ομάδων θα διαφέρουν όσο γίνεται περισσότερο. Η ομαδοποίηση γίνεται με τη βοήθεια της έννοιας της απόστασης ή της ομοιότητας Η ανάλυση συστάδων είναι σημαντική όχι μόνο σε επιστήμες όπως η κοινωνιολογία, η βιολογία και η στατιστική, αλλά και σε πολλούς τομείς της πληροφορικής όπως η αναγνώριση προτύπων, η εξόρυξη γνώσης, η ανάκτηση δεδομένων, η τεχνητή νοημοσύνη και η μηχανική μάθηση. Στo 1o κεφάλαιο της διπλωματικής εργασίας δίνεται μια εισαγωγή στην Ανάλυση Συστάδων (φιλοσοφία της Α.Σ., μέθοδοι, πλεονεκτήματα/μειονεκτήματα της Α.Σ. και τέλος προβλήματα εφαρμογής της). Στο 2ο κεφάλαιο περιγράφονται τα κυριότερα μέτρα απόστασης και ομοιότητας (ανάλογα με το είδος των μεταβλητών) που χρησιμοποιεί κανείς στην Α.Σ. και δίνονται αναλυτικά παραδείγματα. Στο 3ο κεφάλαιο αναφέρονται οι βασικές μέθοδοι σύνδεσης ομάδων και περιγράφονται οι ιεραρχικές μέθοδοι ταξινόμησης, με αναλυτικά παραδείγματα. Στο 4ο κεφάλαιο περιγράφεται η μέθοδος μη ιεραρχικής ταξινόμησης k-means. Τέλος, στο 5ο κεφάλαιο δίνεται μια εφαρμογή της Α.Σ. στην ταξινόμηση σταθμών μέτρησης ατμοσφαιρικής ρύπανσης στην περιοχή του Λεκανοπεδίου Αττικής.