Αντώνιος Κονταξάκης, "Ανάλυση δεδομένων σε ένα πέρασμα στο RapidMiner", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2017
https://doi.org/10.26233/heallink.tuc.69479
Στις μέρες μας δεδομένα παράγονται συνεχώς σε ασύλληπτους ρυθμούς και όλοκαι περισσότερες επιχειρήσεις και οργανισμοί προσπαθούν να χρησιμοποιήσουνόλα αυτά τα δεδομένα για να πάρουν κρίσιμες αποφάσεις. Η επεξεργασία καιανάλυση δεδομένων για την λήψη αποφάσεων έχει μετατραπεί από πολυτέλεια σεανάγκη. Η διαχείριση δεδομένων απαιτεί την χρήση πολύπλοκων αλγορίθμων τουςοποίους οι περισσότεροι άνθρωποι δεν μπορούν να υλοποιήσουν. Για αυτό έχουνδημιουργηθεί προγράμματα τα οποία προσφέρουν ένα φιλικό προς τον χρήστηπεριβάλλον για σχεδίαση αυτών περιπλοκών αλγοριθμικών διαδικασιών . Όμως ταπερισσότερα από αυτά είναι υλοποιημένα για να εκτελούν αυτούς τουςαλγόριθμους σε ένα υπολογιστή. Τι γίνεται όμως όταν ο όγκος των δεδομένων είναιπολύ μεγάλος και απαιτείται μεγαλύτερη υπολογιστική ισχύς. Σε αυτήν τηνπερίπτωση είναι αναγκαία η χρήση ενός συμπλέγματος από υπολογιστές.Σε αυτήν την εργασία, επιλέξαμε το RapidMiner, ένα σχεδιαστικό πρόγραμμα γιαδιαχείριση δεδομένων, ως use-case και το επεκτείναμε ώστε να έχει τηνδυνατότητα να εκτελούνται οι διαδικασίες του σε ένα σύμπλεγμα υπολογιστώνπου διαχειρίζεται από το Apache Spark.