Η σύγχρονη εποχή χαρακτηρίζεται και ως εποχή των Μεγάλων Δεδομένων (Big Data), λόγω της πρωτοφανούς κλίμακας δεδομένων που παράγονται σε καθημερινή βάση και της ανάγκης ανάλυσης και εξαγωγής χρήσιμων αποτελεσμάτων σε μια πληθώρα διάφορων τομέων. Επιτακτική είναι η ανάγκη για την παρακολούθηση χιλιάδων ροών δεδομένων προκειμένου να ληφθούν αποφάσεις. Στον χρηματιστηριακό τομέα, ένας επενδυτής επιθυμεί να εντοπίσει τις εν δυνάμει ευκαιρίες, γεγονός που προσδίδει μεγάλη σημασία στην ενασχόληση με αυτό τον τομέα, καθώς η ορθή και αποδοτική επεξεργασία χρηματιστηριακών δεδομένων καθίσταται καθοριστική για την οικονομική ευημερία μιας χώρας. Στην περίπτωση του χρηματιστηριακού τομέα, οι ροές δεδομένων-μετοχές είναι συνεχείς και μακροσκελείς. Η παρούσα διπλωματική εργασία επεξεργάζεται κατανεμημένα και παράλληλα χιλιάδες χρηματιστηριακές μετοχές, μέσω της εύρεσης υψηλών συσχετίσεων που αφορούν σύνολα δύο μετοχών. Η διαδικασία αυτή πραγματοποιείται σε πραγματικό χρόνο και στοχεύει στην εύρεση μετοχών, των k πιο όμοιων, οι οποίες είναι ζωτικής σημασίας για την πρόβλεψη άλλων, οι οποίες δίδονται ως είσοδος, προκειμένου να προβλεφθούν. Αναπόφευκτη και ουσιαστική είναι η ανάγκη για την εκτέλεση της προσέγγισης σε εύλογα χρονικά πλαίσια, στα οποία αποδίδονται οι επιθυμητές απαντήσεις με την ταυτόχρονη αύξηση του πλήθους των δεδομένων στην είσοδο.Το ζητούμενο ικανοποιείται (α) με την υλοποίηση και τη διαχείριση μιας σύνοψης στο σύστημα Synopsis Data Engine (SDE) (β) την εφαρμογή του αλγορίθμου Discrete Fourier Transform (DFT) που αποσκοπεί στη μείωση του απαιτούμενου αριθμού υποψήφιων όμοιων μετοχών (γ) την εφαρμογή του Multiple Linear Regression (MLR) μοντέλου για την πρόβλεψη των μετοχών. Για την εξαγωγή της πειραματικής διαδικασίας, ο αλγόριθμος ελέγχεται τόσο τοπικά όσο και απομακρυσμένα, πετυχαίνοντας ικανοποιητικά αποτελέσματα.