Τα τελευταία χρόνια, η πρόοδος στην τεχνολογία υλικού διευκόλυνε τη δυνατότητα συνεχούς συλλογής δεδομένων. Οι απλές συναλλαγές της καθημερινής ζωής, όπως η χρήση πιστωτικής κάρτας, τηλεφώνου ή η περιήγηση στον Ιστό, οδηγούν σε αυτοματοποιημένη αποθήκευση δεδομένων. Ομοίως, οι εξελίξεις στην τεχνολογία των πληροφοριών έχουν οδηγήσει στη δημιουργία μεγάλων ροών δεδομένων σε δίκτυα IP. Σε πολλές περιπτώσεις, αυτοί οι μεγάλοι όγκοι δεδομένων μπορούν να εξαχθούν για ενδιαφέρουσες πληροφορίες σε μια μεγάλη ποικιλία εφαρμογών. Ο τεράστιος όγκος των υποκείμενων δεδομένων οδηγεί σε μια σειρά υπολογιστικών προκλήσεων καθώς και προκλήσεων που αφορούν την εξαγωγή των δεδομένων αυτών. Η δειγματοληψία μαζικών δεδομένων ασχολείται με προβλήματα μαζικών δεδομένων (massive data) όπου τα δεδομένα εισόδου (ένας γράφος, μια μήτρα ή κάποιο άλλο αντικείμενο) είναι πολύ μεγάλα για να αποθηκευτούν στη μνήμη τυχαίας προσπέλασης. Ένα μοντέλο για τέτοια προβλήματα είναι το μοντέλο ροής (streaming model), όπου τα δεδομένα είναι ορατά μόνο μία φορά. Στο μοντέλο ροής, η φυσική τεχνική αντιμετώπισης των μαζικών δεδομένων είναι η δειγματοληψία. Στην παρούσα εργασία μελετώνται βιβλιογραφικά μια σειρά αλγορίθμων που σχετίζονται με προβλήματα διαχείρισης μαζικών δεδομένων σε ροές, όπως η δειγματοληψία, η εξαγωγή, η ταξινόμηση και η επεξεργασία, εστιάζοντας στη δειγματοληψία Streaming Sketching.