Institutional Repository [SANDBOX]
Technical University of Crete
EN  |  EL

Search

Browse

My Space

Processing Twitter data regarding drug side effects on the Storm distributed system

Tzimas Dimitrios

Full record


URI: http://purl.tuc.gr/dl/dias/24B7029F-4418-435F-BEBA-7B37DBE46E43
Year 2016
Type of Item Diploma Work
License
Details
Bibliographic Citation Dimitrios Tzimas, "Processing Twitter data regarding drug side effects on the Storm distributed system", Diploma Work, School of Electronic and Computer Engineering, Technical University of Crete, Chania, Greece, 2016 https://doi.org/10.26233/heallink.tuc.63911
Appears in Collections

Summary

Τα τελευταία χρόνια τα Social Media έχουν γίνει αναπόσπαστο κομμάτι της καθημερινότητας των ανθρώπων σε παγκόσμιο επίπεδο. Καθημερινά, όλο και περισσότεροι χρήστες αξιοποιούν τις πλατφόρμες αυτές για να εκφράσουν την άποψη τους για οτιδήποτε επιθυμούν. Αυτό έχει ως αποτέλεσμα να έχει δημιουργηθεί ένας τεράστιος όγκος πληροφορίας στο internet όπου είναι διαθέσιμος για επεξεργασία. Από τις διάφορες Πλατφόρμες Κοινωνικής Δικτύωσης που υπάρχουν, το Twitter αποτελεί μία από τις περισσότερο διαδεδομένες. Λόγω του γρήγορου και άμεσου χαρακτήρα της επικοινωνίας που προσφέρει, οι χρήστες του σχολιάζουν μέσω αυτού όλες τις κοινωνικές δραστηριότητες που συμβαίνουν. Μέσω της επεξεργασίας των δεδομένων που παράγονται στο Twitter, μπορούμε να καταγράψουμε τις αντιδράσεις των χρηστών για οτιδήποτε γεγονός συμβαίνει σε παγκόσμια κλίμακα. Σε αυτήν την Διπλωματική Εργασία υλοποιείται μία εφαρμογή όπου παρακολουθεί και επεξεργάζεται δεδομένα από το Twitter σε πραγματικό χρόνο. Πιο συγκεκριμένα, συλλέγουμε δεδομένα που αφορούνε αντιδράσεις των χρηστών σε σχέση με Παρενέργειες που δημιουργούνται από την χρήση Φαρμάκων. Στη συνέχεια τα δεδομένα αυτά κατηγοριοποιούνται ανάλογα με τη γνώμη που εκφράζουν(θετική, αρνητική ή ουδέτερη). Τέλος, αποθηκεύουμε όλες τις χρήσιμες πληροφορίες σε μία Βάση Δεδομένων ώστε να μπορούμε να τα έχουμε διαθέσιμα για επιπλέον επεξεργασία. Για να μπορέσουμε να κάνουμε την επεξεργασία σε πραγματικό χρόνο και να μπορούμε στο μέλλον να την επεκτείνουμε, χρησιμοποιήσαμε το κατανεμημένο σύστημα Storm. Στην τοπολογία που τρέχει στο Storm, κάναμε χρήση διαφόρων εργαλείων όπως το Twitter API, το Lingpipe καθώς και ένα Interface για να βλέπουμε τα περιεχόμενα στη Βάση Δεδομένων. Από τα δεδομένα που αποθηκεύσαμε προέκυψαν κάποια πρώτα συμπεράσματα τα οποία και παραθέτουμε.

Available Files

Services

Statistics