URI | http://purl.tuc.gr/dl/dias/CD32B0A5-46BF-4DE9-8855-CBD48F8B53CC | - |
Αναγνωριστικό | https://doi.org/10.26233/heallink.tuc.101219 | - |
Γλώσσα | en | - |
Μέγεθος | 74 pages | en |
Μέγεθος | 4.4 megabytes | en |
Τίτλος | Social media analysis targeting Troll detection
| en |
Τίτλος | Ανάλυση μέσων κοινωνικής δικτύωσης εστιασμένης στην ανίχνευση Troll | el |
Δημιουργός | Koutra Panagiota | en |
Δημιουργός | Κουτρα Παναγιωτα | el |
Συντελεστής [Επιβλέπων Καθηγητής] | Ioannidis Sotirios | en |
Συντελεστής [Επιβλέπων Καθηγητής] | Ιωαννιδης Σωτηριος | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Lagoudakis Michail | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Λαγουδακης Μιχαηλ | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Spyropoulos Thrasyvoulos | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Σπυροπουλος Θρασυβουλος | el |
Εκδότης | Πολυτεχνείο Κρήτης | el |
Εκδότης | Technical University of Crete | en |
Ακαδημαϊκή Μονάδα | Technical University of Crete::School of Electrical and Computer Engineering | en |
Ακαδημαϊκή Μονάδα | Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
Περιγραφή | Διπλωματική εργασία που υποβλήθηκε στη σχολή ΗΜΜΥ του Πολ. Κρήτης για την πλήρωση των προϋποθέσεων λήψης του διπλώματος. | el |
Περίληψη | Social networks have transformed the way people interact, share information, and
express opinions; however, they have introduced significant challenges, notably
the rise of trolling behavior. Trolling involves posting inflammatory or disruptive
messages that degrade online discourse, spread misinformation, and foster a toxic
environment. This thesis addresses the challenge of troll detection using artificial
intelligence (AI) and natural language processing (NLP) techniques.
Troll detection is approached through text classification, which distinguishes between troll and non-troll content using various machine learning algorithms. This
study compares Logistic Regression, Naive Bayes, SVM, and the pre-trained DeBERTa model. The results show that DeBERTa outperforms the other methods in
terms of accuracy, precision, F1-score, and recall.
Furthermore, the thesis examines the generalization capabilities of the DeBERTa
model by testing it on unseen data from different sources through zero-shot and
one-shot predictions. The model shows satisfactory performance in zero-shot predictions and good results in one-shot predictions.
The final phase focuses on developing a general model that accurately predicts
trolling behavior across different datasets. Scale-invariant fine-tuning (SiFT) was
applied to improve the model’s performance and showed significant improvement. | en |
Περίληψη | Τα μέσα κοινωνικής δικτύωσης έχουν μεταμορφώσει τον τρόπο με τον οποίο
οι άνθρωποι αλληλεπιδρούν, μοιράζονται πληροφορίες και εκφράζουν απόψεις,
ωστόσο έχουν εισάγει σημαντικές προκλήσεις, ιδίως την αύξηση της συμπερι-
φοράς τρολαρίσματος. Το τρολάρισμα περιλαμβάνει τη δημοσίευση μηνυμάτων
με καυστικό λόγο, μηνυμάτων που έχουν σκοπό να διαταρράξουν τον διαδι-
κτυακό διάλογο, που διαδίδουν παραπληροφόρηση και καλλιεργούν ένα τοξικό
περιβάλλον. Η παρούσα διπλωματική εργασία ασχολείται με την δημιουργία με-
θόδων ανίχνευσης τρολ χρησιμοποιώντας τεχνικές τεχνητής νοημοσύνης (AI)
και της επεξεργασίας φυσικής γλώσσας (NLP).
Η ανίχνευση τρολ προσεγγίζεται μέσω της τεχνικής text classification, η οποία
κατηγοριοποιεί περιεχόμενο από τα μέσα κοινωνικής δικτύωσης ως τρολ και μη
τρολ χρησιμοποιώντας διάφορους αλγορίθμους μηχανικής μάθησης. Η παρούσα
εργασία συγκρίνει τις τεχνικές Logistic Regression, Naive Bayes, SVM και το
pre - trained μοντέλο DeBERTa. Τα αποτελέσματα δείχνουν ότι το μοντέλο
DeBERTa υπερτερεί των άλλων μεθόδων, αξιολογώντας την απόδοσή τους με
τις μετρικές accuracy, precision, F1-score, και recall.
Επιπλέον, η παρούσα έρευνα εξετάζει τις δυνατότητες γενίκευσης του μοντέλου
DeBERTa, δοκιμάζοντάς το σε άγνωστα δεδομένα από διαφορετικές πηγές μέσω
προβλέψεων. Το μοντέλο παρουσιάζει ικανοποιητικές επιδόσεις σε zero-shot
predictions και ακριβείς σε one-shot predictions.
Η τελική φάση επικεντρώνεται στην ανάπτυξη ενός γενικού μοντέλου που προ-
βλέπει με ακρίβεια τη συμπεριφορά του τρολαρίσματος σε διαφορετικά σύνολα
δεδομένων με διαφορετικούς τύπους τρολ. Εφαρμόζεται Scale-invariant FineTuning (SiFT) για τη βελτίωση των επιδόσεων του μοντέλου και παρουσιάζεται σημαντική βελτίωση. | el |
Τύπος | Διπλωματική Εργασία | el |
Τύπος | Diploma Work | en |
Άδεια Χρήσης | http://creativecommons.org/licenses/by/4.0/ | en |
Ημερομηνία | 2024-10-09 | - |
Ημερομηνία Δημοσίευσης | 2024 | - |
Θεματική Κατηγορία | DeBERTa | en |
Θεματική Κατηγορία | Machine learning | en |
Θεματική Κατηγορία | Natural language processing | en |
Θεματική Κατηγορία | Text classification | en |
Θεματική Κατηγορία | Troll detection | en |
Βιβλιογραφική Αναφορά | Panagiota Koutra, "Social media analysis targeting Troll detection", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2024 | en |
Βιβλιογραφική Αναφορά | Παναγιώτα Κούτρα, "Ανάλυση μέσων κοινωνικής δικτύωσης εστιασμένης στην ανίχνευση Troll ", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2024 | el |