<efrbr:recordSet xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:efrbr="http://vfrbr.info/efrbr/1.1" xmlns:efrbr-work="http://vfrbr.info/efrbr/1.1/work" xmlns:efrbr-expression="http://vfrbr.info/efrbr/1.1/expression" xmlns:efrbr-manifestation="http://vfrbr.info/efrbr/1.1/manifestation" xmlns:efrbr-person="http://vfrbr.info/efrbr/1.1/person" xmlns:efrbr-corporateBody="http://vfrbr.info/efrbr/1.1/corporateBody" xmlns:efrbr-concept="http://vfrbr.info/efrbr/1.1/concept" xmlns:efrbr-structure="http://vfrbr.info/efrbr/1.1/structure" xmlns:efrbr-responsible="http://vfrbr.info/efrbr/1.1/responsible" xmlns:efrbr-subject="http://vfrbr.info/efrbr/1.1/subject" xmlns:efrbr-other="http://vfrbr.info/efrbr/1.1/other" xsi:schemaLocation="http://vfrbr.info/efrbr/1.1 http://vfrbr.info/schemas/1.1/efrbr.xsd"><efrbr:entities><efrbr-work:work identifier="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8"><efrbr-work:titleOfTheWork>Effective fake news detection using machine learning techniques</efrbr-work:titleOfTheWork></efrbr-work:work><efrbr-expression:expression identifier="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8"><efrbr-expression:titleOfTheExpression>Effective fake news detection using machine learning techniques</efrbr-expression:titleOfTheExpression><efrbr-expression:titleOfTheExpression>Αποτελεσματική ανίχνευση ''ψευδών ειδήσεων'' με χρήση τεχνικών μηχανικής μάθησης</efrbr-expression:titleOfTheExpression><efrbr-expression:formOfExpression vocabulary="DIAS:TYPES">
            Διπλωματική Εργασία
            Diploma Work
         </efrbr-expression:formOfExpression><efrbr-expression:dateOfExpression type="issued">2019-09-18</efrbr-expression:dateOfExpression><efrbr-expression:dateOfExpression type="published">2019</efrbr-expression:dateOfExpression><efrbr-expression:languageOfExpression vocabulary="iso639-1">en</efrbr-expression:languageOfExpression><efrbr-expression:summarizationOfContent>    In recent years, fake news detection has been an emerging research area. In this thesis, we put forward a novel statistical approach for the generation of feature vectors to describe a document. Our so-called class label frequency distance (clfd), is shown experimentally to provide an effective way for boosting the performance of machine learning methods.
    Specifically, our experiments, carried out in the fake news detection domain, verify that efficient traditional machine learning methods that use our vectorization approach, consistently outperform deep learning methods that use word embeddings for small and medium sized datasets, while the results are comparable for large datasets.
    In addition, we demonstrate that a novel hybrid method that utilizes both a clfd-boosted logistic regression classifier and a deep learning one, clearly outperforms deep learning methods even in large datasets.</efrbr-expression:summarizationOfContent><efrbr-expression:summarizationOfContent>Τα τελευταία χρόνια, η ανίχνευση ψευδών ειδήσεων είναι μια ανερχόμενη περιοχή έρευνας, που συνδέεται με την ανάπτυξη μεθόδων μηχανικής μάθησης (ΜΜ) για την ταυτοποίηση της αυθεντικότητας και την επιτυχή και αποδοτική ταξινόμηση κειμένων ειδήσεων ως ψευδών ή μη.
Στην παρούσα διπλωματική εργασία, προτείνουμε ένα νέο στατιστικό μοντέλο διανυσματικοποίησης κειμένου, που αποσκοπεί στην δημιουργία διανυσμάτων χαρακτηριστικών για την αριθμητική αναπαράσταση ενός αρχείου κειμένου. Η μέθοδός μας, την οποία καλούμε class label frequency distance (CLFD), έχει συγκεκριμένα προτερήματα σε σχέση με ‘’κλασσικές’’ μεθόδους διανυσματικοποίσης κειμένου. Στην εργασία μας εξηγούμε το πώς μπορεί να ενσωματωθεί σε μεθόδους MM που χρησιμοποιούνται για ταξινόμηση κειμένων. Δεικνύουμε πειραματικά ότι η CLFD αποτελεί έναν αποτελεσματικό τρόπο για την βελτίωση της απόδοσης των μεθόδων αυτών.
Πιο συγκεκριμένα, κατά την πειραματική διαδικασία, η οποία διεξήχθη στο πεδίο της ανίχνευσης ψευδών ειδήσεων, επαληθεύεται ότι τα αποτελέσματα συγκεκριμένων παραδοσιακών μεθόδων ΜΜ με αποδοτική πολυπλοκότητα που χρησιμοποιούν την προτεινόμενη μέθοδο διανυσματικοποίησης, είναι στατιστικά καλύτερα σε σχέση με αυτά των υψηλής πολυπλοκότητας μεθόδων βαθιάς μάθησης για μικρού και μεσαίου όγκου συλλογές αρχείων ειδήσεων - ενώ ταυτόχρονα, η απόδοση των μεθόδων είναι παρόμοια για μεγάλου όγκου συλλογές.
Ακολούθως, προτείνουμε μία νέα, υβριδική μέθοδο MM που συνδυάζει την παραδοσιακή και αποδοτική μέθοδο ‘’λογιστικής παλινδρόμησης’’ (‘’logistic regression’’) η οποία αξιοποιεί το στατιστικό μας μοντέλο και μία μη γραμμική μέθοδο βαθιάς μάθησης. Αποδυκνύουμε πειραματικά ότι η απόδοση της υβριδικής μεθόδου ξεπερνάει αυτήν των μη γραμμικών μεθόδων βαθιάς μάθησης ακόμα και για μεγάλου όγκου συλλογές αρχείων.
Τέλος, σε δύο συλλογές αρχείων ειδήσεων που χρησιμοποιούνται στη βιβλιογραφία, η εφαρμογή του στατιστικού μας μοντέλου είχε ως αποτέλεσμα η απόδοση τόσο της υβριδικής μεθόδου όσο και ορισμένων κλασικών μεθόδων μηχανικής μάθησης να είναι σημαντικά καλύτερη από αυτήν που αναφέρεται σε πρόσφατη σχετική ερευνητική δημοσίευση.</efrbr-expression:summarizationOfContent><efrbr-expression:contextForTheExpression>Diploma Thesis</efrbr-expression:contextForTheExpression><efrbr-expression:useRestrictionsOnTheExpression type="creative-commons">http://creativecommons.org/licenses/by/4.0/</efrbr-expression:useRestrictionsOnTheExpression><efrbr-expression:note type="academic unit">Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών</efrbr-expression:note></efrbr-expression:expression><efrbr-manifestation:manifestation identifier="https://dias.library.tuc.gr/view/83207"><efrbr-manifestation:titleOfTheManifestation>Mersinias_Michail_Dip_2019.pdf</efrbr-manifestation:titleOfTheManifestation><efrbr-manifestation:publicationDistribution><efrbr-manifestation:placeOfPublicationDistribution type="distribution">Chania [Greece]</efrbr-manifestation:placeOfPublicationDistribution><efrbr-manifestation:publisherDistributor type="distributor">Library of TUC</efrbr-manifestation:publisherDistributor><efrbr-manifestation:dateOfPublicationDistribution>2019-09-18</efrbr-manifestation:dateOfPublicationDistribution></efrbr-manifestation:publicationDistribution><efrbr-manifestation:formOfCarrier>application/pdf</efrbr-manifestation:formOfCarrier><efrbr-manifestation:extentOfTheCarrier>3.2 MB</efrbr-manifestation:extentOfTheCarrier><efrbr-manifestation:accessRestrictionsOnTheManifestation>embargo</efrbr-manifestation:accessRestrictionsOnTheManifestation></efrbr-manifestation:manifestation><efrbr-person:person identifier="http://users.isc.tuc.gr/~mmersinias"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Mersinias Michail
            Μερσινιας Μιχαηλ
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~gchalkiadakis"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Chalkiadakis Georgios
            Χαλκιαδακης Γεωργιος
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~lagoudakis"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Lagoudakis Michail
            Λαγουδακης Μιχαηλ
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="EEDF56DC-DD74-4C2F-8DF5-A78586D9A3C7"><efrbr-person:nameOfPerson vocabulary="">
            Afantenos Stergos
            Αφαντενός Στέργος
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-corporateBody:corporateBody identifier="093963A9-FEEF-4B5D-A49A-48221B71AD5F"><efrbr-corporateBody:nameOfTheCorporateBody vocabulary="">
            Πολυτεχνείο Κρήτης
            Technical University of Crete
         </efrbr-corporateBody:nameOfTheCorporateBody></efrbr-corporateBody:corporateBody><efrbr-concept:concept identifier="4B712155-5D13-451A-8BAB-B3B16B9678DD"><efrbr-concept:termForTheConcept>
            Natural language processing
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="4A50E2B5-13C7-463B-A71C-B8D96CFB0A52"><efrbr-concept:termForTheConcept>
            Machine learning
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="DEB54494-87AD-4E1B-9333-DCE4CBCD1609"><efrbr-concept:termForTheConcept>
            Text analytics
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="6BBE8ECC-E7EA-4403-860F-6F96B3F43807"><efrbr-concept:termForTheConcept>
            Artificial intelligence
         </efrbr-concept:termForTheConcept></efrbr-concept:concept></efrbr:entities><efrbr:relationships><efrbr-structure:structureRelations><efrbr-structure:realizedThrough sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="expression" targetURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8"/><efrbr-structure:embodiedIn sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="manifestation" targetURI="http://purl.tuc.gr/dl/dias/9DEE87D0-08DE-4060-9A78-70A2ABA00B5B"/></efrbr-structure:structureRelations><efrbr-responsible:responsibleRelations><efrbr-responsible:createdBy sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="person" targetURI="http://users.isc.tuc.gr/~mmersinias"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="person" targetURI="http://users.isc.tuc.gr/~mmersinias" role="author"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="person" targetURI="http://users.isc.tuc.gr/~gchalkiadakis" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/1"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="person" targetURI="http://users.isc.tuc.gr/~lagoudakis" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/2"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="person" targetURI="EEDF56DC-DD74-4C2F-8DF5-A78586D9A3C7" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/2"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="person" targetURI="093963A9-FEEF-4B5D-A49A-48221B71AD5F" role="publisher"/></efrbr-responsible:responsibleRelations><efrbr-subject:subjectRelations><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="concept" targetURI="4B712155-5D13-451A-8BAB-B3B16B9678DD"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="concept" targetURI="4A50E2B5-13C7-463B-A71C-B8D96CFB0A52"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="concept" targetURI="DEB54494-87AD-4E1B-9333-DCE4CBCD1609"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/C622CB14-14E0-4120-8DD7-7CCF3B8311B8" targetEntity="concept" targetURI="6BBE8ECC-E7EA-4403-860F-6F96B3F43807"/></efrbr-subject:subjectRelations><efrbr-other:otherRelations/></efrbr:relationships></efrbr:recordSet>