<efrbr:recordSet xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:efrbr="http://vfrbr.info/efrbr/1.1" xmlns:efrbr-work="http://vfrbr.info/efrbr/1.1/work" xmlns:efrbr-expression="http://vfrbr.info/efrbr/1.1/expression" xmlns:efrbr-manifestation="http://vfrbr.info/efrbr/1.1/manifestation" xmlns:efrbr-person="http://vfrbr.info/efrbr/1.1/person" xmlns:efrbr-corporateBody="http://vfrbr.info/efrbr/1.1/corporateBody" xmlns:efrbr-concept="http://vfrbr.info/efrbr/1.1/concept" xmlns:efrbr-structure="http://vfrbr.info/efrbr/1.1/structure" xmlns:efrbr-responsible="http://vfrbr.info/efrbr/1.1/responsible" xmlns:efrbr-subject="http://vfrbr.info/efrbr/1.1/subject" xmlns:efrbr-other="http://vfrbr.info/efrbr/1.1/other" xsi:schemaLocation="http://vfrbr.info/efrbr/1.1 http://vfrbr.info/schemas/1.1/efrbr.xsd"><efrbr:entities><efrbr-work:work identifier="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5"><efrbr-work:titleOfTheWork>Implementation of a platform for the update, management and analysis of data for the «HelTh» nutrition database</efrbr-work:titleOfTheWork></efrbr-work:work><efrbr-expression:expression identifier="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5"><efrbr-expression:titleOfTheExpression>Implementation of a platform for the update, management and analysis of data for the «HelTh» nutrition database</efrbr-expression:titleOfTheExpression><efrbr-expression:titleOfTheExpression>Υλοποίηση πλατφόρμας για την ενημέρωση, διαχείριση και ανάλυση της βάσης διατροφικών δεδομένων «HelTH»</efrbr-expression:titleOfTheExpression><efrbr-expression:formOfExpression vocabulary="DIAS:TYPES">
            Διπλωματική Εργασία
            Diploma Work
         </efrbr-expression:formOfExpression><efrbr-expression:dateOfExpression type="issued">2025-07-21</efrbr-expression:dateOfExpression><efrbr-expression:dateOfExpression type="published">2025</efrbr-expression:dateOfExpression><efrbr-expression:languageOfExpression vocabulary="iso639-1">en</efrbr-expression:languageOfExpression><efrbr-expression:summarizationOfContent>Purpose: The study aims to test whether Natural Language Processing (NLP) and Machine Learning teaching can be employed to accurately predict the nutritional composition- namely total fat, protein, total sugar, sodium and fiber content- of food products using their ingredient list as input. This approach is centered around the development of AI-tool to support food labelling standardization, address public health concerns and raise consumer awareness.
Methodology: DistilBERT embeddings were employed to transform text from a food’s ingredient list into structured numerical representation, in a deep learning based predictive framework. The experimental dataset was the USDA FoodData Central Branded Food Composition database which ensures a comprehensive representation of the food environment and the variation in composition. Experimental regression models and Multi-Layer Perceptron (MLP) networks
employed a variety of loss functions, epochs, dataset sizes and batch sizes. The evaluation of the different experimental conditions was carried out using validation loss, Mean Absolute Error (MAE), and R2 score. Optimization was carried out using AdamW.
Results: Findings indicate that using datasets with data from a single food category (category-specific), provide models with improved predictive accuracy, validation loss and model convergence compared to those using data from various food categories (generalized). SmoothL1Loss function was associated with improved validation and training loss compared to other loss functions, while AdamW enhanced training stability. The study further highlights that using datasets with higher structure as opposed to unstructured datasets improves prediction
accuracy and reduces noise and overfitting risks.
Conclusions: The results indicate that NLP-driven models can be proposed as a reliable alternative in the estimation/prediction of a food’s nutritional composition from its ingredient list. This proposes the choice of scalable and cost-effective AI-based alternatives to traditional laboratory-based methods. Future research needs are identified in the areas of refinement of real-time prediction capabilities, optimization of feature selection techniques and ultimately the usability of such techniques in regulatory environments. The study highlights the potential of machine learning and intelligent food composition prediction in the food industry as a tool to increase consumer trust and support high quality labelling.</efrbr-expression:summarizationOfContent><efrbr-expression:summarizationOfContent>Σκοπός: Η μελέτη διερευνά τη δυνατότητα χρήσης της Επεξεργασίας Φυσικής Γλώσσας (NLP) και τεχνικών μηχανικής μάθησης για την ακριβή πρόβλεψη της διατροφικής σύστασης τροφίμων— ειδικότερα της περιεκτικότητας σε ολικά λιπαρά, πρωτεΐνες, ολικά σάκχαρα, νάτριο και φυτικές ίνες —βάσειτης λίστας συστατικών τους. Η έρευνα υποκινείται από την αυξανόμενη ζήτηση για ακριβή και τυποποιημένη επισήμανση τροφίμων λόγω των ρυθμιστικών αλλαγών,
των ανησυχιών για τη δημόσια υγεία και της αυξημένης καταναλωτικής ευαισθητοποίησης.
Μεθοδολογία: Αναπτύχθηκε ένα προγνωστικό πλαίσιο βασισμένο στη βαθιά μάθηση, αξιοποιώντας DistilBERT embeddings για τη μετατροπή των λιστών συστατικών σε αριθμητικές αναπαραστάσεις. Χρησιμοποιήθηκε ένα σύνολο δεδομένων από την USDA FoodData Central, διασφαλίζοντας την ευρεία κάλυψη της διατροφικής σύστασης τροφίμων. Πειραματικά μοντέλα παλινδρόμησης και δίκτυα Multi-Layer Perceptron (MLP), μελετησαν μια ποικιλία συναρτήσεων
απώλειας, εποχών, μεγεθών συνόλου δεδομένων και μεγεθών παρτίδας. Η αξιολόγηση των διαφορετικών πειραματικών συνθηκών πραγματοποιήθηκε με τη χρήση της απώλειας επικύρωσης (validation loss), του μέσου απόλυτου σφάλματος (MAE) και τoυ Συντελεστή Προσδιορισμού (R2 Score). Η βελτιστοποίηση πραγματοποιήθηκε με τη χρήση του AdamW.
Αποτελέσματα: Τα ευρήματα δείχνουν ότι η χρήση συνόλων δεδομένων με δεδομένα από μία μόνο κατηγορία τροφίμων (ειδική κατηγορία), παρέχει μοντέλα με βελτιωμένη ακρίβεια πρόβλεψης, απώλεια επικύρωσης και σύγκλιση του μοντέλου σε σύγκριση με εκείνα που χρησιμοποιούν δεδομένα από διάφορες κατηγορίες τροφίμων (γενικευμένα). Η συνάρτηση SmoothL1Loss συσχετίστηκε με βελτιωμένες απώλειες επικύρωσης και εκπαίδευσης σε σύγκριση με άλλες συναρτήσεις απωλειών, ενώ η AdamW ενίσχυσε τη σταθερότητα της
εκπαίδευσης. Η μελέτη υπογραμμίζει περαιτέρω ότι η χρήση συνόλων δεδομένων με υψηλότερη δομή σε αντίθεση με τα μη δομημένα σύνολα δεδομένων βελτιώνει την ακρίβεια πρόβλεψης και μειώνει τους κινδύνους θορύβου και υπερπροσαρμογής.
Συμπεράσματα: Τα αποτελέσματα υποδεικνύουν ότι τα μοντέλα που βασίζονται σε NLP μπορούν να προταθούν ως αξιόπιστη εναλλακτική λύση για την εκτίμηση/πρόβλεψη της διατροφικής σύνθεσης ενός τροφίμου από τη λίστα συστατικών του. Αυτό προτείνει την επιλογή κλιμακούμενων και οικονομικά αποδοτικών εναλλακτικών λύσεων με βάση την ΤΝ σε σχέση με τις παραδοσιακές μεθόδους που βασίζονται σε εργαστήρια. Μελλοντικές ερευνητικές ανάγκες εντοπίζονται στους τομείς της βελτίωσης των δυνατοτήτων πρόβλεψης σε πραγματικό χρόνο, της βελτιστοποίησης των τεχνικών επιλογής χαρακτηριστικών και τελικά της χρηστικότητας αυτών των τεχνικών εντός των κανονιστικών πλαισίων της επισήμανσης τροφίμων. Η μελέτη αναδεικνύει τις δυνατότητες της μηχανικής μάθησης και της ευφυούς πρόβλεψης της σύνθεσης των τροφίμων για τη βιομηχανία τροφίμων ως εργαλείο αύξησης της εμπιστοσύνης των καταναλωτών προς τα συσκευασμένα τρόφιμα και την υποστήριξη της επισήμανσης υψηλής ποιότητας.</efrbr-expression:summarizationOfContent><efrbr-expression:contextForTheExpression>Διπλωματική Εργασία που υποβλήθηκε στη σχολή ΗΜΜΥ του Πολ. Κρήτης για την πλήρωση προϋποθέσεων λήψης του Προπτυχιακού Διπλώματος.</efrbr-expression:contextForTheExpression><efrbr-expression:useRestrictionsOnTheExpression type="creative-commons">http://creativecommons.org/licenses/by/4.0/</efrbr-expression:useRestrictionsOnTheExpression><efrbr-expression:note type="academic unit">Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών</efrbr-expression:note></efrbr-expression:expression><efrbr-manifestation:manifestation identifier="https://dias.library.tuc.gr/view/104087"><efrbr-manifestation:titleOfTheManifestation>Vlassopoulos_Evangelos-Stylianos_Dip_2025.pdf</efrbr-manifestation:titleOfTheManifestation><efrbr-manifestation:publicationDistribution><efrbr-manifestation:placeOfPublicationDistribution type="distribution">Chania [Greece]</efrbr-manifestation:placeOfPublicationDistribution><efrbr-manifestation:publisherDistributor type="distributor">Library of TUC</efrbr-manifestation:publisherDistributor><efrbr-manifestation:dateOfPublicationDistribution>2025-07-18</efrbr-manifestation:dateOfPublicationDistribution></efrbr-manifestation:publicationDistribution><efrbr-manifestation:formOfCarrier>application/pdf</efrbr-manifestation:formOfCarrier><efrbr-manifestation:extentOfTheCarrier>2.5 MB</efrbr-manifestation:extentOfTheCarrier><efrbr-manifestation:accessRestrictionsOnTheManifestation>free</efrbr-manifestation:accessRestrictionsOnTheManifestation></efrbr-manifestation:manifestation><efrbr-person:person identifier="http://users.isc.tuc.gr/~evlassopoulos"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Vlassopoulos Evaggelos-Stylianos
            Βλασσοπουλος Ευαγγελος-Στυλιανος
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~mzervakis"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Zervakis Michail
            Ζερβακης Μιχαηλ
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~lagoudakis"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Lagoudakis Michail
            Λαγουδακης Μιχαηλ
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="0D3BAD9C-B3CA-4C88-984F-C5248932DB93"><efrbr-person:nameOfPerson vocabulary="">
            Kapsokefalou Maria
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-corporateBody:corporateBody identifier="190FDB57-71C7-4205-A076-E979441275DC"><efrbr-corporateBody:nameOfTheCorporateBody vocabulary="">
            Πολυτεχνείο Κρήτης
            Technical University of Crete
         </efrbr-corporateBody:nameOfTheCorporateBody></efrbr-corporateBody:corporateBody><efrbr-concept:concept identifier="81806DC5-BC5E-4DD6-B916-21C82B2FA773"><efrbr-concept:termForTheConcept>
            Nutrient composition
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="44560420-29EC-497E-9110-A598108A7881"><efrbr-concept:termForTheConcept>
            Prediction model
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="6389F1B0-AA83-476D-B078-6D0D0BF4F359"><efrbr-concept:termForTheConcept>
            Food dataset
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="BA224EF6-BE58-41E9-ABE4-4DA04A8C521E"><efrbr-concept:termForTheConcept>
            AI
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="DC7D5FFC-A1C0-42A0-AAE5-0493F3C5B180"><efrbr-concept:termForTheConcept>
            NLP
         </efrbr-concept:termForTheConcept></efrbr-concept:concept></efrbr:entities><efrbr:relationships><efrbr-structure:structureRelations><efrbr-structure:realizedThrough sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="expression" targetURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5"/><efrbr-structure:embodiedIn sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="manifestation" targetURI="http://purl.tuc.gr/dl/dias/4198FC17-458A-4275-B58B-AF6F8005D540"/></efrbr-structure:structureRelations><efrbr-responsible:responsibleRelations><efrbr-responsible:createdBy sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="person" targetURI="http://users.isc.tuc.gr/~evlassopoulos"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="person" targetURI="http://users.isc.tuc.gr/~evlassopoulos" role="author"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="person" targetURI="http://users.isc.tuc.gr/~mzervakis" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/1"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="person" targetURI="http://users.isc.tuc.gr/~lagoudakis" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/2"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="person" targetURI="0D3BAD9C-B3CA-4C88-984F-C5248932DB93" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/2"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="person" targetURI="190FDB57-71C7-4205-A076-E979441275DC" role="publisher"/></efrbr-responsible:responsibleRelations><efrbr-subject:subjectRelations><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="concept" targetURI="81806DC5-BC5E-4DD6-B916-21C82B2FA773"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="concept" targetURI="44560420-29EC-497E-9110-A598108A7881"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="concept" targetURI="6389F1B0-AA83-476D-B078-6D0D0BF4F359"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="concept" targetURI="BA224EF6-BE58-41E9-ABE4-4DA04A8C521E"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/E6D5E201-CA1E-4AED-82D3-528558FFCFF5" targetEntity="concept" targetURI="DC7D5FFC-A1C0-42A0-AAE5-0493F3C5B180"/></efrbr-subject:subjectRelations><efrbr-other:otherRelations/></efrbr:relationships></efrbr:recordSet>