URI | http://purl.tuc.gr/dl/dias/FC43D160-F481-46B3-AC4E-495E5084E2AA | - |
Identifier | https://doi.org/10.26233/heallink.tuc.104973 | - |
Language | en | - |
Extent | 89 pages | en |
Title | Energy efficient control of production lines with the use of Reinforcement Learning
| en |
Title | Ενεργειακά αποδοτικός έλεγχος γραμμών παραγωγής με χρήση ενισχυτικής μάθησης
| el |
Creator | Manganas Grigorios | en |
Creator | Μαγγανας Γρηγοριος | el |
Contributor [Thesis Supervisor] | Ioannidis Efstratios | en |
Contributor [Thesis Supervisor] | Ιωαννιδης Ευστρατιος | el |
Contributor [Committee Member] | Tsinarakis Georgios | en |
Contributor [Committee Member] | Τσιναρακης Γεωργιος | el |
Contributor [Committee Member] | Doitsidis Eleftherios | en |
Contributor [Committee Member] | Δοιτσιδης Ελευθεριος | el |
Publisher | Πολυτεχνείο Κρήτης | el |
Publisher | Technical University of Crete | en |
Academic Unit | Technical University of Crete::School of Production Engineering and Management | en |
Academic Unit | Πολυτεχνείο Κρήτης::Σχολή Μηχανικών Παραγωγής και Διοίκησης | el |
Content Summary | Optimization of the production processes is a major topic in industrial engineering. New technologies such as Reinforcement Learning (RL) have emerged, allowing for novel approaches to the issue of optimal production control in all its aspects, including production planning, maintenance and safety administration, logistics etc. Research on this field focuses on training of agents in simulation environments mimicking the behavior of their real-world counterparts. In this thesis, a simple 2-machine environment with intermediate buffers and a client queue is developed and fitted with an RL agent as its master controller, using the Proximal Policy Optimization (PPO) method. This agent is then trained on a number of different scenarios, simulating environment variable fluctuations often met in real-world production systems, such as increased demand or production costs. Though in a smaller scale than a real industrial facility, training showed effective control of the production line and, in some of the trained agents, resilience in more demanding scenarios. These findings may assist in the future development of RL agents for use in the field of industrial control and pave the way for more challenging problems to be tackled. | en |
Content Summary | Η βελτιστοποίηση των γραμμών παραγωγής είναι ένα μείζον ζήτημα στον τομέα της βιομηχανίας. Νέες αναδυόμενες τεχνολογίες όπως η Ενισχυτική Μάθηση (Reinforcement Learning, RL) επιτρέπουν την εφαρμογή νέων προσεγγίσεων στο πρόβλημα του βέλτιστου ελέγχου της παραγωγής σε όλους του τους τομείς, περιλαμβανομένου του προγραμματισμού παραγωγής, της διαχείρισης εργασιών συντήρησης και ασφάλειας, της εφοδιαστικής αλυσίδας κλπ. Η υπάρχουσα έρευνα σε αυτό το πεδίο εστιάζει στην εκπαίδευση πρακτόρων σε περιβάλλοντα προσομοιώσεων που μιμούνται τη συμπεριφορά υπαρκτών συστημάτων παραγωγής. Σε αυτή την εργασία, αναπτύχθηκε μια απλή γραμμή παραγωγής με 2 μηχανές, ενδιάμεσες αποθηκευτικές μονάδες και ουρά αναμονής πελατών, στην οποία εφαρμόστηκε ένας πράκτορας Ενισχυτικής Μάθησης σαν κύριος ελεγκτής που χρησιμοποιεί τη μέθοδο Βελτιστοποίησης Πλησιέστερης Πολιτικής (Proximal Policy Optimization, PPO). Αυτός ο πράκτορας έπειτα εκπαιδεύεται σε διαφορετικά σενάρια που προσομοιώνουν μεταβολές στις περιβαλλοντικές παραμέτρους, όπως αυξημένη ζήτηση προϊόντων ή κόστους παραγωγής. Παρ’όλο που η εκπαίδευση γίνεται σε μικρότερη κλίμακα από μια πραγματική βιομηχανία, η διαδικασία έδειξε αποτελεσματικό έλεγχο των μηχανών της γραμμής παραγωγής και, σε κάποιους από τους πράκτορες, αντοχή στις συνθήκες των πιο απαιτητικών σεναρίων. Αυτά τα ευρήματα ενδέχεται να βοηθήσουν στη μελλοντική ανάπτυξη πρακτόρων Ενισχυτικής Μάθησης για χρήση στον βιομηχανικό έλεγχο και να δείξουν το δρόμο για την αντιμετώπιση πιο προκλητικών ζητημάτων. | el |
Type of Item | Διπλωματική Εργασία | el |
Type of Item | Diploma Work | en |
License | http://creativecommons.org/licenses/by-nc/4.0/ | en |
Date of Item | 2025-10-09 | - |
Date of Publication | 2025 | - |
Subject | PPO | en |
Subject | Reinforcement learning | en |
Subject | Production line | en |
Subject | Production control | en |
Bibliographic Citation | Grigorios Manganas, "Energy efficient control of production lines with the use of Reinforcement Learning", Diploma Work, School of Production Engineering and Management, Technical University of Crete, Chania, Greece, 2025 | en |
Bibliographic Citation | Γρηγόριος Μαγγανάς, "Ενεργειακά αποδοτικός έλεγχος γραμμών παραγωγής με χρήση ενισχυτικής μάθησης", Διπλωματική Εργασία, Σχολή Μηχανικών Παραγωγής και Διοίκησης, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025 | el |