Μεθοδολογία και πειράματα για μεγάλης κλίμακας κατανεμημένο υπολογισμό σε υπολογιστική υποδομή βασισμένη σε αναδιατασσόμενη λογική

Tzortzaki Christini

URI	http://purl.tuc.gr/dl/dias/149B82C8-6A39-4587-B1D7-6DD7B0FC9BE6	-
Αναγνωριστικό	https://doi.org/10.26233/heallink.tuc.98716	-
Γλώσσα	en	-
Μέγεθος	1.8 megabytes	en
Μέγεθος	87 pages	en
Τίτλος	Methodology and experiments for large scale distributed computation on reconfigurable logic – based platform	en
Τίτλος	Μεθοδολογία και πειράματα για μεγάλης κλίμακας κατανεμημένο υπολογισμό σε υπολογιστική υποδομή βασισμένη σε αναδιατασσόμενη λογική	el
Δημιουργός	Tzortzaki Christini	en
Δημιουργός	Τζωρτζακη Χριστινη	el
Συντελεστής [Επιβλέπων Καθηγητής]	Dollas Apostolos	en
Συντελεστής [Επιβλέπων Καθηγητής]	Δολλας Αποστολος	el
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]	Papaefstathiou Vasileios	en
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]	Samoladas Vasilis	en
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]	Σαμολαδας Βασιλης	el
Εκδότης	Πολυτεχνείο Κρήτης	el
Εκδότης	Technical University of Crete	en
Ακαδημαϊκή Μονάδα	Technical University of Crete::School of Electrical and Computer Engineering	en
Ακαδημαϊκή Μονάδα	Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών	el
Περίληψη	Hardware accelerators have become crucial due to their superior performance and energy efficiency. One noteworthy example is the application of hardware accelerators to Convolutional Neural Networks (CNNs), which are computationally intensive and highly parallelizable. Recent research has demonstrated significant performance improvements when implementing CNNs with hardware accelerators. This study builds upon the CNN hardware accelerator developed by G. Pitsis and C. Loukas for the Xilinx ZCU102 and the QFDB multi-FPGA prototype board, respectively, and aims at the migration of the accelerator to the Alveo U50 Data Center Card and investigates opportunities for further scaling. Through a series of experiments, the performance of the migrated CNN architecture on the Alveo U50 is evaluated and compared with its implementations on the Xilinx ZCU102 and the QFDB. Not only were the tools changed to enable the architecture's execution on the Alveo platform, but modifications were also necessary for the architecture itself. As a result, using a similar FPGA, a 22% improvement in throughput was achieved. The migration to the Alveo U50 is shown to result in improved computational efficiency, showcasing the platform's enhanced capabilities for large-scale distributed computation. Furthermore, the utilization of multiple compute units is explored as a means of achieving parallelization, leading to enhanced throughput and overall better performance.	en
Περίληψη	Οι επιταχυντές υλικού έχουν γίνει κρίσιμοι λόγω της υπερέχουσας επίδοσης και της ενεργειακής τους απόδοσης. Ένα αξιοσημείωτο παράδειγμα είναι η εφαρμογή επιταχυντών υλικού σε συνελικτικά νευρωνικά δίκτυα (CNN), τα οποία είναι υπολογιστικά εντατικά και εξαιρετικά παραλληλίσιμα. Πρόσφατες έρευνες έχουν δείξει σημαντικές βελτιώσεις στην απόδοση κατά την εφαρμογή συνελικτικού νευρωνικού δικτύου (CNN) με επιταχυντές υλικού. Αυτή η μελέτη βασίζεται στον επιταχυντή υλικού CNN που αναπτύχθηκε από τους Γ. Πίτση και Χ. Λουκά για την Xilinx ZCU102 και την πρωτότυπη πλακέτα πολλαπλών FPGA QFDB, αντίστοιχα. Αυτή η διατριβή στοχεύει στην μετεγκατάσταση του επιταχυντή στην Alveo U50 και διερευνά ευκαιρίες για περαιτέρω κλιμάκωση. Μέσα από μια σειρά πειραμάτων, αξιολογείται η απόδοση της αρχιτεκτονικής CNN στο Alveo U50 και συγκρίνεται με τις υλοποιήσεις της στο ZCU102 και το QFDB. Δεν χρειάστηκε μόνο να αλλάξουν τα εργαλεία για να καταστεί δυνατή η εκτέλεση της αρχιτεκτονικής στην πλατφόρμα Alveo, αλλά και τροποποιήσεις ήταν απαραίτητες για την ίδια την αρχιτεκτονική. Ως αποτέλεσμα, χρησιμοποιώντας FPGAs παρόμοιας τεχνολογίας, επιτεύχθηκε 22% βελτίωση στην απόδοση. Η μετάβαση στο Alveo U50 φαίνεται να έχει ως αποτέλεσμα βελτιωμένη υπολογιστική απόδοση, επιδεικνύοντας τις βελτιωμένες δυνατότητες της πλατφόρμας για κατανεμημένους υπολογισμούς μεγάλης κλίμακας. Επιπλέον, η χρήση πολλαπλών υπολογιστικών μονάδων διερευνάται ως μέσο για την επίτευξη παραλληλισμού, που οδηγεί σε βελτιωμένη απόδοση και συνολικά καλύτερη απόδοση.	el
Τύπος	Διπλωματική Εργασία	el
Τύπος	Diploma Work	en
Άδεια Χρήσης	http://creativecommons.org/licenses/by/4.0/	en
Ημερομηνία	2024-02-19	-
Ημερομηνία Δημοσίευσης	2024	-
Θεματική Κατηγορία	CNNs	en
Θεματική Κατηγορία	FPGAs	en
Βιβλιογραφική Αναφορά	Christini Tzortzaki, "Methodology and experiments for large scale distributed computation on reconfigurable logic – based platform", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2024	en
Βιβλιογραφική Αναφορά	Χριστίνη Τζωρτζάκη, "Μεθοδολογία και πειράματα για μεγάλης κλίμακας κατανεμημένο υπολογισμό σε υπολογιστική υποδομή βασισμένη σε αναδιατασσόμενη λογική", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2024	el

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Μεθοδολογία και πειράματα για μεγάλης κλίμακας κατανεμημένο υπολογισμό σε υπολογιστική υποδομή βασισμένη σε αναδιατασσόμενη λογική

Tzortzaki Christini

Διαθέσιμα αρχεία

Υπηρεσίες

Εξαγωγή

Κοινοποίηση

Στατιστικά

Μεταδεδομένων & Περιεχομένου σε METS:

Μεταδεδομένων σε Μορφότυπο: