URI | http://purl.tuc.gr/dl/dias/572D696B-919B-4BA7-9DE5-F1590DACF0C7 | - |
Αναγνωριστικό | https://doi.org/10.26233/heallink.tuc.90599 | - |
Γλώσσα | en | - |
Μέγεθος | 115 pages | en |
Μέγεθος | 4.5 megabytes | en |
Τίτλος | Design and Implementation of a cloud based FPGA accelerator for phylogeny reconstruction | en |
Τίτλος | Σχεδιασμός και υλοποίηση ενός FPGA επιταχυντή πάνω σε νέφος για ανασυγκρότηση φυλογενετικών σχέσεων
| el |
Δημιουργός | Bokalidis Anastasios | en |
Δημιουργός | Μποκαλιδης Αναστασιος | el |
Συντελεστής [Επιβλέπων Καθηγητής] | Dollas Apostolos | en |
Συντελεστής [Επιβλέπων Καθηγητής] | Δολλας Αποστολος | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Zervakis Michail | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Ζερβακης Μιχαηλ | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Alachiotis Nikolaos | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Αλαχιωτης Νικολαος | el |
Εκδότης | Πολυτεχνείο Κρήτης | el |
Εκδότης | Technical University of Crete | en |
Ακαδημαϊκή Μονάδα | Technical University of Crete::School of Electrical and Computer Engineering | en |
Ακαδημαϊκή Μονάδα | Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
Περίληψη | One of the most interesting challenges through the 21st century, that researchers
have to encounter is the rapid and continuous increase of data.
Many fields of science and technology face problems in the management and
processing of vast data. One of them is Biology. The process of phylogenetic
analysis of DNA, RNA, Protein, and other types of phylogenies, consumes a
lot of time which performs a non-linear increase while the volume of the data
for processing tends to increase. In addition, it is not only the time which is
of concern to the scientists but also, the computing systems which are needed
for this purpose. Not even personal computers can eliminate this problem,
but also high-performance computers are inadequate to face up vast data.
The first ones have CPUs that can not surpass a threshold in speed up and
parallelism and the second ones are used only for special studies and computations.
In this project, there is a study on a phylogenetic analysis algorithm,
RAxML, which is based on the maximum likelihood method. The purpose
of this project is to optimize by accelerating some functions of RAxML which
consume more than 80% of the total execution time and especially under
the processing of big data sets. So, the first step is to research the way that
RAxML behaves according to the input data and the second step is to design
and construct hardware accelerators required for optimal performance.
These accelerators are designed to be mapped and routed on FPGAs and
also on similar platforms of the Amazons’ cloud. Finally, there is a study and
comparison between the results coming from the initial algorithm and the results that come from the accelerators. Moreover, a theoretical model is introduced
which shows the optimal performance of the accelerators and how
it can affect the overall performance of the algorithm. | en |
Περίληψη | Μιά απο τις πιο ενδιαφέρουσες προκλήσεις του 21ου αιώνα, που έχουν να αντιμετωπίσουν οι επιστήμονες είναι η ραγδαία και συνεχόμενη αύξηση των δεδομένων. Πολλοί τομείς της επιστήμης και της τεχνολογίας αντιμετωπίζουν προβλήματα στην διαχείρηση και την επεξεργασία των τεράστιων δεδομένων. ́Ενας απο αυτούς τους είναι η Βιολογία. Η διαδικασία την φυλογεννετικής ανάλυσης των DNA, RNA, πρωτεϊνών και άλλων τύπων φυλεγέννεσης, καταναλώνει αρκετό χρόνο, η οποία μάλιστα παρουσιάζει και μια μη γραμμική αύξηση όσο αυξάνεται ο όγκος των δεδομένων χρήσης. Επιπλεόν δεν είναι μόνο ο χρόνος που απασχολεί τους επιστήμονες αλλά επίσης και τα υπολογιστικά συστήματα που χρειάζονται για τον παραπάνω σκοπό. ́Οχι μόνο οι προσωπικοί υπολογίστες δεν μπορούν να εξαλείψουν το πρόβλημα, αλλά ακομή και οι υπερυπολογιστές μπορούν δεν μπορούν να καλύψουν τις ανάγκες μπροστά στον υπερόγκο δεδομένων. Οι πρώτοι έχουν επεξεργαστές οι οποίοι δεν μπορούν να ξεπεράσουν ένα κατώφλι επιτάχυνσης και παραλληλισμού των εφαρμογών που θέλουμε, και οι δεύτεροι χρησιμοποιούνται μόνο για ειδικές μελέτες και υπολογισμούς. Σε αυτή την εργασία, γίνεται μια μελέτη πάνω σε έναν αλγόριθμο φυλογεννετικής ανάλυσης, RAxML, ο οποίος βασίζεται πάνω στην μέθοδο της μέγιστης πιθανοφάνειας. Ο σκοπός αυτής της εργασίας είναι να βελτιώσουμε επιταχύνοντας κάποιες συναρτήσεις του RAxML, οι οποίες καταναλώνουν περισσότερο απο το 80% του συνολικού χρόνου εκτέλεσης και ειδικά όταν βρίσκονται υπό επεξεργασία μεγάλα αρχεία δεδομένων. Οπότε, πρώτο βήμα είναι να μελετήσουμε πως συμπεριφέρεται ο RAxML ανάλογα με τα δεδομένα εισόδου και ως δεύτερο βήμα να σχεδιάσουμε και να κατασκευάσουμε επιταχυντές όπου είναι απαραίτητοι για να βελτιώσουμε την απόδοση. Αυτοί οι επιταχυντές σχεδιάζονται ώστε να εγκατασταθούν πάνω σε FPGAs αλλά και σε αντίστοιχες πλατφόρμες νέφους της Amazon. Τέλος, γίνεται μελέτη και σύγκριση των αποτελεσμάτων του αρχικού αλγορίθμου με τους αντίστοιχους επιταχυντές μας και επίσης παρουσιάζεται ένα θεωρητικό μοντέλο για το πως θα ήταν η βέλτιστη συμπεριφορά των επιταχυντών μας και ποιά η βελτίωση που θα πρόσφεραν σε συνολικό επίπεδο στον αλγόριθμο. | el |
Τύπος | Διπλωματική Εργασία | el |
Τύπος | Diploma Work | en |
Άδεια Χρήσης | http://creativecommons.org/licenses/by/4.0/ | en |
Ημερομηνία | 2021-10-15 | - |
Ημερομηνία Δημοσίευσης | 2021 | - |
Θεματική Κατηγορία | Phylogenetics | en |
Θεματική Κατηγορία | HPC | en |
Θεματική Κατηγορία | FPGA | en |
Βιβλιογραφική Αναφορά | Anastasios Bokalidis, "Design and Implementation of a cloud based FPGA accelerator for phylogeny reconstruction", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2021 | en |
Βιβλιογραφική Αναφορά | Αναστάσιος Μποκαλίδης, "Σχεδιασμός και υλοποίηση ενός FPGA επιταχυντή πάνω σε νέφος για ανασυγκρότηση φυλογενετικών σχέσεων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2021 | el |