URI | http://purl.tuc.gr/dl/dias/572D696B-919B-4BA7-9DE5-F1590DACF0C7 | - |
Identifier | https://doi.org/10.26233/heallink.tuc.90599 | - |
Language | en | - |
Extent | 115 pages | en |
Extent | 4.5 megabytes | en |
Title | Design and Implementation of a cloud based FPGA accelerator for phylogeny reconstruction | en |
Title | Σχεδιασμός και υλοποίηση ενός FPGA επιταχυντή πάνω σε νέφος για ανασυγκρότηση φυλογενετικών σχέσεων
| el |
Creator | Bokalidis Anastasios | en |
Creator | Μποκαλιδης Αναστασιος | el |
Contributor [Thesis Supervisor] | Dollas Apostolos | en |
Contributor [Thesis Supervisor] | Δολλας Αποστολος | el |
Contributor [Committee Member] | Zervakis Michail | en |
Contributor [Committee Member] | Ζερβακης Μιχαηλ | el |
Contributor [Committee Member] | Alachiotis Nikolaos | en |
Contributor [Committee Member] | Αλαχιωτης Νικολαος | el |
Publisher | Πολυτεχνείο Κρήτης | el |
Publisher | Technical University of Crete | en |
Academic Unit | Technical University of Crete::School of Electrical and Computer Engineering | en |
Academic Unit | Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
Content Summary | One of the most interesting challenges through the 21st century, that researchers
have to encounter is the rapid and continuous increase of data.
Many fields of science and technology face problems in the management and
processing of vast data. One of them is Biology. The process of phylogenetic
analysis of DNA, RNA, Protein, and other types of phylogenies, consumes a
lot of time which performs a non-linear increase while the volume of the data
for processing tends to increase. In addition, it is not only the time which is
of concern to the scientists but also, the computing systems which are needed
for this purpose. Not even personal computers can eliminate this problem,
but also high-performance computers are inadequate to face up vast data.
The first ones have CPUs that can not surpass a threshold in speed up and
parallelism and the second ones are used only for special studies and computations.
In this project, there is a study on a phylogenetic analysis algorithm,
RAxML, which is based on the maximum likelihood method. The purpose
of this project is to optimize by accelerating some functions of RAxML which
consume more than 80% of the total execution time and especially under
the processing of big data sets. So, the first step is to research the way that
RAxML behaves according to the input data and the second step is to design
and construct hardware accelerators required for optimal performance.
These accelerators are designed to be mapped and routed on FPGAs and
also on similar platforms of the Amazons’ cloud. Finally, there is a study and
comparison between the results coming from the initial algorithm and the results that come from the accelerators. Moreover, a theoretical model is introduced
which shows the optimal performance of the accelerators and how
it can affect the overall performance of the algorithm. | en |
Content Summary | Μιά απο τις πιο ενδιαφέρουσες προκλήσεις του 21ου αιώνα, που έχουν να αντιμετωπίσουν οι επιστήμονες είναι η ραγδαία και συνεχόμενη αύξηση των δεδομένων. Πολλοί τομείς της επιστήμης και της τεχνολογίας αντιμετωπίζουν προβλήματα στην διαχείρηση και την επεξεργασία των τεράστιων δεδομένων. ́Ενας απο αυτούς τους είναι η Βιολογία. Η διαδικασία την φυλογεννετικής ανάλυσης των DNA, RNA, πρωτεϊνών και άλλων τύπων φυλεγέννεσης, καταναλώνει αρκετό χρόνο, η οποία μάλιστα παρουσιάζει και μια μη γραμμική αύξηση όσο αυξάνεται ο όγκος των δεδομένων χρήσης. Επιπλεόν δεν είναι μόνο ο χρόνος που απασχολεί τους επιστήμονες αλλά επίσης και τα υπολογιστικά συστήματα που χρειάζονται για τον παραπάνω σκοπό. ́Οχι μόνο οι προσωπικοί υπολογίστες δεν μπορούν να εξαλείψουν το πρόβλημα, αλλά ακομή και οι υπερυπολογιστές μπορούν δεν μπορούν να καλύψουν τις ανάγκες μπροστά στον υπερόγκο δεδομένων. Οι πρώτοι έχουν επεξεργαστές οι οποίοι δεν μπορούν να ξεπεράσουν ένα κατώφλι επιτάχυνσης και παραλληλισμού των εφαρμογών που θέλουμε, και οι δεύτεροι χρησιμοποιούνται μόνο για ειδικές μελέτες και υπολογισμούς. Σε αυτή την εργασία, γίνεται μια μελέτη πάνω σε έναν αλγόριθμο φυλογεννετικής ανάλυσης, RAxML, ο οποίος βασίζεται πάνω στην μέθοδο της μέγιστης πιθανοφάνειας. Ο σκοπός αυτής της εργασίας είναι να βελτιώσουμε επιταχύνοντας κάποιες συναρτήσεις του RAxML, οι οποίες καταναλώνουν περισσότερο απο το 80% του συνολικού χρόνου εκτέλεσης και ειδικά όταν βρίσκονται υπό επεξεργασία μεγάλα αρχεία δεδομένων. Οπότε, πρώτο βήμα είναι να μελετήσουμε πως συμπεριφέρεται ο RAxML ανάλογα με τα δεδομένα εισόδου και ως δεύτερο βήμα να σχεδιάσουμε και να κατασκευάσουμε επιταχυντές όπου είναι απαραίτητοι για να βελτιώσουμε την απόδοση. Αυτοί οι επιταχυντές σχεδιάζονται ώστε να εγκατασταθούν πάνω σε FPGAs αλλά και σε αντίστοιχες πλατφόρμες νέφους της Amazon. Τέλος, γίνεται μελέτη και σύγκριση των αποτελεσμάτων του αρχικού αλγορίθμου με τους αντίστοιχους επιταχυντές μας και επίσης παρουσιάζεται ένα θεωρητικό μοντέλο για το πως θα ήταν η βέλτιστη συμπεριφορά των επιταχυντών μας και ποιά η βελτίωση που θα πρόσφεραν σε συνολικό επίπεδο στον αλγόριθμο. | el |
Type of Item | Διπλωματική Εργασία | el |
Type of Item | Diploma Work | en |
License | http://creativecommons.org/licenses/by/4.0/ | en |
Date of Item | 2021-10-15 | - |
Date of Publication | 2021 | - |
Subject | Phylogenetics | en |
Subject | HPC | en |
Subject | FPGA | en |
Bibliographic Citation | Anastasios Bokalidis, "Design and Implementation of a cloud based FPGA accelerator for phylogeny reconstruction", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2021 | en |
Bibliographic Citation | Αναστάσιος Μποκαλίδης, "Σχεδιασμός και υλοποίηση ενός FPGA επιταχυντή πάνω σε νέφος για ανασυγκρότηση φυλογενετικών σχέσεων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2021 | el |