<efrbr:recordSet xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:efrbr="http://vfrbr.info/efrbr/1.1" xmlns:efrbr-work="http://vfrbr.info/efrbr/1.1/work" xmlns:efrbr-expression="http://vfrbr.info/efrbr/1.1/expression" xmlns:efrbr-manifestation="http://vfrbr.info/efrbr/1.1/manifestation" xmlns:efrbr-person="http://vfrbr.info/efrbr/1.1/person" xmlns:efrbr-corporateBody="http://vfrbr.info/efrbr/1.1/corporateBody" xmlns:efrbr-concept="http://vfrbr.info/efrbr/1.1/concept" xmlns:efrbr-structure="http://vfrbr.info/efrbr/1.1/structure" xmlns:efrbr-responsible="http://vfrbr.info/efrbr/1.1/responsible" xmlns:efrbr-subject="http://vfrbr.info/efrbr/1.1/subject" xmlns:efrbr-other="http://vfrbr.info/efrbr/1.1/other" xsi:schemaLocation="http://vfrbr.info/efrbr/1.1 http://vfrbr.info/schemas/1.1/efrbr.xsd"><efrbr:entities><efrbr-work:work identifier="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD"><efrbr-work:titleOfTheWork>Hardware acceleration of genome assembly algorithms</efrbr-work:titleOfTheWork></efrbr-work:work><efrbr-expression:expression identifier="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD"><efrbr-expression:titleOfTheExpression>Hardware acceleration of genome assembly algorithms</efrbr-expression:titleOfTheExpression><efrbr-expression:titleOfTheExpression>Επιτάχυνση μέσω υλικού (hardware) αλγορίθμων για συστοιχία γονιδιώματος
</efrbr-expression:titleOfTheExpression><efrbr-expression:formOfExpression vocabulary="DIAS:TYPES">
            Διπλωματική Εργασία
            Diploma Work
         </efrbr-expression:formOfExpression><efrbr-expression:dateOfExpression type="issued">2021-09-14</efrbr-expression:dateOfExpression><efrbr-expression:dateOfExpression type="published">2021</efrbr-expression:dateOfExpression><efrbr-expression:languageOfExpression vocabulary="iso639-1">en</efrbr-expression:languageOfExpression><efrbr-expression:summarizationOfContent>Genome assembly is a field of bioinformatics that refers to the process of taking
small fragments of genetic material and putting them back together by
different methods in order to reconstruct the original sequence from which
the DNA originated. As the DNA input datasets has numerous data size and
in most cases has a very large amount of data, it is important to implement
functions and algorithms in order to speedup these processes and gain significant time and space reductions in complexity. The Reads Matching Filter
(RMF), which i implemented and present in this diploma thesis, is a kind of
these processes and it has a preprocessing role in the whole genome assembly
process.
The RMF takes the input dataset which contains the genetic material separated
in reads, one per line and implement a matching process between each
other in order to find unused redundancy. As the matching process executed
successfully, the unused redundancy thrown out of the dataset and remain
the output reads from the algorithm which they called intermediate contigs.
The final output file that contains these intermediate contigs has less reads
in number and bigger or equal than the input dataset’s reads in length but
without the unused redundancy and in this way the overall dataset size gets
smaller. Exploited this result, the genome assembly process take a smaller
dataset as input and as a result gain a time benefit in execution procedure.
The above algorithm implemented both in a software only and in a softwarehardware design in Field Programmable Gate Array (FPGA) in order to gain an acceleration in execution time. The outputs of my design and the original input dataset are given as input in Velvet genome assembler which based on the manipulation of de Bruijn graphs, via the removal of errors and the simplication of repeated regions, in order to process the assembly and give
the output sequences. The overall design included the genome assembly
processing gained a speedup of the order of 2x-6x ratio, with good quality in
the results between the two methods.</efrbr-expression:summarizationOfContent><efrbr-expression:summarizationOfContent>Η συστοιχία γονιδιωμάτων (Genome Assembly) είναι ένα πεδίο της βιοπληροφορικής που αναφέρεται στη διαδικασία λήψης μικρών μερών γενετικού υλικού και επανασύνδεσής τους, με διαφορετικές μεθόδους, προκειμένου να αναδημιουργηθεί η αρχική αλληλουχία από την οποία προήλθε το DNA. Δεδομένου ότι τα σύνολα δεδομένων εισόδου των DNA έχουν πολυάριθμο μέγεθος και στις περισσότερες περιπτώσεις έχει πολύ μεγάλο όγκο δεδομένων, είναι σημαντικό να εφαρμοστούν λειτουργίες και αλγόριθμοι προκειμένου να επιταχυνθούν αυτές οι διαδικασίες και να επιτευχθούν σημαντικές μειώσεις χρόνου και χώρου όσον αφορά την πολυπλοκότητά τους. Το φίλτρο ανάγνωσης (Read Matching Filter - RMF), το οποίο υλοποίησα και παρουσιάζω σε αυτή τη διπλωματική εργασία, είναι ένα είδος αυτών των διαδικασιών και έχει τον ρόλο της προεπεξεργασίας (φιλτράρισμα) των δεδομένων εισόδου σε ολόκληρη τη διαδικασία συστοιχίας γονιδιώματος.    
Το RMF παίρνει το σύνολο δεδομένων εισόδου που περιέχει το γενετικό υλικό διαχωρισμένο σε μέρη που ονομάζονται reads, ένα ανά γραμμή και εφαρμόζει μια διαδικασία αντιστοίχισης μεταξύ τους προκειμένου να βρεθεί αχρησιμοποίητος πλεονασμός. Όταν η διαδικασία αντιστοίχισης εκτελεσθεί επιτυχώς, ο αχρησιμοποίητος πλεονασμός εξαλείφεται από το σύνολο δεδομένων και παραμένει στην έξοδο της σχεδίασης τα εναπομείναντα reads τα οποία ονομάζονται ενδιάμεσα contigs. Το τελικό αρχείο εξόδου που περιέχει αυτά τα ενδιάμεσα contigs έχει λιγότερα reads σε αριθμό και μεγαλύτερα ή ίσα reads σε μήκος σε σχέση με αυτά του συνόλου δεδομένων εισόδου, αλλά χωρίς τον αχρησιμοποίητο πλεονασμό και με αυτόν τον τρόπο το συνολικό μέγεθος του συνόλου δεδομένων γίνεται μικρότερο. Αξιοποιώντας αυτό το αποτέλεσμα, η διαδικασία συναρμολόγησης γονιδιώματος λαμβάνει ένα μικρότερο σύνολο δεδομένων ως είσοδο και ως αποτέλεσμα κερδίζει ένα χρονικό όφελος στην διαδικασία εκτέλεσης.
Ο παραπάνω αλγόριθμος εφαρμόστηκε τόσο σε λογισμικό όσο και σε σχεδιασμό λογισμικού-υλικού σε Field Programmable Gate Array (FPGA) προκειμένου να επιταχυνθεί ο χρόνος εκτέλεσης. Οι έξοδοι του RMF και το αρχικό σύνολο δεδομένων εισόδου δίνονται ως είσοδος στο Velvet το οποίο βασίζεται στον χειρισμό των γραφημάτων de Bruijn, μέσω της αφαίρεσης σφαλμάτων και της απλοποίησης επαναλαμβανόμενων περιοχών, προκειμένου να επεξεργαστεί τη συναρμολόγηση και να δώσει τις ακολουθίες εξόδου. Ο συνολικός σχεδιασμός περιλάμβανε την επεξεργασία συναρμολόγησης γονιδιώματος που κέρδισε μια ταχύτητα της τάξης του 2x-6x, με καλή ποιότητα στα αποτελέσματα μεταξύ των δύο μεθόδων.</efrbr-expression:summarizationOfContent><efrbr-expression:contextForTheExpression>Διπλωματική εργασία Γαλανού Γεωργίου Σχολής ΗΜΜΥ Πολ. Κρήτης με σκοπό την λήψη του πτυχίου Ηλεκτρολόγου Μηχανικού και Μηχανικού Υπολογιστών.</efrbr-expression:contextForTheExpression><efrbr-expression:useRestrictionsOnTheExpression type="creative-commons">http://creativecommons.org/licenses/by-nc-sa/4.0/</efrbr-expression:useRestrictionsOnTheExpression><efrbr-expression:note type="academic unit">Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών</efrbr-expression:note></efrbr-expression:expression><efrbr-manifestation:manifestation identifier="http://purl.tuc.gr/dl/dias/7970357B-4BD9-455A-A17C-E8EB050232F9"><efrbr-manifestation:titleOfTheManifestation>Galanos_Georgios_Dip_2021.pdf</efrbr-manifestation:titleOfTheManifestation><efrbr-manifestation:publicationDistribution><efrbr-manifestation:placeOfPublicationDistribution type="distribution">Chania [Greece]</efrbr-manifestation:placeOfPublicationDistribution><efrbr-manifestation:publisherDistributor type="distributor">Library of TUC</efrbr-manifestation:publisherDistributor><efrbr-manifestation:dateOfPublicationDistribution>2021-09-14</efrbr-manifestation:dateOfPublicationDistribution></efrbr-manifestation:publicationDistribution><efrbr-manifestation:formOfCarrier>application/pdf</efrbr-manifestation:formOfCarrier><efrbr-manifestation:extentOfTheCarrier>1.6 MB</efrbr-manifestation:extentOfTheCarrier><efrbr-manifestation:accessRestrictionsOnTheManifestation>free</efrbr-manifestation:accessRestrictionsOnTheManifestation></efrbr-manifestation:manifestation><efrbr-person:person identifier="http://users.isc.tuc.gr/~ggalanos"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Galanos Georgios
            Γαλανος Γεωργιος
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~adollas"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Dollas Apostolos
            Δολλας Αποστολος
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="http://users.isc.tuc.gr/~mzervakis"><efrbr-person:nameOfPerson vocabulary="TUC:LDAP">
            Zervakis Michail
            Ζερβακης Μιχαηλ
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-person:person identifier="2752FB1F-7803-4948-BC3E-C8950C036264"><efrbr-person:nameOfPerson vocabulary="">
            Κωτούλας Γεώργιος
            Kotoulas Georgios
         </efrbr-person:nameOfPerson></efrbr-person:person><efrbr-corporateBody:corporateBody identifier="38A56F7C-AD51-4FF8-BB96-423CCF68C956"><efrbr-corporateBody:nameOfTheCorporateBody vocabulary="">
            Πολυτεχνείο Κρήτης
            Technical University of Crete
         </efrbr-corporateBody:nameOfTheCorporateBody></efrbr-corporateBody:corporateBody><efrbr-concept:concept identifier="C52A6094-7214-44AA-9988-FBF4F8C5D295"><efrbr-concept:termForTheConcept>
            FPGA accelerator
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="AAD80DA7-3098-4F8E-A6DA-E83988BE7E3B"><efrbr-concept:termForTheConcept>
            Genome assembly
            Συστοιχία γονιδιώματος
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="5B956560-CDAC-4F0B-A0DB-EAF8D9173489"><efrbr-concept:termForTheConcept>
            Φιλτράρισμα συνόλου δεδομένων
            Dataset filtering
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="F68D8B1D-A287-4690-A171-8BBED2335085"><efrbr-concept:termForTheConcept>
            Velvet
         </efrbr-concept:termForTheConcept></efrbr-concept:concept><efrbr-concept:concept identifier="B05DA47E-EB56-400A-AD67-F0A05008399D"><efrbr-concept:termForTheConcept>
            Γράφοι de Bruijn
            de Bruijn graphs
         </efrbr-concept:termForTheConcept></efrbr-concept:concept></efrbr:entities><efrbr:relationships><efrbr-structure:structureRelations><efrbr-structure:realizedThrough sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="expression" targetURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD"/><efrbr-structure:embodiedIn sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="manifestation" targetURI="http://purl.tuc.gr/dl/dias/7970357B-4BD9-455A-A17C-E8EB050232F9"/></efrbr-structure:structureRelations><efrbr-responsible:responsibleRelations><efrbr-responsible:createdBy sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="person" targetURI="http://users.isc.tuc.gr/~ggalanos"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="person" targetURI="http://users.isc.tuc.gr/~ggalanos" role="author"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="person" targetURI="http://users.isc.tuc.gr/~adollas" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/1"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="person" targetURI="http://users.isc.tuc.gr/~mzervakis" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/2"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="person" targetURI="2752FB1F-7803-4948-BC3E-C8950C036264" role="http://purl.tuc.gr/dl/dias/vocabs/contributor-roles/2"/><efrbr-responsible:realizedBy sourceEntity="expression" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="person" targetURI="38A56F7C-AD51-4FF8-BB96-423CCF68C956" role="publisher"/></efrbr-responsible:responsibleRelations><efrbr-subject:subjectRelations><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="concept" targetURI="C52A6094-7214-44AA-9988-FBF4F8C5D295"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="concept" targetURI="AAD80DA7-3098-4F8E-A6DA-E83988BE7E3B"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="concept" targetURI="5B956560-CDAC-4F0B-A0DB-EAF8D9173489"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="concept" targetURI="F68D8B1D-A287-4690-A171-8BBED2335085"/><efrbr-subject:hasSubject sourceEntity="work" sourceURI="http://purl.tuc.gr/dl/dias/273DCAAF-7A83-47BE-A322-77F827DDC8AD" targetEntity="concept" targetURI="B05DA47E-EB56-400A-AD67-F0A05008399D"/></efrbr-subject:subjectRelations><efrbr-other:otherRelations/></efrbr:relationships></efrbr:recordSet>