URI | http://purl.tuc.gr/dl/dias/D8B034D2-F3EE-4A4E-8B25-1C4AFC513C6F | - |
Identifier | https://doi.org/10.26233/heallink.tuc.93345 | - |
Language | en | - |
Extent | 13.9 megabytes | en |
Extent | 85 pages | en |
Title | Motion capture generation from videos through Neural networks | en |
Title | Παραγωγή καταγραμμένης κίνησης από βίντεο με χρήση Νευρωνικών δικτύων | el |
Creator | Christodoulidis Kyriakos | en |
Creator | Χριστοδουλιδης Κυριακος | el |
Contributor [Thesis Supervisor] | Mania Aikaterini | en |
Contributor [Thesis Supervisor] | Μανια Αικατερινη | el |
Contributor [Committee Member] | Chalkiadakis Georgios | en |
Contributor [Committee Member] | Χαλκιαδακης Γεωργιος | el |
Contributor [Committee Member] | Lagoudakis Michail | en |
Contributor [Committee Member] | Λαγουδακης Μιχαηλ | el |
Publisher | Πολυτεχνείο Κρήτης | el |
Publisher | Technical University of Crete | en |
Academic Unit | Technical University of Crete::School of Electrical and Computer Engineering | en |
Academic Unit | Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
Description | Διπλωματική Εργασία | el |
Content Summary | Motion capture methods are either very expensive to acquire or of poor quality.
Thus, we propose an innovative method that will give access to everyone who has an
above-average computer, to generate for free their single-person digital motion clips.
Recently, many researchers try to use neural networks that estimate the 3D human
pose from a single video. In our approach, we decided to use three different well-known
pre-trained models, the first two to find the 2D pose estimation from each frame of the
video, and the other to convert these 2D poses into 3D poses. Then, we estimated the
position of the human per frame, by calculating the depth of the person in the image.
The combination of the 3D poses and the position consist the motion data that we
wanted to find. Then, by importing these data into a Skeleton that contains all the
estimated bones, we can create a Bio-vision Hierarchy (BVH) file, that can be imported
into the 3D computer graphics software tool-set. At this point, the generated BVH file
contains noise from the neural networks, so we propose using some filters to remove
this noise without affecting significantly the motion data information. Furthermore,
we converted the raw python code into a Windows Application to create a friendly
user environment. Finally, we created some functions within this application so that
the user can visually, process and edit the results from the BVH files. | en |
Content Summary | Οι μέθοδοι λήψης κίνησης είναι είτε πολύ δαπανηρές στην απόκτηση είτε χαμηλότερης ποιότητας. Έτσι, προτείνουμε μια καινοτόμο μέθοδο που θα δώσει πρόσβαση σε όλους όσους διαθέτουν έναν σχετικά καλό υπολογιστή, για να δημιουργήσουν δωρεάν τα ψηφιακά κλιπ κίνησης ενός ατόμου. Πρόσφατα, πολλοί ερευνητές προσπαθούν να χρησιμοποιήσουν νευρωνικά δίκτυα που θα εκτιμήσουν την τρισδιάστατη ανθρώπινη στάση από ένα μόνο βίντεο. Στην προσέγγισή μας, αποφασίσαμε να χρησιμοποιήσουμε τρία διαφορετικά γνωστά προ-εκπαιδευμένα μοντέλα, τα δύο πρώτα για να βρούμε την εκτίμηση 2D πόζας από κάθε καρέ του βίντεο και το άλλο για να μετατρέψουμε αυτές τις 2D στάσεις σε 3D πόζες. Στη συνέχεια, υπολογίσαμε τη θέση του ανθρώπου ανά καρέ, βρίσκοντας το βάθος του ατόμου στην εικόνα. Ο συνδυασμός των τρισδιάστατων στάσεων και της θέσης του ατόμου στο χώρο είναι τα δεδομένα κίνησης που θέλαμε να βρούμε. Στη συνέχεια, εισάγοντας αυτά τα δεδομένα σε έναν Σκελετό που περιέχει όλα τα εκτιμώμενα οστά, μπορούμε να δημιουργήσουμε ένα αρχείο Bio-vision Hierarchy (BVH), το οποίο μπορεί να εισαχθεί στο σε όλες τις εφαρμογές που επεξεργάζονται τρισδιάστατα γραφικά. Σε αυτό το σημείο, το αρχείο BVH που δημιουργείται περιέχει θόρυβο από τις εκτιμήσεως των νευρωνικών δικτύων, επομένως προτείνουμε τη χρήση ορισμένων φίλτρων για την αφαίρεση αυτού του θορύβου χωρίς να επηρεάζονται οι πληροφορίες δεδομένων κίνησης. Επιπλέον, μετατρέψαμε τον κώδικα python σε μια Windows εφαρμογή για να δημιουργήσουμε ένα πολύ πιο φιλικό περιβάλλον στο χρήστη. Τέλος, δημιουργήσαμε κάποιες λειτουργίες μέσα σε αυτήν την εφαρμογή ώστε ο χρήστης να μπορεί να απεικονίζει και να επεξεργάζεται τα αποτελέσματα από τα αρχεία BVH. | el |
Type of Item | Διπλωματική Εργασία | el |
Type of Item | Diploma Work | en |
License | http://creativecommons.org/licenses/by/4.0/ | en |
Date of Item | 2022-09-15 | - |
Date of Publication | 2022 | - |
Subject | Neural Networks | en |
Subject | Motion Capture | en |
Bibliographic Citation | Kyriakos Christodoulidis, "Motion capture generation from videos through Neural networks", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2022 | en |
Bibliographic Citation | Κυριάκος Χριστοδουλίδης, "Παραγωγή καταγραμμένης κίνησης από βίντεο με χρήση Νευρωνικών δικτύων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2022 | el |