Music generation with Neural Networks

Papadopoulos Argyris

URI	http://purl.tuc.gr/dl/dias/080B1644-376C-4C97-89D4-64A6A6FB51FD	-
Identifier	https://doi.org/10.26233/heallink.tuc.91691	-
Language	en	-
Extent	3.6 megabytes	en
Extent	100 pages	en
Title	Music generation with Neural Networks	en
Title	Δημιουργία μουσικής με χρήση Νευρωνικών Δικτύων	el
Creator	Papadopoulos Argyris	en
Creator	Παπαδοπουλος Αργυρης	el
Contributor [Thesis Supervisor]	Lagoudakis Michail	en
Contributor [Thesis Supervisor]	Λαγουδακης Μιχαηλ	el
Contributor [Committee Member]	Chalkiadakis Georgios	en
Contributor [Committee Member]	Χαλκιαδακης Γεωργιος	el
Contributor [Committee Member]	Petrakis Evripidis	en
Contributor [Committee Member]	Πετρακης Ευριπιδης	el
Publisher	Πολυτεχνείο Κρήτης	el
Publisher	Technical University of Crete	en
Academic Unit	Technical University of Crete::School of Electrical and Computer Engineering	en
Academic Unit	Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών	el
Content Summary	Machine Learning has been used in many applications in recent years and has produced impressive results. Interestingly, beyond well-known problems of academic, research or commercial interest, machine learning techniques are finding more and more their way into the area of arts, in the sense of generative modeling. In this thesis, we explore how deep neural networks can be used to automatically generate musical sequences. The goal of this work is to construct models that are able to learn the basic patterns of an input dataset (corresponding to a specific music genre) and try to replicate these patterns embedded into new, original samples, under the assumption that modeling and sampling may be more effective in two-dimensional image representations. To this end, we utilize well-known machine learning generative models, namely Variational Autoencoders (VAEs) and Generative Adversarial Networks (GANs), and propose our own deep network architectures maintaining simplicity and low computational power and time requirements. The implemented models are trained using datasets of MIDI files, containing tunes from different music genres, which are first converted to two-dimensional images during preprocessing. After training at image level, the trained models generate new images of a similar kind, which are decoded back to MIDI tunes, following a reverse procedure, and thus to music. MIDI files are ideal for our purposes due to their discrete nature, which facilitates the conversion to images back and forth. In the course of this work, we focused on data engineering issues, namely how to shape and form data in a way that helps our generative models learn easier and faster. We also offer a comparison of the different models and infer results on their effectiveness. The produced music tunes seem to resemble basic features of the original ones, but only in a few cases the outcome was truly interesting in terms of music theory. The proposed approach could potentially help musicians improve and explore original tunes based on preferred genres or types of music. Furthermore, our work can be used as a model for other learning tasks, not necessarily related to music, which may be facilitated, if explored through image representations, as we proposed. While our results do not generate consumer-grade music yet, our work represents a first step in the direction of automated music generation and computational creativity in general.	en
Content Summary	Η Μηχανική Μάθηση έχει χρησιμοποιηθεί σε πολλές εφαρμογές τα τελευταία χρόνια και έχει δώσει εντυπωσιακά αποτελέσματα. Είναι ενδιαφέρον ότι πέρα από τα γνωστά προβλήματα ακαδημαϊκού, ερευνητικού ή εμπορικού ενδιαφέροντος, οι τεχνικές μηχανικής μάθησης βρίσκουν όλο και περισσότερο τον δρόμο τους στον χώρο των τεχνών, με την έννοια της παραγωγικής μοντελοποίησης (generative modeling). Στην παρούσα διπλωματική εργασία, διερευνούμε πώς τα βαθιά νευρωνικά δίκτυα μπορούν να χρησιμοποιηθούν για την αυτόματη δημιουργία μουσικών ακολουθιών. Ο στόχος αυτής της εργασίας είναι η κατασκευή μοντέλων που μπορούν να μάθουν τα βασικά μοτίβα ενός συνόλου δεδομένων εισόδου (που αντιστοιχεί σε κάποιο είδος μουσικής) και να προσπαθήσουν να αναπαραγάγουν αυτά τα μοτίβα ενσωματωμένα σε νέα, πρωτότυπα δείγματα, με την υπόθεση ότι η μοντελοποίηση και η δειγματοληψία μπορεί να είναι πιο αποτελεσματική σε αναπαραστάσεις δισδιάστατων εικόνων. Για το σκοπό αυτό, χρησιμοποιούμε γνωστά μοντέλα μηχανικής μάθησης, συγκεκριμένα Variational Autoencoders (VAE) και Generative Adversarial Networks (GAN), και προτείνουμε τις δικές μας βαθιές αρχιτεκτονικές δικτύων που διατηρούν απλότητα και χαμηλές απαιτήσεις υπολογιστικής ισχύος και χρόνου. Τα μοντέλα που υλοποιήθηκαν εκπαιδεύονται χρησιμοποιώντας σύνολα δεδομένων αρχείων MIDI, που περιέχουν μελωδίες από διαφορετικά είδη μουσικής, τα οποία αρχικά μετατρέπονται σε δισδιάστατες εικόνες κατά την προεπεξεργασία. Μετά την εκπαίδευση σε επίπεδο εικόνας, τα εκπαιδευμένα μοντέλα παράγουν νέες εικόνες παρόμοιου είδους, οι οποίες αποκωδικοποιούνται σε μελωδίες MIDI, ακολουθώντας μια αντίστροφη διαδικασία, και συνεπώς σε μουσική. Τα αρχεία MIDI είναι ιδανικά για τους σκοπούς μας λόγω της διακριτής φύσης τους, η οποία διευκολύνει τη μετατροπή σε εικόνες εμπρός και πίσω. Κατά τη διάρκεια αυτής της εργασίας, εστιάσαμε σε ζητήματα επεξεργασίας δεδομένων, δηλαδή στον τρόπο διαμόρφωσης και στοίχισης δεδομένων, ώστε να βοηθά τα μοντέλα παραγωγής να μαθαίνουν ευκολότερα και γρηγορότερα. Προσφέρουμε επίσης μια σύγκριση των διαφορετικών μοντέλων και εξάγουμε συμπεράσματα σχετικά με την αποτελεσματικότητά τους. Οι μουσικές μελωδίες που παράγονται φαίνεται να προσομοιάζουν σε βασικά χαρακτηριστικά των αρχικών μελωδιών, αλλά μόνο σε λίγες περιπτώσεις το αποτέλεσμα ήταν πραγματικά ενδιαφέρον, όσον αφορά τη θεωρία της μουσικής. Η προτεινόμενη προσέγγιση θα μπορούσε ενδεχομένως να βοηθήσει τους μουσικούς να βελτιώσουν και να εξερευνήσουν πρωτότυπες μελωδίες με βάση τα προτιμώμενα είδη μουσικής. Επιπλέον, η εργασία μας μπορεί να χρησιμοποιηθεί ως πρότυπο για άλλα προβλήματα μηχανικής μάθησης, που δεν σχετίζονται απαραίτητα με τη μουσική, τα οποία μπορεί να διευκολυνθούν, εάν διερευνηθούν μέσω αναπαραστάσεων εικόνων, όπως προτείναμε. Αν και τα αποτελέσματά μας δεν παράγουν ακόμα μουσική καταναλωτικής ποιότητας, η δουλειά μας αντιπροσωπεύει ένα πρώτο βήμα προς την κατεύθυνση της αυτοματοποιημένης παραγωγής μουσικής και της υπολογιστικής δημιουργικότητας γενικότερα.	el
Type of Item	Διπλωματική Εργασία	el
Type of Item	Diploma Work	en
License	http://creativecommons.org/licenses/by/4.0/	en
Date of Item	2022-03-08	-
Date of Publication	2022	-
Subject	Deep learning	en
Subject	Generative modeling	en
Bibliographic Citation	Argyris Papadopoulos, "Music generation with Neural Networks ", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2022	en
Bibliographic Citation	Αργύρης Παπαδόπουλος, "Δημιουργία μουσικής με χρήση Νευρωνικών Δικτύων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2022	el

Search

Browse

My Space

Music generation with Neural Networks

Papadopoulos Argyris

Available Files

Services

Export

Share

Statistics

Metadata & Content in a METS Package:

Metadata in Format: