Ανατροφοδοτούμενο Νευρωνικό Δίκτυο | Μηχανική Μάθηση | Σύνθεση Μουσικών Ήχων | Τεχνητά Νευρωνικά Δίκτυα | Τεχνητή Νοημοσύνη | Υπολογιστική Νοημοσύνη | Artificial Neural Network | Machine Learning | Musical Sound Synthesis | Backpropagation Through Time | Long Short Term Memory | Computational Intelligence | Rectified Linear Unit | Recurrent Neural Network
5
4
14
Κατάλογος Εικόνων
Εικόνα 1 Screenshot από το διαχειριστικό περιβάλλον του Google Compute Server 29
Εικόνα 2 Spectr
Εικόνα 1 Σχηματικό διάγραμμα ενός τυπικού νευρώνα 3
Εικόνα 2 Μοντέλο απλού ΤΝΔ 4
Εικόνα 3 Προσωτροφοδοτούμενο πλήρως συνδεδεμένο ΤΝΔ τριών επιπέδων 6
Εικόνα 4 Ανατροφοδοτούμενο πλήρως συνδεδεμένο ΤΝΔ (ΑΝΔ) 7
Εικόνα 5 ΤΝΔ με μηχανισμό εκπαίδευσης με επίβλεψη 8
Εικόνα 6 Εφαρμογή συνελικτικού φίλτρου σε εικόνα (Stewart, 2019) 11
Εικόνα 7 Αρχιτεκτονική ενός συνελικτικού ΤΝΔ 12
Εικόνα 8 Κόμβος LSTM 13
Εικόνα 9 Χρονική εξέλιξη του κόμβου LSTM 13
Εικόνα 10 Αρχιτεκτονική ενός Autoencoder NN 14
Εικόνα 11 Συνάρτηση σύνθεσης μουσικών ήχων 16
Εικόνα 12 Παραδείγματα διεσταλμένης συνέλιξης. Εικόνα από την δημοσίευση (Kalchbrenner et al., 2018). 21
Εικόνα 13 WaveNet Autoencoder. Εικόνα από την δημοσίευση (Kalchbrenner et al., 2018) 22
Εικόνα 14 SING LSTM ΑΝΔ 23
Εικόνα 15 Δομή του SING Autoencoder 24
Εικόνα 16 Screenshot από το διαχειριστικό περιβάλλον του Google Compute Server 29
Εικόνα 17 Spectrograms από Αρχικό, Πλήρες και Acoustic του αρχείου keyboard_acoustic_002-062-075.wav. 37
Εικόνα 18 Spectrograms από Αρχικό, Πλήρες, Acoustic και String του αρχείου string_acoustic_044-060-025.wav. 39
ograms από Αρχικό, Πλήρες και Acoustic του αρχείου keyboard_acoustic_002-062-075.wav. 37
Εικόνα 3 Spectrograms από Αρχικό, Πλήρες, Acoustic και String του αρχείου string_acoustic_044-060-025.wav. 39
Κατάλογος Πινάκων
Πίνακας 1 Ενδεικτικές συλλογές δειγμάτων μουσικών ήχων για υλοποίηση ΤΝΔ 18
Πίνακας 2 Κατηγορίες δειγμάτων ως προς τη μέθοδο ηχογράφησης 19
Πίνακας 3 Οικογένεια οργάνων 19
Πίνακας 4 Περιγραφικά χαρακτηριστικά δειγμάτων 20
Πίνακας 5 Αριθμός των δειγμάτων ανά οικογένεια και τρόπο ηχογράφησης 20
Πίνακας 6 Χαρακτηριστικά τοπικού σταθμού εργασίας 28
Πίνακας 7 Σύγκριση πλήρες και acoustic μοντέλου βάσει PEAQ 36
Πίνακας 8 Σύγκριση πλήρες, acoustic και string μοντέλου βάσει PEAQ 38
Πίνακας 9 Μέγιστα, Ελάχιστα και μέσοι όροι ανά οικογένεια 41
Πίνακας 9 Αποτελέσματα τέταρτης δοκιμής 57
Κατάλογος Διαγραμμάτων
Διάγραμμα 1 Βήματα υλοποίησης ΤΝΔ 26
Διάγραμμα 2 Βήματα εγκατάστασης περιβάλλοντος δοκιμών 27
Διάγραμμα 3 Βήματα εκπαίδευσης ΤΝΔ 31
Διάγραμμα 4 Διάγραμμα της σύγκρισης πλήρες και acoustic μοντέλου 37
Διάγραμμα 5 Διάγραμμα της σύγκρισης πλήρες, acoustic και string μοντέλου 39
Διάγραμμα 6 Διάγραμμα της σύγκρισης πλήρες και acoustic μοντέλου 40
Διάγραμμα 7 Σύγκριση μέσων τιμών ανά οικογένεια οργάνων 41
Διάγραμμα 8 Αποτελέσματα πέμπτης δοκιμής 42
Η διπλωματική εργασία αφορά στην υλοποίηση ενός συνθετητή μουσικών ήχων που βασίζεται σε ένα Τεχνητό Νευρωνικό Δίκτυο για την σύνθεση μουσικών ήχων. Το Τεχνητό Νευρωνικό Δίκτυο εκπαιδεύτηκε από διαφορετικά σύνολα παραδειγμάτων μουσικών ήχων και στην συνέχεια έγινε αξιολόγηση των παραγόμενων μουσικών ήχων σε σχέση με τα παραδείγματα της εκπαίδευσης.
The diploma thesis deals with the realization of a musical sound synthesizer based on an Artificial Neural Network for the Synthesis of Musical Sounds. The Artificial Neural Network was trained by different sets of musical sounds and then the generated musical sounds were evaluated in relation to the training examples.