Σύνθεση μουσικών ήχων με την χρήση τεχνητών νευρωνικών δικτύων

Synthesis of Musical Sounds based on Artificial Neural Networks (english)

  1. MSc thesis
  2. Πουλάκης, Εμμανουήλ
  3. Ακουστικός Σχεδιασμός και Ψηφιακός Ήχος (ΑΣΠ)
  4. 29 September 2019 [2019-09-29]
  5. Ελληνικά
  6. 74
  7. Μουρτζόπουλος, Ιωάννης
  8. Μουρτζόπουλος, Ιωάννης | Δημούλας, Χαράλαμπος
  9. Ανατροφοδοτούμενο Νευρωνικό Δίκτυο | Μηχανική Μάθηση | Σύνθεση Μουσικών Ήχων | Τεχνητά Νευρωνικά Δίκτυα | Τεχνητή Νοημοσύνη | Υπολογιστική Νοημοσύνη | Artificial Neural Network | Machine Learning | Musical Sound Synthesis | Backpropagation Through Time | Long Short Term Memory | Computational Intelligence | Rectified Linear Unit | Recurrent Neural Network
  10. 5
  11. 4
  12. 14
  13. Κατάλογος Εικόνων Εικόνα 1 Screenshot από το διαχειριστικό περιβάλλον του Google Compute Server 29 Εικόνα 2 Spectr Εικόνα 1 Σχηματικό διάγραμμα ενός τυπικού νευρώνα 3 Εικόνα 2 Μοντέλο απλού ΤΝΔ 4 Εικόνα 3 Προσωτροφοδοτούμενο πλήρως συνδεδεμένο ΤΝΔ τριών επιπέδων 6 Εικόνα 4 Ανατροφοδοτούμενο πλήρως συνδεδεμένο ΤΝΔ (ΑΝΔ) 7 Εικόνα 5 ΤΝΔ με μηχανισμό εκπαίδευσης με επίβλεψη 8 Εικόνα 6 Εφαρμογή συνελικτικού φίλτρου σε εικόνα (Stewart, 2019) 11 Εικόνα 7 Αρχιτεκτονική ενός συνελικτικού ΤΝΔ 12 Εικόνα 8 Κόμβος LSTM 13 Εικόνα 9 Χρονική εξέλιξη του κόμβου LSTM 13 Εικόνα 10 Αρχιτεκτονική ενός Autoencoder NN 14 Εικόνα 11 Συνάρτηση σύνθεσης μουσικών ήχων 16 Εικόνα 12 Παραδείγματα διεσταλμένης συνέλιξης. Εικόνα από την δημοσίευση (Kalchbrenner et al., 2018). 21 Εικόνα 13 WaveNet Autoencoder. Εικόνα από την δημοσίευση (Kalchbrenner et al., 2018) 22 Εικόνα 14 SING LSTM ΑΝΔ 23 Εικόνα 15 Δομή του SING Autoencoder 24 Εικόνα 16 Screenshot από το διαχειριστικό περιβάλλον του Google Compute Server 29 Εικόνα 17 Spectrograms από Αρχικό, Πλήρες και Acoustic του αρχείου keyboard_acoustic_002-062-075.wav. 37 Εικόνα 18 Spectrograms από Αρχικό, Πλήρες, Acoustic και String του αρχείου string_acoustic_044-060-025.wav. 39 ograms από Αρχικό, Πλήρες και Acoustic του αρχείου keyboard_acoustic_002-062-075.wav. 37 Εικόνα 3 Spectrograms από Αρχικό, Πλήρες, Acoustic και String του αρχείου string_acoustic_044-060-025.wav. 39   Κατάλογος Πινάκων Πίνακας 1 Ενδεικτικές συλλογές δειγμάτων μουσικών ήχων για υλοποίηση ΤΝΔ 18 Πίνακας 2 Κατηγορίες δειγμάτων ως προς τη μέθοδο ηχογράφησης 19 Πίνακας 3 Οικογένεια οργάνων 19 Πίνακας 4 Περιγραφικά χαρακτηριστικά δειγμάτων 20 Πίνακας 5 Αριθμός των δειγμάτων ανά οικογένεια και τρόπο ηχογράφησης 20 Πίνακας 6 Χαρακτηριστικά τοπικού σταθμού εργασίας 28 Πίνακας 7 Σύγκριση πλήρες και acoustic μοντέλου βάσει PEAQ 36 Πίνακας 8 Σύγκριση πλήρες, acoustic και string μοντέλου βάσει PEAQ 38 Πίνακας 9 Μέγιστα, Ελάχιστα και μέσοι όροι ανά οικογένεια 41 Πίνακας 9 Αποτελέσματα τέταρτης δοκιμής 57 Κατάλογος Διαγραμμάτων Διάγραμμα 1 Βήματα υλοποίησης ΤΝΔ 26 Διάγραμμα 2 Βήματα εγκατάστασης περιβάλλοντος δοκιμών 27 Διάγραμμα 3 Βήματα εκπαίδευσης ΤΝΔ 31 Διάγραμμα 4 Διάγραμμα της σύγκρισης πλήρες και acoustic μοντέλου 37 Διάγραμμα 5 Διάγραμμα της σύγκρισης πλήρες, acoustic και string μοντέλου 39 Διάγραμμα 6 Διάγραμμα της σύγκρισης πλήρες και acoustic μοντέλου 40 Διάγραμμα 7 Σύγκριση μέσων τιμών ανά οικογένεια οργάνων 41 Διάγραμμα 8 Αποτελέσματα πέμπτης δοκιμής 42
    • Η διπλωματική εργασία αφορά στην υλοποίηση ενός συνθετητή μουσικών ήχων που βασίζεται σε ένα Τεχνητό Νευρωνικό Δίκτυο για την σύνθεση μουσικών ήχων. Το Τεχνητό Νευρωνικό Δίκτυο εκπαιδεύτηκε από διαφορετικά σύνολα παραδειγμάτων μουσικών ήχων και στην συνέχεια έγινε αξιολόγηση των παραγόμενων μουσικών ήχων σε σχέση με τα παραδείγματα της εκπαίδευσης.
    • The diploma thesis deals with the realization of a musical sound synthesizer based on an Artificial Neural Network for the Synthesis of Musical Sounds. The Artificial Neural Network was trained by different sets of musical sounds and then the generated musical sounds were evaluated in relation to the training examples.
  14. Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές