Η πρόοδος των τελευταίων ετών στον τομέα της βαθιάς μάθησης και μηχανικής
μάθησης, έδωσε το έναυσμα για την εφαρμογή των μεθόδων αυτών σε πολλά
επιστημονικά πεδία. Πολλές φορές, η εφαρμογή των μεθόδων αυτών σε πεδία
διαφορετικά της επιστήμης της πληροφορικής, όπως για παράδειγμα η ιατρική, η
σεισμολογία, η ανάλυση φυσικής γλώσσας, η ανίχνευση απάτης και σε πολλές άλλες,
έχει δώσει εντυπωσιακά αποτελέσματα.
Η επιληψία είναι μία πάθηση που αφορά εκατομμύρια ανθρώπους σε παγκόσμιο
επίπεδο. Η ανίχνευση και διάγνωση των επιληπτικών κρίσεων είναι μία διαδικασία
χρονοβόρα και απαιτητική καθώς απαιτεί την παρουσία εξειδικευμένου ιατρικού και
τεχνολογικού προσωπικού για την σωστή εκτέλεση και διάγνωση της διαγνωστικής
εξέτασης που ονομάζεται εγκεφαλογράφημα. Συχνά, είναι αναγκαία η πολύωρη
καταγραφή των εγκεφαλικών ηλεκτρικών σημάτων που ανιχνεύονται στο
εγκεφαλογράφημα έτσι ώστε να εντοπιστούν εκφορτίσεις επιληπτικής μορφής.
Οι εφαρμογή μεθόδων βαθιάς και μηχανικής μάθησης με σκοπό την αυτοματοποιημένη
διάγνωση της ύπαρξης επιληπτικών εκφορτίσεων στο εγκεφαλογράφημα βρίσκεται σε
φάση ερευνητικής εξέλιξης. Έχουν προταθεί διάφορες μέθοδοι που βελτιώνουν την
ακρίβεια και την αξιοπιστία της πρόβλεψης με σκοπό την ελαχιστοποίηση του
σφάλματος διάγνωσης. Υπάρχουν διαθέσιμα στο κοινό κάποια σύνολα δεδομένων
εγκεφαλογραφημάτων στα οποία έχουν αποδοθεί ετικέτες διάγνωσης από
εξειδικευμένο προσωπικό. Από τα πιο πλήρη (σε αριθμό ασθενών και όγκο δεδομένων)
και μελετημένα σύνολα δεδομένων είναι το CHB-MIT που προέρχεται από το
νοσοκομείο παίδων της Βοστώνης.
Στην παρούσα μελέτη εξετάζεται η εφαρμογή και βελτιστοποίηση μεθόδων βαθιάς και
μηχανικής μάθησης με σκοπό την βελτίωση της απόδοσής τους πάνω στο σύνολο
δεδομένων CHB-MIT. Το σύνολο δεδομένων αυτό, δίνεται όπως είναι, δηλαδή
παρέχονται πολύωρες καταγραφές εγκεφαλογραφημάτων χωρίς καμία επεξεργασία.
Έτσι, αρχικά γίνεται εκτενής προ-επεξεργασία του συνόλου δεδομένων έτσι ώστε να
δομηθεί σωστά το σύνολο δεδομένων και να ανιχνευτούν με κατάλληλες τεχνικές οι
ακραίες τιμές, σκοπό την καταλληλότητά του για την εκπαίδευση μεθόδων βαθιάς και
Θεόδωρος Χασάνδρας, «Τεχνικές Βαθιάς και
Μηχανικής Μάθησης καθώς και Νευρωνικών Δικτύων
για την Αυτόματη Διάγνωση νευρολογικών νόσων»
vi
μηχανικής μάθησης. Συγκεκριμένα εφαρμόζονται εξειδικευμένες τεχνικές
ισοστάθμισης του δείγματος, επαύξησης των δεδομένων, φιλτραρίσματος της σήματος
του εγκεφαλογραφήματος, μετατροπής του μονοδιάστατου σήματος σε δισδιάστατο,
εξαγωγής χαρακτηριστικών από το σήμα για τη χρήση τους σε μεθόδους μηχανικής
μάθησης ,όπως και τεχνικές ανίχνευσης των ακραίων τιμών.
Ακολούθως, εξετάζεται η παραμετροποίηση των παραμέτρων των μοντέλων βαθιάς
και μηχανικής μάθησης με σκοπό τη βελτίωση των δεικτών απόδοσης. Δίνεται
ιδιαίτερη βαρύτητα στην παραμετροποίηση και βελτιστοποίηση της δομής των
μοντέλων βαθιάς μάθησης. Συγκεκριμένα, εξετάζεται η εφαρμογή συνελικτικών
νευρωνικών δικτύων, καθώς είναι πια αποδεκτό ότι οι μέθοδοι αυτές δίνουν
καλύτερους δείκτες απόδοσης σε σχέση με τις υπάρχουσες μεθόδους μηχανικής
μάθησης. Το αρνητικό σημείο των μεθόδων βαθιάς μάθησης είναι ότι απαιτούν
αυξημένο σύνολο δεδομένων εκπαίδευσης και αρκετά μεγαλύτερο χρόνο εκπαίδευσης
σε σχέση με τις μεθόδους μηχανικής μάθησης.
The progress of the last years in the field of deep learning and machine learning, gave
the impetus for the application of these methods in many scientific fields. Many times,
the application of these methods in fields other than computer science, such as
medicine, seismology, natural language analysis, fraud detection and many others, has
yielded impressive results.
Epilepsy is a disease that affects millions of people worldwide. Detection and diagnosis
of seizures is a time consuming and demanding process as it requires the presence of
specialized medical and technological personnel for the correct execution and diagnosis
of the diagnostic test called encephalogram. It is often necessary to record the brain
electrical signals detected on the encephalogram for many hours in order to detect
epileptic discharges.
The application of deep and machine learning methods in order to automate the
diagnosis of the presence of epileptic discharges in the encephalogram is in a phase of
research development. Various methods have been proposed to improve the accuracy
and reliability of the prediction in order to minimize diagnostic error. There are some
encephalogram data sets available to the public to which diagnostic labels have been
assigned by qualified personnel. One of the most complete (in number of patients and
volume of data) and studied datasets is CHB-MIT from Boston Children's Hospital.
The present study examines the implementation and optimization of deep and machine
learning methods in order to improve their performance on the CHB-MIT data set. This
data set is given as it is, ie long hours of encephalogram recordings are provided without
any processing. Thus, initially the data set is extensively pre-processed so that the data
set is properly structured and the outliers are detected with appropriate techniques, in
order to be suitable for the training of deep and machine learning methods. Specifically,
special techniques are used to make a balanced dataset, augment the data, filter the
signal of the encephalogram, convert the one-dimensional signal to two-dimensional,
extract characteristics from the signal for use in machine learning methods, as well as
techniques for detecting outliers.
Θεόδωρος Χασάνδρας, «Τεχνικές Βαθιάς και
Μηχανικής Μάθησης καθώς και Νευρωνικών Δικτύων
για την Αυτόματη Διάγνωση νευρολογικών νόσων»
viii
Next, the parameterization of the deep and machine learning models is examined in
order to improve the performance indicators. Particular emphasis is given to the
parameterization and optimization of the structure of deep learning models.
Specifically, the application of convolutional neural networks is being examined, as it
is now accepted that these methods give better performance indicators than the existing
machine learning methods. The downside of deep learning methods is that they require
an increased set of training data and much longer training time compared to machine
learning methods.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Τεχνικές Βαθιάς και Μηχανικής Μάθησης καθώς και Νευρωνικών Δικτύων για την Αυτόματη Διάγνωση νευρολογικών νόσων Περιγραφή: 143015_ΧΑΣΑΝΔΡΑΣ_ΘΕΟΔΩΡΟΣ.pdf (pdf)
Book Reader Πληροφορίες: Κυρίως σώμα διπλωματικής Μέγεθος: 2.9 MB
Τεχνικές Βαθιάς και Μηχανικής Μάθησης καθώς και Νευρωνικών Δικτύων για την Αυτόματη Διάγνωση νευρολογικών νόσων - Identifier: 160312
Internal display of the 160312 entity interconnections (Node labels correspond to identifiers)