Εξαγωγή χαρακτηριστικών από εικόνες οπτικής τομογραφίας συνοχής αμφιβληστροειδούς και ταξινόμηση με αλγορίθμους επιβλεπόμενης μάθησης

Feature extraction from optical coherence tomography images and classification using supervised learning algorithms (Αγγλική)

  1. MSc thesis
  2. ΝΙΚΟΛΑΟΣ ΜΠΙΤΖΑΝΑΚΗΣ
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 20 Ιουλίου 2024
  5. Ελληνικά
  6. 155
  7. ΒΡΑΧΑΤΗΣ ΑΡΙΣΤΕΙΔΗΣ
  8. ΒΡΑΧΑΤΗΣ ΑΡΙΣΤΕΙΔΗΣ, ΜΑΡΙΟΣ ΚΡΟΚΙΔΗΣ, ΜΑΡΙΑ ΧΑΤΖΗΝΙΚΟΛΑΟΥ
  9. Οπτική τομογραφία συνοχής | εξαγωγή χαρακτηριστικών | αλγόριθμος επιβλεπόμενης μάθησης | ταξινόμηση εικόνων | χοριοειδική νεοαγγείωση | διαβητικό οίδημα ωχράς κηλίδας | Optical coherence tomography | feature extraction | supervised learning algorithm | image classification | choroidal neovascularization | diabetic macular edema
  10. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  11. 1
  12. 35
    • Η χοριοειδική νεοαγγείωση (ΧΝΑ) και το διαβητικό οίδημα ωχράς κηλίδας είναι από τα συχνότερα αίτια σοβαρής απώλειας όρασης. Η οπτική τομογραφία συνοχής (optical coherence tomography – OCT) αποτελεί εξέταση «πρώτης γραμμής» για την διάγνωση τους. Στην παρούσα διπλωματική αναπτύχθηκε ένας αλγόριθμος σε Python, ο οποίος μετά την εφαρμογή φίλτρων μείωσης θορύβου και ανίχνευσης ακμών, μπορεί να ανιχνεύσει και να απομονώσει περιοχές ενδιαφέροντος από εικόνες OCT ωχράς κηλίδας. Επιπλέον, χρησιμοποιεί τις ιδιότητες αυτών των περιοχών (μέγεθος, σχήμα κτλ.), για να εξάγει χαρακτηριστικά που μοντελοποιούν ιατρικούς βιοδείκτες, που χρησιμοποιούνται στην κλινική πράξη για την διάγνωση των παθήσεων μέσω της OCT. Εφαρμόσαμε τον αλγόριθμο σε 20.805 εικόνες που επιλέχθηκαν από μία βάση δεδομένων με εικόνες που είχαν ήδη κατηγοριοποιηθεί ως φυσιολογικές, εικόνες με ΧΝΑ ή εικόνες με διαβητικό οίδημα ωχράς. Έπειτα, χρησιμοποιήσαμε αυτά τα χαρακτηριστικά για την ταξινόμηση των εικόνων με αλγορίθμους επιβλεπόμενης μηχανικής μάθησης. Πριν την εφαρμογή των αλγορίθμων ταξινόμησης, κάναμε στατιστική ανάλυση των χαρακτηριστικών με σκοπό να ελέγξουμε αν συμβαδίζουν με τα ιατρικά δεδομένα και να υποθέσουμε ποια χαρακτηριστικά θα λάβουν υψηλό βαθμό σημαντικότητας (feature importance). Με τη βιβλιοθήκη PyCaret επιλέχθηκε και εφαρμόστηκε ο κατάλληλος αλγόριθμος ο οποίος ήταν ο LightGBM, που ανέδειξε πάνω από 91% ακρίβεια (accuracy) και 98% περιοχή κάτω από την καμπύλη (area under the ROC curve – AUC). Ακόμα, στα πλαίσια του πειράματος εξαγάγαμε στατιστικά χαρακτηριστικά που υπολογίζονται από το ιστόγραμμα μίας εικόνας και δοκιμάσαμε την απόδοση του LightGBM με χρήση μόνο αυτών, αλλά και με τον συνδυασμό τους με τα χαρακτηριστικά που εξάγει ο αλγόριθμός μας. Με χρήση μόνο των στατιστικών χαρακτηριστικών η ακρίβεια ήταν 68% και η AUC 84%, ενώ με τον συνδυασμό όλων των χαρακτηριστικών επιτεύχθηκε 92% ακρίβεια και 98% AUC. Με βάση τα θετικά αποτελέσματα της μελέτης, ο αλγόριθμός που αναπτύξαμε θα μπορούσε να ενσωματωθεί σε ένα προηγμένο αυτοματοποιημένο σύστημα, για την διαλογή ασθενών με παθήσεις ωχράς κηλίδας που χρειάζονται παραπομπή για αντιμετώπιση.

    • Choroidal neovascularization (CNV) and diabetic macular edema (DME) are two of the most common causes of severe visual loss. The first-line diagnostic examination for these two conditions is the optical coherence tomography (OCT). In this thesis, we developed an algorithm using Python that, after applying noise reduction and edge detection filters, detects and isolates certain areas of interest from OCT images of the macula. Additionally, by utilizing the properties of these areas (size, shape, etc.), the algorithm can extract features that correspond to medical biomarkers used in clinical practice for diagnosing these conditions using OCT images. We applied this algorithm on 20.805 images selected from a database, which were pre-labeled as CNV, DME or normal. Using the extracted features we attempted to classify these images with supervised machine learning algorithms. Prior to applying the machine learning algorithms, we conducted a statistical analysis of the extracted features to verify their concordance with current medical knowledge and to also hypothesize which of these features might get a high score in the feature importance scale. In order to select and apply the proper machine learning algorithm we used the PyCaret library. The selected algorithm was LightGBM which achieved over 91% accuracy and 98% area under the ROC curve (AUC). As part of our experiment, we also extracted statistical features calculated from the histogram of an image using the PyFeats library and we applied LightGBM to these features alone and in combination with the features extracted by our algorithm. Using only the statistical features, LightGBM demonstrated 68% accuracy and 84% AUC. When combining both sets of features it achieved 92% accuracy and 98% AUC. These positive results, suggest that the algorithm that we developed could be integrated into an advanced automated patient screening tool for macular diseases requiring referral for treatment.

  13. Hellenic Open University
  14. Αναφορά Δημιουργού 4.0 Διεθνές