Εφαρμογές Μηχανικής Μάθησης στη Νόσο του Parkinson

Applications of Machine Learning in Parkinson’s Disease (english)

  1. MSc thesis
  2. ΜΑΡΙΝΑ ΙΩΑΝΝΟΥ
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 07 March 2026
  5. Ελληνικά
  6. 29
  7. Κουμάκης, Ελευθέριος
  8. Βλάμος Παναγιώτης, Δημητρακόπουλος Γεώργιος
  9. Νόσος του Parkinson, Μηχανική μάθηση, Βαθιά μάθηση, Πολυ-ομικά δεδομένα, Βιοδείκτες, Συστηματική ανασκόπηση, PRISMA
  10. Αλγόριθμοι Βιοπληροφορικής
  11. 7
  12. 32
    • Η νόσος του Parkinson (PD) αποτελεί μία κλινικά ετερογενή νευροεκφυλιστική διαταραχή, για την οποία εξακολουθεί να υπάρχει έλλειψη αξιόπιστων μοριακών βιοδεικτών για την πρώιμη διάγνωση, τη διαστρωμάτωση των ασθενών και την πρόγνωση. Οι τεχνολογίες omics υψηλής διαστασιμότητας (γονιδιωματική, μεταγραφωμική, πρωτεωμική, μεταβολωμική και μικροβιωματική) προσφέρουν μία συστημική προσέγγιση στη βιολογία της νόσου, αλλά δημιουργούν σημαντικές αναλυτικές προκλήσεις λόγω θορύβου, batch effects και δυσμενούς αναλογίας χαρακτηριστικών προς δείγματα. Οι μέθοδοι μηχανικής μάθησης (ML) και βαθιάς μάθησης (DL) έχουν αναδειχθεί σε βασικά εργαλεία για την εξαγωγή προγνωστικών σημάτων, την ιεράρχηση υποψήφιων βιοδεικτών και τη σύνδεση μοριακών υπογραφών με κλινικά αποτελέσματα. 

      Η παρούσα διπλωματική εργασία παρουσιάζει μία συστηματική ανασκόπηση εφαρμογών ML/DL στη νόσο του Parkinson με χρήση δημόσια διαθέσιμων δεδομένων omics. Μέσω δομημένης αναζήτησης στις βάσεις Scopus και PubMed εντοπίστηκαν 1.223 εγγραφές, οι οποίες μετά από αφαίρεση διπλοτύπων και διαλογή περιορίστηκαν σε 155 επιλέξιμα πλήρη άρθρα. Είκοσι εννέα (29) μελέτες που πληρούσαν τα κριτήρια ένταξης (εστίαση στη PD, χρήση ML/DL, δεδομένα omics και δημόσια διαθεσιμότητα) συμπεριλήφθηκαν στην ποιοτική σύνθεση. Η μεταγραφωμική κυριαρχεί στη βιβλιογραφία, ακολουθούμενη από τη γονιδιωματική, την πρωτεωμική, τη μεταβολωμική και τη μικροβιωματική. Στις περισσότερες μελέτες εφαρμόζονται κλασικοί αλγόριθμοι ταξινόμησης σε συνδυασμό με επιλογή χαρακτηριστικών, ενώ μικρότερος αριθμός αξιοποιεί αρχιτεκτονικές βαθιάς μάθησης με έμφαση στην ερμηνευσιμότητα. 

      Συνολικά, τα αποτελέσματα δείχνουν ότι οι μέθοδοι ML/DL μπορούν να επιτύχουν αξιόλογη διακριτική ικανότητα και να αναδείξουν βιολογικά ερμηνεύσιμους υποψήφιους δείκτες. Παράλληλα, παραμένουν σημαντικοί περιορισμοί, όπως μικρά μεγέθη δειγμάτων, περιορισμένη εξωτερική επικύρωση και ελλιπής αναφορά μεθοδολογικών λεπτομερειών. Τα ευρήματα αναδεικνύουν την ανάγκη για τυποποιημένη συγκριτική αξιολόγηση (benchmarking), σαφή και πλήρη τεκμηρίωση/αναφορά μεθόδων και αποτελεσμάτων, καθώς και ολοκληρωτική πολυ-ομική μοντελοποίηση (multi-omics), ώστε να ενισχυθούν η αναπαραγωγιμότητα και ο μεταφραστικός αντίκτυπος. 

    • Parkinson’s disease (PD) is a clinically heterogeneous neurodegenerative disorder for which there remains a lack of reliable molecular biomarkers for early diagnosis, patient stratification, and prognosis. High-dimensional omics technologies (genomics, transcriptomics, proteomics, metabolomics, and microbiome profiling) provide a systems-level approach to the biology of the disease, but they pose substantial analytical challenges due to noise, batch effects, and an unfavorable feature-to-sample ratio. Machine learning (ML) and deep learning (DL) methods have emerged as key tools for extracting predictive signals, prioritizing candidate biomarkers, and linking molecular signatures to clinical outcomes. 

      This master’s thesis presents a systematic review of ML/DL applications in Parkinson’s disease using publicly available omics datasets. Through a structured search of the Scopus and PubMed databases, 1,223 records were identified; following deduplication and screening, 155 eligible full-text articles were retained. Twenty-nine (29) studies meeting the inclusion criteria (focus on PD, use of ML/DL, omics data, and public availability) were included in the qualitative synthesis. Transcriptomics predominates in the literature, followed by genomics, proteomics, metabolomics, and microbiome-related studies. In most studies, classical classification algorithms are applied in combination with feature selection, whereas a smaller number leverage deep learning architectures with an emphasis on interpretability. 

      Overall, the findings indicate that ML/DL approaches can achieve notable discriminatory performance and highlight biologically interpretable candidate markers. At the same time, important limitations remain, including small sample sizes, limited external validation, and insufficient reporting of methodological details. The results underscore the need for standardized benchmarking, clear and comprehensive reporting of methods and results, and integrative multi-omics modeling to enhance reproducibility and translational impact. 

  13. Hellenic Open University
  14. Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές