Application of Machine Learning Methods for the Diagnosis of Mental Disorders

Εφαρμογή Μεθόδων Μηχανικής Μάθησης για τη Διάγνωση Ψυχικών Διαταραχών (Ελληνική)

  1. MSc thesis
  2. ΑΝΑΣΤΑΣΙΑ ΜΑΡΙΑ ΒΙΤΣΙΟΥ
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 10 Μαρτίου 2025
  5. Αγγλικά
  6. 55
  7. Θεμιστοκλής Έξαρχος
  8. Βλάμος Παναγιώτης, Κροκίδης Μάριος, Έξαρχος Θεμιστοκλής
  9. Schizophrenia (SCZ), Bipolar Disorder (BD), Gene Expression Data, Machine Learning (ML), SHAP Analysis, Biomarkers for Psychiatric Disor- ders, Neurobiological Pathways
  10. ΒΝΠΔΕ
  11. 57
  12. Application of Machine Learning Methods for the Diagnosis of Mental Disorders/ Anastasia Maria Vitsiou
    • Schizophrenia (SCZ) and Bipolar Disorder (BD) are severe psychiatric disorders that significantly impact individuals’ well-being and functionality. The accurate diagnosis of these conditions remains a challenge due to overlapping symptoma- tology, a lack of definitive biomarkers, and limitations in traditional classification systems. This study leverages machine learning (ML) techniques to enhance the diagnostic accuracy of SCZ and BD using gene expression data. An XGBoost clas- sifier was employed to perform multiclass classification on an imbalanced dataset, distinguishing between SCZ, BD, and healthy controls. The study utilized a strati- fied 5-fold cross-validation approach to ensure robust evaluation, with performance metrics including accuracy, precision, recall, F1-score, and ROC-AUC.

      The results demonstrated the model’s effectiveness, achieving an accuracy of 92.87% on the imbalanced dataset and 90% on the balanced dataset. Feature importance analysis using SHAP identified 90 key genes associated with SCZ and BD, with enrichment analyses revealing significant biological pathways, including glutamate receptor signalling and neuropeptide regulation. The findings highlight the potential of ML-driven genetic analysis to provide more objective diagnostic tools, complementing traditional clinical assessments.

    • Η σχιζοφρένεια και η διπολική διαταραχή είναι σοβαρές ψυχιατρικές παθήσεις που επηρεάζουν σημαντικά την ευημερία και τη λειτουργικότητα των ατόμων. Η ακριβής διάγνωσή τους παραμένει πρόκληση λόγω της επικάλυψης της συμπτωματολογίας, της έλλειψης καθοριστικών βιοδεικτών και των περιορισμών των παραδοσιακών συστη- μάτων ταξινόμησης. Η παρούσα μελέτη αξιοποιεί τεχνικές μηχανικής μάθησης για τη βελτίωση της διαγνωστικής ακρίβειας της σχιζοφρένειας και της διπολικής διαταρα- χής, χρησιμοποιώντας δεδομένα γονιδιακής έκφρασης. ́Ενας ταξινομητής XGBoost εφαρμόστηκε για την πολυκατηγορική ταξινόμηση σε ένα μη ισορροπημένο σύνολο δεδομένων, για τη διάκριση μεταξύ σχιζοφρένειας, διπολικής διαταραχής και υγιών ατόμων. Η μελέτη χρησιμοποίησε stratified 5-fold cross-validation για τη διασφάλιση αξιόπιστης αξιολόγησης, με δείκτες απόδοσης όπως η ακρίβεια (accuracy), η επανα- κλησιμότητα (recall), η ακρίβεια πρόβλεψης (precision), το F1-score και η ROC-AUC.

      Τα αποτελέσματα ανέδειξαν την αποτελεσματικότητα του μοντέλου, επιτυγχάνο- ντας ακρίβεια 92,87% στο μη ισορροπημένο σύνολο δεδομένων και 90% στο ισορρο- πημένο. Η ανάλυση της συνεισφοράς των χαρακτηριστικών μέσω SHAP αποκάλυψε 90 βασικά γονίδια που σχετίζονται με τη σχιζοφρένεια και τη διπολική διαταραχή, ενώ οι αναλύσεις εμπλουτισμού ανέδειξαν σημαντικές βιολογικές οδούς, συμπεριλαμ- βανομένων της σηματοδότησης των υποδοχέων γλουταμινικού και της ρύθμισης των νευροπεπτιδίων. Τα ευρήματα αναδεικνύουν τη δυνατότητα συνδυασμού της γενετι- κής ανάλυσης με τεχνικές μηχανικής μάθησης για την ανάπτυξη αντικειμενικότερων διαγνωστικών εργαλείων, ενισχύοντας και συμπληρώνοντας τις παραδοσιακές κλινικές αξιολογήσεις.

  13. Hellenic Open University
  14. Αναφορά Δημιουργού 4.0 Διεθνές