Βελτίωση της πρόβλεψης της πρώιμης νόσου του Alzheimer από δεδομένα αλληλουχίας RNA ενός κυττάρου μέσω τεχνικών μείωσης διαστάσεων

Enhancing the early Alzheimer’s Prediction from single-cell RNA-sequencing data through Dimensionality Reduction techniques (Αγγλική)

  1. MSc thesis
  2. ΠΕΤΡΟΣ ΠΑΠΛΩΜΑΤΑΣ
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 19 Φεβρουαρίου 2023
  5. Ελληνικά
  6. 90
  7. Βραχάτης, Αριστείδης
  8. Big Data, Dimensionality Reduction ,Feature Selection, Machine Learning, ScRNA-seq
  9. Βιοπληροφορική και Νευροπληροφορική
  10. 15
  11. 85
    • Η νόσος Αλτσχάιμερ είναι η συχνότερη νευροεκφυλιστική ασθένεια μεταξύ των ηλικιωμένων και προκαλεί εγκεφαλική βλάβη. Η νόσος Αλτσχάιμερ έχει ως αποτέλεσμα την προοδευτική απώλεια της νοημοσύνης και της μνήμης. Οι γενετικοί παράγοντες έχουν σημαντικό αντίκτυπο στην εμφάνιση της νόσου, καθώς ορισμένα γονίδια μπορεί να επιδεινώσουν τη νόσο χωρίς να την προκαλούν άμεσα. Η τεχνολογία της αλληλούχισης RNA ενός κυττάρου (scRNA-seq) μπορεί να παράγει μεγάλο όγκο δεδομένων. Αυτές οι μεγάλες ποσότητες δεδομένων θα ήταν ευκολότερο να διαχειριστούν εάν μπορούσαν να μειωθούν αξιόπιστα. Έχουν προταθεί πολλές μέθοδοι για να επιτευχθεί αυτό. Οι τεχνικές μείωσης διαστάσεων (DR) και επιλογής χαρακτηριστικών (FS) βρέθηκαν να είναι επωφελείς στον τομέα της έρευνας. Η μείωση διαστάσεων και η επιλογή χαρακτηριστικών χρησιμοποιήθηκαν πρόσφατα στην έρευνα για τη νόσο του Alzheimer για τη βελτίωση της απόδοσης ταξινόμησης. Όταν ο αριθμός των παρατηρήσεων είναι πολύ μικρότερος από τη διαστατικότητα των χαρακτηριστικών, η απόδοση ταξινόμησης είναι φτωχή. Ο όρος "μικρό μέγεθος δείγματος" αναφέρεται στο ζήτημα της κακής απόδοσης του ταξινομητή. Η διαστατικότητα του διανύσματος χαρακτηριστικών μπορεί να μειωθεί χρησιμοποιώντας προσεγγίσεις πολλαπλής μάθησης. Ως αποτέλεσμα, ο χειρισμός δεδομένων σχήματος σε ένα χώρο χαμηλών διαστάσεων γίνεται ευκολότερος. Οι πιο χρήσιμες πληροφορίες θα μπορούσαν να αποθηκευτούν με τη χρήση τεχνικών διαστασιολόγησης, με αποτέλεσμα τη βελτίωση της απόδοσης. Η εφαρμοσμένη προσέγγιση κέρδους πληροφορίας για τη βελτιστοποίηση της επιλογής χαρακτηριστικών μηχανικής μάθησης αποκαλύπτει ότι με τη βελτιστοποιημένη επιλογή χαρακτηριστικών, η ακρίβεια ταξινόμησης βελτιώνεται, υποδεικνύοντας ότι η μέθοδος κέρδους πληροφορίας μπορεί να χρησιμοποιηθεί για την επιλογή πιο ευαίσθητων ανατομικών περιοχών στη διάγνωση της νόσου του Alzheimer. Στη παρούσα εργασία, οι τεχνικές DR και FS επαναξιολογούνται με τη χρήση επτά διαφορετικών μεθόδων μηχανικής μάθησης (ML), με στόχο την παρουσίαση μιας σύγκρισης των επιλεγμένων μεθόδων με βάση την απόδοση του μοντέλου, τις μετρικές και την ταχύτητα.

    • Alzheimer's disease is the most common neurodegenerative illness among the elderly and causes brain damage. Alzheimer's disease results in a progressive loss of cognition and memory. Genetic factors have a significant impact on the onset of the disease, as certain genes may aggravate suffering without directly causing it. The technology of single-cell RNA sequencing (scRNA-seq) can generate a large amount of data. These large amounts of data would be easier to manage if they could be reliably reduced. Many methods have been proposed to accomplish this. Dimensionality reduction (DR) and feature selection (FS) techniques were found to be beneficial in the research field. Dimensionality reduction and feature selection have recently been used in Alzheimer's disease research to improve classification performance. When the number of observations is much lower than the dimensionality of the features, the classification performance is poor. The term "small sample size" refers to the issue of poor classifier performance. The dimensionality of the feature vector can be reduced using manifold learning approaches. As a result, manipulating shape data in a low-dimensional space becomes easier. The most useful information could be saved using dimensionality techniques, resulting in improved performance. The applied information gain approach to machine learning optimization feature selection reveals that with optimized feature selection, classification accuracy improves, indicating that the information gain method can be used to choose more sensitive anatomical regions in Alzheimer's disease diagnosis. The DR and FS techniques are re-evaluated using seven different machine learning (ML) methods, with the goal of presenting a comparison of the selected methods based on model performance, metrics, and speed.

  12. Hellenic Open University
  13. Αναφορά Δημιουργού 4.0 Διεθνές