Μοντελοποίηση της Χρονικής Δυναμικής της Γονιδιακής Έκφρασης με Nευρωνικές Συνήθεις Διαφορικές Εξισώσεις

Modeling the Temporal Dynamics of Gene Expression Using Neural Ordinary Differential Equations (english)

  1. MSc thesis
  2. ΕΥΑΓΓΕΛΟΣ ΚΟΛΙΟΣ
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 07 March 2026
  5. Ελληνικά
  6. 79
  7. ΜΑΤΖΑΚΟΣ, ΝΙΚΟΛΑΟΣ
  8. Ματζάκος Νικόλαος, Χατζηνικολάου Μαρία, Βλάμος Παναγιώτης
  9. Νευρωνικές Συνήθεις Διαφορικές Εξισώσεις, γονιδιακή έκφραση, χρονοσειρές, MCF-7, EGF και HRG, δυναμική μοντελοποίηση
  10. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΝΕΥΡΟΠΛΗΡΟΦΟΡΙΚΗ/ ΒΝΠΔΕ
  11. 6
  12. 42
  13. Περιλαμβάνει Πίνακες, Διαγράμματα, εικόνες
    • Η παρούσα μεταπτυχιακή διπλωματική εργασία διερευνά τη δυνατότητα εφαρμογής των Neural Ordinary Differential Equations (Neural ODEs) στη μοντελοποίηση της χρονικής δυναμικής της γονιδιακής έκφρασης. Η ανάλυση εστιάζει σε δεδομένα χρονοσειρών από την ανθρώπινη καρκινική κυτταρική σειρά μαστού MCF-7, μετά από διέγερση με τους αυξητικούς παράγοντες Epidermal Growth Factor (EGF) και Heregulin (HRG), αξιοποιώντας το δημόσια διαθέσιμο dataset GSE13009. Οι δύο αυτές συνθήκες επιλέχθηκαν λόγω της τεκμηριωμένης διαφοροποίησης στη χρονική δυναμική της σηματοδότησης που προκαλούν, με τον EGF να οδηγεί σε παροδική και την HRG σε παρατεταμένη ενεργοποίηση σηματοδοτικών μονοπατιών.

      Αρχικά πραγματοποιήθηκε εκτενής προεπεξεργασία των δεδομένων microarray, η οποία περιλάμβανε λογαριθμικό μετασχηματισμό, διαχείριση βιολογικών επαναλήψεων, σχολιασμό probes και κατασκευή γονιδιακών χρονοσειρών έκφρασης. Στη συνέχεια, επιλεγμένα γονίδια μοντελοποιήθηκαν ανεξάρτητα με Neural ODEs, χρησιμοποιώντας τα χρονικά σημεία από 0 έως 48 ώρες για την εκπαίδευση των μοντέλων. Η ικανότητα πρόβλεψης αξιολογήθηκε στο χρονικό σημείο των 72 ωρών, το οποίο δεν συμπεριλήφθηκε στο σύνολο εκπαίδευσης.

      Τα αποτελέσματα δείχνουν ότι τα Neural ODEs επιτυγχάνουν αποτελεσματική προσαρμογή στα δεδομένα εκπαίδευσης και μπορούν να αποτυπώσουν με αξιοπιστία τη βασική δυναμική της γονιδιακής έκφρασης σε πρώιμους χρόνους.Ωστόσο, παρατηρούνται σαφείς διαφοροποιήσεις στην απόδοση πρόβλεψης μεταξύ των συνθηκών EGF και HRG, με το μοντέλο να εμφανίζει, για τη συνθήκη HRG, βελτιωμένη συμπεριφορά γενίκευσης σε μεταγενέστερους χρονικούς ορίζοντες. Η ανάλυση αναδεικνύει τη σημασία της βιολογικής ετερογένειας και των δευτερογενών ρυθμιστικών μηχανισμών στη μακροχρόνια πρόβλεψη. Συνολικά, η εργασία καταδεικνύει ότι τα Neural ODEs αποτελούν ένα υποσχόμενο και ευέλικτο πλαίσιο για τη δυναμική μοντελοποίηση γονιδιακής έκφρασης, αναδεικνύοντας παράλληλα τους περιορισμούς και τις προοπτικές για μελλοντική έρευνα.

    • This thesis investigates the application of Neural Ordinary Differential Equations (Neural ODEs) for modeling the temporal dynamics of gene expression. The analysis focuses on time-series gene expression data derived from the human breast cancer cell line MCF-7 following stimulation with Epidermal Growth Factor (EGF) and Heregulin (HRG), using the publicly available GSE13009 dataset. These two ligands were selected due to their well-established differences in signaling dynamics, with EGF inducing transient responses and HRG leading to sustained pathway activation.

      An extensive preprocessing pipeline was applied to microarray data, including logarithmic transformation, handling of biological replicates, probe annotation, and construction of gene-level expression time series. Selected genes were subsequently modeled independently using Neural ODEs, with model training performed on data from 0 to 48 hours post-stimulation. Predictive performance was evaluated at the 72-hour time point, which was not included in the training set, in order to assess the generalization capability of the dynamics learned.

      The results demonstrate that Neural ODEs achieve effective fitting within the training window and can capture the primary temporal patterns of gene expression at early time points. However, notable differences in forecasting performance were observed between the two stimulation conditions. Overall, HRG-stimulated genes exhibited improved generalization at later time points compared to EGF-stimulated genes, reflecting differences in the underlying biological dynamics. These findings highlight the increased difficulty of long-term prediction, particularly in the presence of secondary regulatory mechanisms that emerge beyond the training window.

      In summary, this study shows that Neural ODEs constitute a flexible and powerful framework for modeling continuous-time gene expression dynamics. At the same time, it underscores the impact of biological complexity on predictive accuracy and identifies key limitations and future directions for extending dynamic modeling approaches in systems biology.

  14. Hellenic Open University
  15. Αναφορά Δημιουργού 4.0 Διεθνές