- MSc thesis
- Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
- 19 Φεβρουαρίου 2023
- Ελληνικά
- 55
- ΗΛΙΑΣ ΛΑΓΚΟΥΒΑΡΔΟΣ
- χρονοσειρές, μικροβίωμα, Cronos, MDITRE, MegaR
- ΠΡΩΤΕΟΜΙΚΗ, ΓΕΝΩΜΙΚΗ ΚΑΙ ΓΟΝΙΔΙΩΜΑΤΙΚΗ
- 2
- 46
-
-
Η παρούσα εργασία αφορά τη βιβλιογραφική ανασκόπηση λογισμικού μηχανικής μάθησης, το οποίο αναπτύχθηκε και εφαρμόστηκε στη μελέτη χρονοσειρών βρεφικού εντερικού μικροβιώματος.
Το ανθρώπινο εντερικό μικροβίωμα, βρίσκεται σε συνεχή, αναγκαστική συμβίωση και αλληλεπίδραση με τον ανθρώπινο οργανισμό. Παρέχει ουσιαστική συμμετοχή στη πέψη της τροφής, όπως την πέψη των υδατανθράκων, των βιταμινών, των αμινοξέων και των λιπαρών οξέων, καθώς και στη σωστή ανάπτυξη του πεπτικού, του ανοσοποιητικού και νευρολογικού συστήματος του βρέφους.
Τα λογισμικά που αναλύονται παρακάτω είναι το MDITRE, ο CRONOS και το MegaR.
Το MDITRE είναι μία μέθοδος Bayesian μηχανικής μάθησης, και λαμβάνει ως εισαγωγή την δυαδική κατάσταση των ξενιστών (ασθενής/υγιής), έναν πίνακα διαμήκων μικροβιακών σχετικών αφθονιών, είτε ως OTUs είτε ως AVS, από αλληλούχιση ή τάξεις φυλογενετικές από shotgun και έναν πίνακα αποστάσεων ανά ζεύγος (φυλογενετικό πίνακα αποστάσεων). Ο
Cronos είναι ένας αλγόριθμος γραμμένος σε γλώσσα R (R script) έχοντας στη λειτουργία του την ικανότητα να διαχωρίζει και να ονοματίζει (labelling) τα δείγματα βασισμένος σε χρονικά σημεία (time points), να υπολογίζει αποστάσεις ζευγών UniFrac των δειγμάτων σε κάθε χρονικό σημείο, να εξάγει de novo ομαδοποίηση (clusters) του δείγματος με βάση τις ιδιότητές του, να υπολογίζει και να οπτικοποιεί την ταξινόμηση των ομάδων, να εφαρμόζει τεστ με βάση τις αλυσίδες Markov (Markovian property test), να εξάγει μοντέλο μετάβασης και μεταδεδομένα και να προβλέπει τις μελλοντικές καταστάσεις.
MegaR, είναι, ένα R Shiny πακέτο, μία διαδικτυακή εφαρμογή (web application), μη διαδικού μοντέλου μηχανικής μάθησης και παράλληλα με χρήση γραφικού περιβάλλοντος. Το MegaR δέχεται μεταγενομικά δεδομένα από 16S rRNA αλληλούχιση ή από αλληλούχιση ολόκληρου του μεταγονιδιώματος, ώστε να αναπτύξει το μοντέλο της μηχανικής μάθησης και ταξινομεί και κατηγοριοποιεί σε δύο ή περισσότερες κατηγορίες/ομάδες. Επίσης μπορεί να συσχετίζει την ασθένεια με το μικροβίωμα.
Τα λογισμικά αυτά δεν ανταγωνίζονται το ένα με το άλλο, άλλα απαντούν σε διαφορετικές προσεγγίσεις. Με το συνδυασμό αυτών μπορούμε να έχουμε και την άριστη πρόβλεψη χρονοσειράς (Cronos) και τη συσχέτιση με ασθένεια (MDITRE, MegaR).
-
The following paper concerns the bibliographical review of machine-learning software, which was developed and applied in the study of time series analysis of the intestinal microbiome of infants. The human intestinal microbiome’s co-existence and interaction with the human organism is constant and essential. The microbiome plays a pivotal role in the process of digestion (e.g. in the digestion of carbohydrates, vitamins and amino and fatty acids) and also in the healthy development of the infant’s digestive, immune and neurological systems.
The types of software analyzed below are: MDITRE, CRONOS and MegaR.
MDITRE is based on a Bayesian machine-learning method. This software functions on the input of: (i) a binary (two-value) label of the status of each host, (ii) a table of microbial longitudinal relative abundances (operational taxonomic units [OTUs] or amplicon sequence variants [ASVs] from 16S rRNA sequencing, or taxa derived from shotgun metagenomic data), and (iii) a table of pairwise distances (matrix of phylogenetic distances among taxa). On the basis of these data, it is able to correlate the microbiome to the disease.
Cronos is an R script that performs the tasks of: dividing and labelling the samples based on the time points, calculating the pairwise UniFrac distances among the samples at every time point, performing de novo clustering of the samples’ profiles, calculating and visualizing the taxonomic representation of clusters, applying Markovian property test, enforcing transition modelling based on given metadata, and predicting future states.
MegaR, an R Shiny package and web application, is an unbiased machine learning model, which can be used effortlessly with interactive visual analysis. The MegaR employs taxonomic profiles from either whole metagenome sequencing or 16S rRNA sequencing data to develop machine learning models and classify the samples into two or more categories. It can correlate the disease with the microbiome as well.
-
- Hellenic Open University
- Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές