Η μεταπτυχιακή αυτή διπλωματική εργασία έχει ως στόχο την ενημέρωση του αναγνώστη σχετικά με πρόσφατες και πρωτότυπες Εφαρμογές Βαθιάς Μάθησης στη Βιοπληροφορική. Συγκεκριμένα, κατά τη διάρκεια της βιβλιογραφικής ανασκόπησης, αναζητήθηκαν πληροφορίες μέσω επιστημονικών περιοδικών, άρθρων και βιβλίων σχετικά με τα διάφορα είδη των βαθέων νευρωνικών δικτύων, τις εφαρμογές τους στη Βιοπληροφορική και των αποτελεσμάτων που απέδωσαν. Η ανασκόπηση αυτή έδειξε πως υπάρχει πληθώρα εφαρμογών Βαθιάς Μάθησης στον τομέα της Βιοπληροφορικής και πως η Βαθιά Μάθηση αποτελεί συχνά ένα αποτελεσματικό εργαλείο διαχείρισης τόσο μαζικών όσο και περιορισμένων βιολογικών δεδομένων. Για το λόγο αυτό, αναμένεται ότι οι ερευνητές στον τομέα της Βιοπληροφορικής θα χρησιμοποιούν όλο και περισσότερο μοντέλα Βαθιάς Μάθησης στο μέλλον, λαμβάνοντας όμως υπόψη πως σημαντικό ρόλο στην αποτελεσματικότητα τους θα διαδραματίζουν τόσο ο τρόπος αποκρυπτογράφησης και χαρακτηρισμού των βιολογικών δεδομένων όσο και η επιλογή του κατάλληλου μοντέλου.
Καθώς η Βαθιά Μάθηση και η Βιοπληροφορική αποτελούν τομείς που εξελίσσονται συνεχώς, η διπλωματική αυτή εργασία εστιάζει στα τέσσερα βασικά είδη βαθέων νευρωνικών δικτύων, εμπρόσθιας τροφοδότησης, ανατροφοδοτούμενα, συνελικτικά και παραγωγικά ανταγωνιστικά δίκτυα και τις εφαρμογές τους σε επτά καίριους τομείς της Βιοπληροφορικής, τη Συστημική Βιολογία, την Ανάλυση Αλληλουχιών, την Πρόβλεψη και Αναπαράσταση Δομών, την Πρόβλεψη Βιομοριακών Ιδιοτήτων και Λειτουργιών, τη Βιοϊατρική Επεξεργασία Εικόνας και Διάγνωση, την Πρόβλεψη Αλληλεπίδρασης Βιομορίων και την Πρωτεϊνική Μηχανική. Τέλος, πραγματοποιείται ειδική αναφορά σε μια από τις πιο σημαντικές εφαρμογές της Βαθιάς Μάθησης στη Βιοπληροφορική τα τελευταία χρόνια, το AlphaFold2, ένα μοντέλο το οποίο κατάφερε να αντιμετωπίσει με μεγάλη αποτελεσματικότητα ένα από τα πιο κρίσιμα ερευνητικά βιολογικά προβλήματα τα τελευταία πενήντα χρόνια, την πρόβλεψη της τρισδιάστατης δομής πρωτεινών με βάση αποκλειστικά την αλληλουχία των αμινοξέων τους.
This master’s thesis aims to inform the readers about recent and original Deep Learning Applications in Bioinformatics. Specifically, during the literature review, information was sought through scientific journals, articles and books on the various types of deep neural networks, their applications in Bioinformatics and the results they yielded. This review showed that there is a vast variety of Deep Learning applications in the field of Bioinformatics and that Deep Learning is often an effective tool for managing both massive and limited biological data. For this reason, researchers in the field of Bioinformatics are expected to use increasingly Deep Learning models in the future, considering that an important role in their effectiveness will play both the way biological data are decrypted and characterized and the selection of the appropriate model.
As Deep Learning and Bioinformatics are constantly evolving fields, this dissertation focuses on the four main types of deep neural networks, feedforward, recurrent, convolutional and generative adversarial networks and their applications in seven important fields of Bioinformatics, Systems Biology, Sequence Analysis, Structure Prediction and Reconstruction, Biomolecule Property and Function Prediction, Biomedical Image Processing and Diagnosis, Biomolecular Interaction Prediction and Protein Engineering. Finally, special mention is made of one of the most important applications of Deep Learning in Bioinformatics in recent years, AlphaFold2, a model that has managed to deal with one of the most critical biological research problems of the last fifty years, the prediction of three-dimensional structure of proteins based solely on the sequence of their amino acids.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Εφαρμογές Βαθιάς Μάθησης στη Βιοπληροφορική Περιγραφή: std510880_Βαΐτση_Κωνσταντίνα.pdf (pdf)
Book Reader Πληροφορίες: primary:true Μέγεθος: 1.7 MB
Εφαρμογές Βαθιάς Μάθησης στη Βιοπληροφορική - Identifier: 170973
Internal display of the 170973 entity interconnections (Node labels correspond to identifiers)