Τεχνικές βαθιάς μάθησης για την εξόρυξη και την ανάλυση βιολογικών δεδομένων: Μία συστηματική ανασκόπηση

Deep learning techniques for biological data mining and analysis: A systematic review (Αγγλική)

  1. MSc thesis
  2. ΕΜΜΑΝΟΥΗΛ ΟΙΚΟΝΟΜΟΥ
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 22 Ιουλίου 2023
  5. Ελληνικά
  6. 82
  7. ΤΖΑΛΛΑΣ, ΑΛΕΞΑΝΔΡΟΣ
  8. ΤΖΑΛΛΑΣ, ΑΛΕΞΑΝΔΡΟΣ | ΒΡΑΧΑΤΗΣ, ΑΡΙΣΤΕΙΔΗΣ | ΧΑΤΖΗΝΙΚΟΛΑΟΥ, ΜΑΡΙΑ
  9. Τεχνητή Νοημοσύνη, Επεξεργασία Φυσικής Γλώσσας, Ομικές Τεχνολογίες, Μηχανική Μάθηση, Βαθιά Μάθηση, Αλγόριθμοι διανυσματοποίησης | Artificial Intelligence, Natural Language Processing, Omics, Machine Learning, Deep Learning, 2vec algorithms
  10. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΝΕΥΡΟΠΛΗΡΟΦΟΡΙΚΗ/ΒΝΠΔΕ
  11. 1
  12. 133
    • Με την ολοκλήρωση της αποκωδικοποίησης του ανθρώπινου γονιδιώματος το 2003,  ο όγκος των βιολογικών δεδομένων ανά τον κόσμο αυξάνεται με ταχείς ρυθμούς. με αποτέλεσμα να δημιουργείται η ανάγκη ανάπτυξης υπολογιστικών μεθόδων ανάλυσης αυτών των δεδομένων. Ίσως η πιο ελπιδοφόρα προσέγγιση για την ανάπτυξη ισχυρών υπολογιστικών μεθόδων ανάλυσης βιολογικών μεθόδων είναι αυτή της Μηχανικής Μάθησης. Στην παρούσα διπλωματική εργασία, θα μελετήσουμε δύο υποπεδία της, τη Βαθιά Μάθηση και την Επεξεργασία Φυσικής Γλώσσας. Η Βαθιά Μάθηση αφορά την κατασκευή νευρωνικών δικτύων με τρία ή περισσότερα επίπεδα, τα οποία  «μαθαίνουν» από μεγάλες ποσότητες δεδομένων. Η ύπαρξη επιπλέον επιπέδων είναι πολύ σημαντική για την ακρίβεια του μοντέλου, καθώς βελτιστοποιεί τις προβλέψεις του. Η βαθιά μάθηση διαθέτει πολλές εφαρμογές στο πεδίο της τεχνητής νοημοσύνης, οι οποίες βελτιώνουν την αυτοματοποίηση και εκτελούν αναλυτικά και φυσικά έργα χωρίς την ανθρώπινη επέμβαση. Η τεχνολογία βαθιάς μάθησης βρίσκεται πίσω από προϊόντα και υπηρεσίες της καθημερινότητάς μας (όπως οι ψηφιακοί βοηθοί ή οι συσκευές που εκτελούν φωνητικές εντολές), όπως επίσης και αναδυόμενες τεχνολογίες (όπως τα αυτοκίνητα που κινούνται χωρίς φυσικό οδηγό). Οι εφαρμογές της βαθιάς μάθησης είναι ποικίλες, κυρίως στους τομείς της επεξεργασίας εικόνας και μηχανικής όρασης. Η επεξεργασία φυσικής γλώσσας με τη σειρά της, στοχεύει στη βελτίωση της επικοινωνίας των μηχανών με την ανθρώπινη γλώσσα. Σκοπός της είναι η επεξεργασία των αλληλουχιών χαρακτήρων, ο εντοπισμός προτύπων, και η εκπαίδευση αλγορίθμων με βάση τα πρότυπα. Η εφαρμογή της ΕΦΓ γίνεται ολοένα και πιο σημαντική για την ανάλυση δεδομένων omics με τη χρήση  μοντέρνων αλλά και παλαιότερων μοντέλων Μηχανικής Μάθησης. Σκοπός της παρούσας διπλωματικής εργασίας ήταν η δημιουργία μίας συστηματικής ανασκόπησης όλων των  ΕΦΓ μεθοδολογιών 2vec, οι οποίες αποτελούν πεδίο ενδιαφέροντος σε όλη την επιστημονική κοινότητα. 

    • The volume of biological data worldwide is expanding quickly as a result of the decoding of the human genome, which was finished in 2003, necessitating the development of computational tools to analyze biological data. Machine learning is arguably the most promising strategy for creating effective computational algorithms for biological investigation. Two of its subfields, Deep Learning and Natural Language Processing, will be examined in this thesis. Building neural networks with three or more layers and allowing them to "learn" from massive amounts of data is known as deep learning. The model's accuracy depends heavily on the presence of extra layers because they improve predictions. In the field of artificial intelligence, deep learning has numerous applications that enhance automation and perform without human involvement, analytical and physical tasks. Deep learning is the technology that powers both established products and services (like digital assistants or voice-activated gadgets) and cutting-edge innovations (like autonomous vehicles). Deep learning has a wide range of uses, particularly in the areas of machine vision and image processing. The goal of natural language processing is to enhance the interaction between machines and human language. Processing character sequences, finding patterns, and developing algorithms based on the patterns are its three main objectives. For the study of omics data utilizing both contemporary and traditional Machine Learning models, the application of Natural Language Processing is becoming more and more crucial. This thesis sought to provide a comprehensive review of all NLP 2vec methods.

  13. Hellenic Open University
  14. Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές