Δημιουργία Προσωποποιημένων Συνόψεων Σημασιολογικών Βιολογικών Βάσεων Δεδομένων

Creation of Personalised Summaries in Semantic Biological Databases (Αγγλική)

  1. MSc thesis
  2. ΓΙΑΚΟΥΜΑΚΗΣ, ΑΛΕΞΑΝΔΡΟΣ
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 31 Ιουλίου 2021 [2021-07-31]
  5. Αγγλικά
  6. 69
  7. ΚΟΝΔΥΛΑΚΗΣ, ΧΑΡΙΔΗΜΟΣ
  8. ΚΟΝΔΥΛΑΚΗΣ, ΧΑΡΙΔΗΜΟΣ | ΜΥΛΩΝΑΣ, ΦΟΙΒΟΣ
  9. Σύνοψη | Βιολογικές Βάσεις Δεδομένων | Διασυνδεδεμένα Δεδομένα | Σημασιολογικός Ιστός | Semantic Web | Summary | Biological Databases | Interconnected Data
  10. 2
  11. 3
  12. 30
  13. Περιέχει : πίνακες, διαγράμματα, εικόνες, κώδικα
    • Η ολοένα και αυξανόμενη πληθώρα βιολογικών πληροφοριών που συλλέγονται καθημερινά, καθιστά επιτακτική την διασύνδεση των πληροφοριών, και την δημιουργία μεθόδων για την αποτελεσματική τους εξερεύνηση. Παρά το γεγονός ότι τεχνολογίες του σημασιολογικού ιστού προσφέρουν ποικίλες υπηρεσίες για την διασύνδεση και τον διαμοιρασμό των δεδομένων ως ανοικτά διασυνδεδεμένα δεδομένα, έχουν συχνά εξαιρετικά περίπλοκα και μεγάλα σχήματα, τα οποία είναι δύσκολο να κατανοηθούν, περιορίζοντας το δυναμικό εκμετάλλευσης των πληροφοριών που περιέχουν. Ως αποτέλεσμα, υπάρχει μια αυξανόμενη ανάγκη για ανάπτυξη μεθόδων και εργαλείων που διευκολύνουν τη γρήγορη κατανόηση και εξερεύνηση αυτών των πηγών. Τα τελευταία χρόνια τεχνικές συνόψεων ολοένα και περισσότερο κερδίζουν έδαφος για την εύκολη και γρήγορη αποτύπωση της διαθέσιμης πληροφορίας σημασιολογικών βάσεων δεδομένων. Ωστόσο μέχρι τώρα δεν έχει ενδελεχώς μελετηθεί πως οι τεχνικές αυτές θα μπορέσουν να εφαρμοστούν αποτελεσματικά σε βιολογικές βάσεις δεδομένων. Επιπλέον οι χρήστες για τους οποίους δημιουργούνται οι συνόψεις δεν μπορούν να επιλέξουν το τμήμα του γράφου που τους ενδιαφέρει καθιστώντας τις παραγόμενες συνόψεις μη προσωποποιημένες. Στη συγκεκριμένη εργασία λοιπόν, μελετώνται οι υφιστάμενες τεχνικών συνόψεων για διασυνδεδεμένα δεδομένα, και παρουσιάζεται ένας νέος αλγόριθμος κατάλληλος για την σύνοψη βιολογικών βάσεων δεδομένων. Σε αντίθεση με άλλες αντίστοιχες εργασίες ο αλγόριθμος επιλέγει τριπλέτες από τον διαθέσιμο γράφο με βάση τις προτιμήσεις του χρήση και δημιουργεί συνόψεις υψηλού επιπέδου. Η πειραματική μελέτη επιβεβαιώνει την υψηλή ποιότητα των παραγόμενων συνόψεων δείχνοντας ότι επιτυγχάνουν να επιλέξουν τριπλέτες που οι χρήστες ρωτάνε συχνά με βάση τα ενδιαφέροντά τους.
    • The increasing abundance of biological information that is collected daily in medical and biological research, makes it imperative to interconnect the information and to create methods for their effective exploration. Although semantic web technologies offer a variety of services for interconnecting and sharing data as openly interconnected data, they often have extremely complex and large schemes that are difficult to understand, limiting the exploitation potential of the information they contain. As a result, there is a growing need to develop methods and tools that facilitate the rapid understanding and exploration of these resources. In recent years, summary techniques are increasingly gaining ground for the easy and fast mapping of available semantic database information. However, so far it has not been thoroughly studied how these techniques can be applied effectively in biological databases. In addition, in existing techniques, users cannot select the part of the graph that the users are mostly interested making the summaries non-personalized. The aim of this master's thesis is to investigate the available technical summaries for linked data, presenting a new algorithm for biological datasets. In contrast to other similar approaches the algorithm selects triples from the available graph based on user preferences, generating high quality summaries. Experimental evaluation verifies the quality of the generated summaries, showing that it achieves to select triples that users are frequently querying based on their interests.
  14. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.