Περίληψη
Η συγκέντρωση τεράστιων ποσοτήτων δεδομένων σε βάσεις δεδομένων αποτελεί μια
πρόκληση στον τομέα της επιστήμης της πληροφορικής. Η ανάπτυξη εργαλείων
οπτικοποίησης πρωτεϊνικών δεδομένων σκοπό έχει να προωθήσει τις επιστήμες και να
περιορίσει τον τεράστιο όγκο δεδομένων που συσσωρεύονται καθημερινά. Λόγω των νέων
δεδομένων αναπτύσσονται συνεχώς νέες μέθοδοι ανίχνευσης και μελέτης μέσα από εργαλεία,
λογισμικό και καινοτομίες οι οποίες και εφαρμόζονται πειραματικά ή ερευνητικά. Αυτ ή η
διπλωματική εργασία σκοπό έχει να αναφέρει τα βιβλιογραφικά δεδομένα που υπάρχουν γύρω
από την έκταση και τον σκοπό του τομέα της οπτικοποίησης πρωτεϊνικών δεδομένων, όπως
και να καταγράψει και να ενσωματώσει νέες πληροφορίες και μεθόδους. Επίσης να α ναφέρει
τυχόν προβλήματα που εμφανίζονται κατά την εφαρμογή νέων σύγχρονων τεχνολογιών και
την βελτίωση των υπαρχουσών αλλά και την πρόοδο στην κατανόηση της λειτουργίας ομάδων
και τομέων των πρωτεϊνικών δομών.
Στο πρώτο κεφάλαιο γίνεται αναφορά στις
πρωτεΐνες και την δομή τους καθώς και τις ιδιότητες
και αλληλεπιδράσεις τους. Στο δεύτερο κεφάλαιο αναφέρονται πειραματικές και μη
πειραματικές μέθοδοι οπτικοποίησης. Στο τρίτο κεφάλαιο αναφέρεται πως οργανώνονται τα
δεδομένα οπτικοποίησης. Στο τέταρτο κεφ άλαιο αναφέρονται οι αλγόριθμοι που
χρησιμοποιούνται και κάποιες γλώσσες προγραμματισμού. Στο πέμπτο κεφάλαιο αναφέρονται
οι τρόποι αποθήκευσης και οι βάσεις δεδομένων. Στο έκτο κεφάλαιο αναφέρεται το λογισμικό
που απαιτείται για την οπτικοποιηση των πρωτ εϊνικών δεδομένων και τα εργαλεία που
πετυχαίνουν αυτό το σκοπό. Στο έβδομο αναφέρεται η επίδραση των νέων τεχνολογιών
οπτικοποίησης και στο όγδοο κεφάλαιο αναπτύσσεται ο κώδικας σε γλώσσα R πρωτεϊνικών
δεδομένων.
Abstract
Gathering huge amounts of data into databases is a challenge in the
field of computer science.
The development of protein data visualization tools aims to advance the sciences and reduce
the huge amount of data that accumulates on a daily basis. Due to the new data, new methods
of detection and study are constantly develop ed through tools, software and innovations which
are applied experimentally or research. This thesis aims to report the bibliographic data that
exist around the scope and purpose of the field of protein data visualization, as well as to record
and integrat e new information and methods. Also to mention any problems that appear during
the application of new modern technologies and the improvement of the existing ones but also
the progress in the understanding of the operation of groups and sectors of the prot ein
structures.
The first chapter deals with proteins and their structure as well as their properties and
interactions. The second chapter discusses experimental and non experimental visualization
methods. The third chapter states how the visualization dat a is organized. The fourth chapter
lists the algorithms used and some programming languages. The fifth chapter lists the storage
methods and databases. Chapter six lists the software required to visualize protein data and the
tools that accomplish this. In the seventh the effect of the new visualization technologies is
mentioned and in the eighth chapter the code is developed in R language of protein data.