Ανάλυση διαφορικής έκφρασης γονιδίων και ανάλυση εμπλουτισμού ελεύθερων δεδομένων που έχουν προκύψει από πειράματα αλληλούχισης RNA από δείγματα ασθενών που πάσχουν από Λευχαιμία.
RNA-seq gene expression and enrichment analysis for the detection of differentially expressed gene sets of Leukemia public available data. Evaluation and comparison of gene clustering algorithms with the use of public TCGA data (Αγγλική)
AML και ΑΜΛ | Leukemia και Λευχαιμία | RNA Sequencing και Αλληλούχιση RNA | Differential gene Expression και Ανάλυση Διαφορικής Έκφρασης Γονιδίων | KEGG Pathways και Μονοπάτια KEGG | GO Pathways και Μονοπάτια GO | GSEA και Ανάλυση Εμπλουτισμού | TCGA | GDC
2
60
Περιέχει: Πίνακες, Εικόνες
Τα τελευταία χρόνια ο κλάδος της εξατομικευμένης ιατρικής εξελίσσεται με ραγδαίους ρυθμούς. Το γεγονός αυτό έχει δώσει την δυνατότητα να αντιμετωπίζουμε με διαφορετικό τρόπο την κάθε ομάδα ασθενών που έχει κοινά χαρακτηριστικά ώστε η θεραπεία να είναι όσο πιο αποτελεσματική γίνεται. Ένα μεγάλο έναυσμα αποτέλεσε η πλήρη ανάλυση και αλληλούχιση του ανθρώπινου γονιδιώματος που πυροδότησε την ανάπτυξη νέων τεχνικών για την μαζική ανάλυση πολλών δειγμάτων ταυτόχρονα, πειράματα που ονομάζονται high throughput. Ο στόχος της εξέλιξης αυτής είναι η γνώση αλλά και η θεραπεία σε διαγνωστικό επίπεδο. Οι θεραπευτικές προσεγγίσεις έχουν αλλάξει ριζικά μετά την ανάλυση του τεράστιου όγκου δεδομένων αυτής της νέας εποχής. Με την χρήση του γονιδιακού προφίλ του εκάστοτε ασθενούς πραγματοποιείται και η επιλογή φαρμακευτικής αγωγής με στόχο την καταπολέμηση πολλών νόσων που παλαιότερα θεωρούνταν μη ιάσιμες όπως είναι και ο καρκίνος.
Μια από τις τεχνικές που συμβάλλει στην ανάπτυξη αυτή είναι και η αλληλούχιση του RNA (RNA-seq), η οποία στοχεύει στην ανάλυση του συνόλου του RNA μιας ομάδας κυττάρων ή ακόμα και ενός μοναδικού κυττάρου. Η σημασία του ρόλου του RNA στα κύτταρα και κατά επέκταση στους διάφορους οργανισμούς για πολλά χρόνια αγνοούνταν με αποτέλεσμα το RNA να θεωρείται μόνο σαν ένα μέσο μεταβίβασης της γενετικής πληροφορίας από το DNA στις πρωτεΐνες. Μετέπειτα, προσδιορίστηκε ότι η καταμέτρηση του αριθμού των μεταγράφων ανά δείγμα για κάθε γονίδιο μπορεί να συμβάλλει σε μεγάλο βαθμό στον εντοπισμό μεταλλαγών ειδικών μορίων που επηρεάζουν μια κυτταρική λειτουργία όπως για παράδειγμα κυτταρικών υποδοχέων.
Η παρούσα εργασία επικεντρώνεται στην λευχαιμία και πιο συγκεκριμένα στην Οξεία Μυελοειδή Λευχαιμία (AML) που παρόλη την συνεχή ανάπτυξη της γνώσης και των τεχνικών παραμένει ακόμα και σήμερα μια από τις πιο επιθετικές μορφές λευχαιμίας στους ενήλικες αλλά κυρίως στα παιδία. Τα δεδομένα που χρησιμοποιήθηκαν έχουν συλλεχθεί από το National Cancer Institute, είναι διαθέσιμα για κοινή χρήση και αφορούν δυο ομάδες ασθενών που πάσχουν από AML με ειδοποιό διαφορά τους το ηλικιακό εύρος στο οποίο ανήκουν. Τα δεδομένα των δυο ομάδων ασθενών, που ήταν οι πίνακες με τους αριθμούς μεταγράφων που προκύπτουν από την αλληλούχιση του RNA, συνενώθηκαν και έπειτα ακολούθησε μια εκτενής στατιστική ανάλυση.
Αρχικά, το πρώτο βήμα σε τέτοιου είδους πειράματα είναι η κανονικοποίηση των τιμών που μετρήθηκαν στο πείραμα αλληλούχισης. Παράλληλα με το παραπάνω υπολογίστηκε και η στατιστική σημασία εμφάνισης κάθε γονιδίου στα εκάστοτε δείγματα με αποτέλεσμα να είναι δυνατός ο εντοπισμός διαφορικά εκφραζόμενων γονιδίων. Οι κύριοι παράγοντες στους οποίους βασίστηκε η παρούσα ανάλυση αφορά την ηλικία αλλά και την επιβίωση βάση των δεδομένων για την εξέλιξη της κατάστασης των ασθενών που δημοσιεύτηκαν στον οργανισμό National Cancer Institute (NCI). Για τον προσδιορισμό τυχών μοτίβων έκφρασης στις ομάδες των δειγμάτων χρησιμοποιήθηκαν οι θερμικοί χάρτες ως βασική μέθοδος απεικόνισης, με την χρήση των διαφορικά στατιστικά σημαντικών εκφραζόμενων γονιδίων σαν τιμές εισόδου.
Στις αναλύσεις αυτές μεγάλο ρόλο διαδραματίζει όχι μόνο ο εντοπισμός τον στατιστικά σημαντικών γονιδίων αλλά και η διερεύνηση και συσχέτιση της δράσης του με την φυσιολογία του ασθενούς. Για τον λόγο αυτό και για μια σφαιρική εικόνα της δράσης τους χρησιμοποιήθηκαν τα γονίδια για την πραγματοποίηση ανάλυσης εμπλουτισμού. Στα πλαίσια αυτού διεξήχθησαν δυο αναλύσεις που σχετίζονται με τον εντοπισμού γονιδιακών οντολογιών για τα γονίδια αυτά και με την ανάλυση μοριακών μονοπατιών αντίστοιχα.
Στόχος της δεδομένης ανάλυσης αποτελεί ο εντοπισμός διαφορικά εκφραζόμενων γονιδίων με κριτήριο ελέγχου την ηλικιακή ομάδα και την επιβίωση. Πράγματι όσον αφορά τον παράγοντα ηλικία τα δείγματα των ασθενών εμφάνισαν σημαντικές διαφορές σε σχέση με την γονιδιακή έκφραση. Από την άλλη πλευρά τα αποτελέσματα με βάση το status επιβίωσης των ασθενών δεν εμφάνιζε κάποια διακριτό μοτίβο έκφρασης μεταξύ αυτών που επιβίωσαν και αυτόν που απεβίωσαν. Παρόλα αυτά, η σύγκριση των λιστών γονιδίων που χαρακτηρίστηκαν διαφορικά εκφραζόμενα έδειξε ότι 11 γονίδια στον αριθμό ήταν μοναδικά στην ομάδα που σχετίζονταν με την επιβίωση και κάποια από αυτά μπορούν να συσχετιστούν με την έκβαση της ασθένειας σε κάθε άτομο.
Ο εντοπισμός σημαντικών γονιδίων με βάση αυτά τα κριτήρια είναι μεγάλης σημασίας για τον προσδιορισμό νέων βιοδεικτών με στόχο την βελτίωση της εξατομικευμένης θεραπείας και του εντοπισμού νέων πιθανών θεραπευτικών στόχων για το μέλλον.
Precision medicine has become over the past years the solution to the problem that different people do not react in the same way to recommended therapy according to the Worldwide Guidelines for every disease. Everything has begun from the fact that Human Genome was completely sequenced and that was the key to a huge amount of information, which opened this enormous chapter, called precision medicine (Vogenberg, Barash, & Pursel, 2010). Therapeutic approaches changed drastically according to the new data and that was the beginning of a new era, where innovating diagnostic techniques and drugs were developed very quickly one after the other. One of these techniques is RNA Sequencing that shed light on the importance of transcriptome as far as better understanding of the molecular bases for many diseases is concerned. Transcriptomics is a relatively young field that includes all these technologies which analyze the RNA molecules of cell populations or even a single cell.
This study focuses on blood cancer and more specifically on Acute Myeloid Leukemia, which despite the last years progress, has still a decreased survival rate in humans and mostly in children. Using public data, we focus on different aspects between AML groups and aim to underline the importance of differentially expressed genes between those groups. More specifically, this study focuses on the differentially expression comparing groups with AML patients and testing according to parameters, such as the age and the vital status. The comparison of two pathological datasets with patients that have the same disease as basis is an interesting aspect in order to investigate if there are differences referring to genes that have not been associated with AML yet. The statistical analysis was based the factors age and vital status of the patient.
The results of this analysis have shown that there is a different expression pattern concerning the age factor. On the other hand, the vital status of patient showed that there is not a clear differential expression between alive and dead patients. However, after comparing the differentially expressed genes of the age factor and the vital status factor, it has been shown that there are 11 genes that are unique for the vital status factor and they are related with AML survival according to recent publications.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Ανάλυση διαφορικής έκφρασης γονιδίων και ανάλυση εμπλουτισμού ελεύθερων δεδομένων που έχουν προκύψει από πειράματα αλληλούχισης RNA από δείγματα ασθενών που πάσχουν από Λευχαιμία. Περιγραφή: 510890_Καραγιαννάκου_Βασιλική.pdf (pdf)
Book Reader Πληροφορίες: Κυρίως σώμα διπλωματικής Μέγεθος: 1.8 MB
Ανάλυση διαφορικής έκφρασης γονιδίων και ανάλυση εμπλουτισμού ελεύθερων δεδομένων που έχουν προκύψει από πειράματα αλληλούχισης RNA από δείγματα ασθενών που πάσχουν από Λευχαιμία. - Identifier: 170977
Internal display of the 170977 entity interconnections (Node labels correspond to identifiers)