- MSc thesis
- Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
- 24 Σεπτεμβρίου 2023
- Ελληνικά
- 222
- Γεώργιος Φερετζάκης
- Γεώργιος Φερετζάκης | Δημήτριος Καραπιπέρης | Λελίγκου, Ελένη Αικατερίνη
- Data mining | Machine learning | Clustering | Classiffication | Regression
- PLS60
- 4
- 60
- Περιλαμβάνει: Πίνακες, Στιγμιότυπα, Γραφήματα
- Εισαγωγή στην εξόρυξη δεδομένων των Pang-Ning Tan, Michael Steinbach, Anuj Karpatine και Vipin Kumar
-
-
Οι μονάδες εντατικής θεραπείας (ΜΕΘ) αποτελούν ειδικό τμήμα των Νοσοκομείων με αίθουσες στις οποίες παρέχονται υπηρεσίες Επείγουσας και Εντατικής Ιατρικής. Αυτές διαθέτουν ένα σύνολο μηχανημάτων υποστήριξης και χρησιμοποιούνται στη περίθαλψη ασθενών που βρίσκονται σε κρίσιμη κατάσταση. Συνεπώς, οι αποτελεσματικές ιατρικές αποφάσεις για ασθενείς που βρίσκονται στις ΜΕΘ είναι μείζονος σημασίας. Σκοπός της παρούσας διπλωματικής είναι αρχικά η συλλογή και αποθήκευση δεδομένων και στη συνέχεια η χρησιμοποίηση τους για την ανάπτυξη μοντέλων των οποίων οι προβλέψεις μπορούν να υποβοηθήσουν τους ιατρούς σε αυτές τις αποφάσεις. Για τις ανάγκες της διπλωματικής επιλέχθηκε η βάση δεδομένων της Mimic-III, για την οποία θα παρουσιάσουμε τόσο το τρόπο πρόσβασης όσο και τα αναγκαία προαπαιτούμενα. Έπειτα εξετάσαμε και παρουσιάσαμε στατιστικά των δεδομένων όπου διαπιστώθηκαν κάποια προβλήματα όπως ύπαρξη ελλειπουσών τιμών, ακραίων τιμών, ασύμμετρων κλάσεων και πολυσυγγραμικότητα των μεταβλητών. Ως εκ τούτου, αναλύθηκε και υλοποιήθηκε στρατηγική αντιμετώπισης αυτών των προβλημάτων. Στη συνέχεια, εφόσον έγινε ο καθαρισμός των δεδομένων, προχωρήσαμε στη παρουσίαση της θεωρίας διαφόρων μοντέλων τεχνικής μάθησης και εν τέλει στην εφαρμογή τους για την δημιουργία προβλεπτικών μοντέλων σχετικά με το χρόνο παραμονής των ασθενών στις ΜΕΘ καθώς και την τελική έκβαση των ασθενών στις ΜΕΘ, δηλαδή αν επιβιώνουν. Προκειμένου να αξιολογηθούν τα αποτελέσματά τους, πριν την υλοποίηση των μοντέλων χρειάστηκε να μοιράσουμε τα δεδομένα σε δεδομένα ελέγχου και σε δεδομένα εκπαίδευσης. Έπειτα, εφαρμόστηκαν διάφορες μετρικές αναλόγως με την τεχνική μηχανικής μάθησης, δηλαδή αναλόγως αν είναι μοντέλο κατηγοριοποίησης ή παλινδρόμησης. Η διαχείριση και εξαγωγή των δεδομένων έγινε μέσω SQL ενώ η επεξεργασία, εξαγωγή στατιστικών και υλοποίηση των μοντέλων μέσω της γλώσσας προγραμματισμού Python.
-
Intensive care units (ICUs) are rooms with beds equipped with a set of support machines and are used to care critically ill patients. Therefore, effective medical decisions for patients in ICUs are of great importance. The purpose of this thesis is to collect and store data and then use it to develop models whose predictions can assist doctors in these decisions. The database Mimic-III was chosen for the needs of the diploma, for which we will present the access method and the necessary prerequisites. Then we examined and presented statistics of the data where we noticed the following problems: missing data, extreme values, imbalanced classes and multicollinearity. To deal with these problems, we analyzed and implemented our strategy. Then, once the data was cleaned, we proceeded to present the theory of various technical learning models and then implemented them in order to create predictive models regarding the length of stay of patients in ICUs as well as the final outcome of patients in ICUs. , i.e. if they survive. In order to evaluate its results, before implementing the models we had to divide the data into test data and training data. Then, different metrics were applied depending on the type of machine learning, i.e. depending on whether it is a classification or regression model. The management and extraction of the data was done through SQL while the processing, extraction of statistics and implementation of the models through Python.
-
- Hellenic Open University
- Αναφορά Δημιουργού - Παρόμοια Διανομή 4.0 Διεθνές