Μελέτη της επάρκειας και της επίδοσης αλγορίθμων Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης, στην αναγνώριση και ταξινόμηση δεδομένων του καρκίνου του προστάτη με ταυτόχρονη ανάπτυξη Γραφικού Περιβάλλοντος Διεπαφής (GUI)

Study of the adequacy and performance of Machine Learning and Artificial Intelligence algorithms in Data classification and identification in prostate cancer with simultaneous development of Graphical User Interface (GUI) (Αγγλική)

  1. MSc thesis
  2. Μωράκης, Δημήτριος
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 23 Ιουλίου 2022 [2022-07-23]
  5. Ελληνικά
  6. 194
  7. Αδαμόπουλος, Αδάμ
  8. Αδαμόπουλος, Αδάμ | Αθανασίου, Αλκίνοος
  9. Μηχανική Μάθηση | Machine Learning | Βαθιά Μάθηση | Deep Learning | Προστατικό Αντιγόνο | PSA | Καρκίνος Προστάτη | Prostate Cancer | Τεχνητά Νευρωνικά Δίκτυα | Artificial Neural Networks | Τεχνητά Δεδομένα | Artificial Data | Προστάτης | Prostate
  10. 11
  11. 110
  12. Περιέχει: πίνακες, διαγράμματα, εικόνες, φωτογραφίες
    • Η παρούσα εργασία θέτει ως στόχο την μελέτη της επάρκειας αλλά και της επίδοσης των αλγορίθμων Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης (Machine Learning and Computational Intelligence), σχετικά με την κατάταξη ασθενών σε δύο ομάδες, την υψηλού (High risk) και μη υψηλού κινδύνου (low risk) για Καρκίνο του Προστάτη (Pca), βασιζόμενοι σε ανάλυση βιοχημικών δεδομένων. Ειδικότερα, δημιουργήσαμε τεχνητά δεδομένα για το PSA, χρησιμοποιώντας τις πληροφορίες της μελέτης των Casey et al (2012) και παρήγαμε τιμές PSA για n = 660 άτομα, με την βοήθεια γεννήτριας αριθμών της Lognormal μαθηματικής κατανομής σε περιβάλλον της γλώσσας προγραμματισμού Python. Επιπρόσθετα, παρήγαμε τους βιοχημικούς δείκτες PSA (density), PSA (velocity), PSA(ratio), ενώ συμπεριλάβαμε και την ηλικία αλλά και τα αποτελέσματα της δακτυλικής εξέτασης του προστάτη (DRE), σε όλους τους 660 εικονικούς ασθενείς. Διεξοδικά αναλύσαμε τους αλγόριθμους Decision Trees, Random Forest, Support-Vector Machine,Logistic Regression, Naïve Bayes, K-Nearest Neighbors, K-Means ενώ δημιουργήσαμε και Τεχνητό Νευρωνικό Δίκτυο (Neural Net) με την βοήθεια του αλγόριθμου οπισθοδιάδοσης (Back Propagation Algorithm). Τα αποτελέσματα που λάβαμε είναι εξαιρετικά όσον αφορά την επίδοση του Τεχνητού Νευρωνικού Δικτύου και συγκεκριμένα πετύχαμε accuracy 99.49%, Precision 98.3% και Recall 100%. Πολύ υψηλά ποσοστά λάβαμε και με τους αλγόριθμους Random Forest και Decision Trees. Οι μέθοδοι που αναπτυχθήκαν συμπεριλαμβάνονται σε ένα Γραφικό Περιβάλλον Διεπαφής (Graphical User Interface - GUI), που κατασκευάσαμε με την βοήθεια της βιβλιοθήκης Gradio και το οποίο αποφασίζει για τον αν ο ασθενής πρέπει να υποβληθεί σε καθοδηγούμενη βιοψία του προστάτη αδένα. Μέσω αυτής της κατηγοριοποίησης, οι ασθενείς θα μπορούν να αξιολογηθούν περαιτέρω με την διενέργεια βιοψίας (ιστολογική μελέτη) από τον ουρολόγο θεράποντα ιατρό, προκειμένου να ανιχνευθεί έγκαιρα η κακοήθεια, έτσι ώστε, οι πιθανότητες για πλήρη ίαση να είναι αυξημένες. Περαιτέρω, η εργασία αναδείκνύει τα υπέρ και τα κατά της ευαισθησίας των βιοχημικών μεθόδων και το κατά πόσο συμβάλουν στην ίαση και την ποιότητα ζωής των ασθενών. Τέλος, θα γίνει αναφορά στην μελλοντική έρευνα μεθόδων ανίχνευσης (Screening), στις μεθόδους πρόληψης, αλλά και στις διαθέσιμες θεραπείες του Καρκίνου του Προστάτη.
    • Prostate cancer is the second most frequent diagnosis in men and overall the fifth leading cause of death worldwide. The purpose of this Thesis is the study of the adequacy and the efficacy οf Machine Learning and Computational Intelligence algorithms, for the classification of patients in two distinct categories, the High Risk and Low Risk group for prostate cancer, according to the analysis of biochemical data such as Prostate Specific Antigen (PSA), PSA density, PSA velocity, PSA ratio, accompanied with the age of the artificial patients and the result of the Digital Rectal Exam (DRE), from a total of 660 patients. The PSA values derived from the Lognormal distribution generated in Python 3.8. We created and analysed Machine Learning algorithms such as Decision Trees, Random Forest, Support-Vector Machine,Logistic Regression, Naïve Bayes, K-Nearest Neighbors, K-Means and an Artificial Neural Network using the Back Propagation algorithm. The ANN exhibited tremendous efficacy and more precisely, accuracy of 99.49%, precision of 98.3% and recall of 100%. High results we also achieved with Decission Trees and Random Forest algorithms. Furthermore the GUI we introduced, is compatible with Python 3.8 and has been accomplished with the use of Gradio Library. This minimal software, makes a decision for the need of biopsy of the prostate with the classification of the patients in two dinstict categories, one that needs biopsy and one that no further action is necessary and is user friendly. This classification will help patients of the High Risk group to be further evaluated from the Urologists and if necessary, to undergo biopsy of the prostate, for accurate and fast detection of a possible malignancy, in order for the patients to have higher chances of full recovery. Furthermore, we wish to show the pros and cons for the sensitivity of biochemical methods and to clarify the degree of contribution in the cure and quality of life. Additionally, we will mention the future research in screening methods and we will demonstrate some advanced ideas based in the latest research (Vlontzos, et al.) in Machine Learning of causal systems, along with the utilization of light cones from Special Relativity Theory and how could affect the medical imaging. We also mention ways of prevention and of course, the available advanced therapies in prostate cancer.
  13. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.