Μελέτη της επάρκειας και της επίδοσης αλγορίθμων Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης, στην αναγνώριση και ταξινόμηση δεδομένων του καρκίνου του προστάτη με ταυτόχρονη ανάπτυξη Γραφικού Περιβάλλοντος Διεπαφής (GUI)
Study of the adequacy and performance of Machine Learning and Artificial Intelligence algorithms in Data classification and identification in prostate cancer with simultaneous development of Graphical User Interface (GUI) (english)
Η παρούσα εργασία θέτει ως στόχο την μελέτη της επάρκειας αλλά και της
επίδοσης των αλγορίθμων Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης
(Machine Learning and Computational Intelligence), σχετικά με την κατάταξη ασθενών
σε δύο ομάδες, την υψηλού (High risk) και μη υψηλού κινδύνου (low risk) για Καρκίνο
του Προστάτη (Pca), βασιζόμενοι σε ανάλυση βιοχημικών δεδομένων. Ειδικότερα,
δημιουργήσαμε τεχνητά δεδομένα για το PSA, χρησιμοποιώντας τις πληροφορίες της
μελέτης των Casey et al (2012) και παρήγαμε τιμές PSA για n = 660 άτομα, με την
βοήθεια γεννήτριας αριθμών της Lognormal μαθηματικής κατανομής σε περιβάλλον της
γλώσσας προγραμματισμού Python. Επιπρόσθετα, παρήγαμε τους βιοχημικούς δείκτες
PSA (density), PSA (velocity), PSA(ratio), ενώ συμπεριλάβαμε και την ηλικία αλλά και
τα αποτελέσματα της δακτυλικής εξέτασης του προστάτη (DRE), σε όλους τους 660
εικονικούς ασθενείς. Διεξοδικά αναλύσαμε τους αλγόριθμους Decision Trees, Random
Forest, Support-Vector Machine,Logistic Regression, Naïve Bayes, K-Nearest
Neighbors, K-Means ενώ δημιουργήσαμε και Τεχνητό Νευρωνικό Δίκτυο (Neural Net)
με την βοήθεια του αλγόριθμου οπισθοδιάδοσης (Back Propagation Algorithm). Τα
αποτελέσματα που λάβαμε είναι εξαιρετικά όσον αφορά την επίδοση του Τεχνητού
Νευρωνικού Δικτύου και συγκεκριμένα πετύχαμε accuracy 99.49%, Precision 98.3% και
Recall 100%. Πολύ υψηλά ποσοστά λάβαμε και με τους αλγόριθμους Random Forest
και Decision Trees. Οι μέθοδοι που αναπτυχθήκαν συμπεριλαμβάνονται σε ένα Γραφικό
Περιβάλλον Διεπαφής (Graphical User Interface - GUI), που κατασκευάσαμε με την
βοήθεια της βιβλιοθήκης Gradio και το οποίο αποφασίζει για τον αν ο ασθενής πρέπει
να υποβληθεί σε καθοδηγούμενη βιοψία του προστάτη αδένα. Μέσω αυτής της
κατηγοριοποίησης, οι ασθενείς θα μπορούν να αξιολογηθούν περαιτέρω με την
διενέργεια βιοψίας (ιστολογική μελέτη) από τον ουρολόγο θεράποντα ιατρό,
προκειμένου να ανιχνευθεί έγκαιρα η κακοήθεια, έτσι ώστε, οι πιθανότητες για πλήρη
ίαση να είναι αυξημένες. Περαιτέρω, η εργασία αναδείκνύει τα υπέρ και τα κατά της
ευαισθησίας των βιοχημικών μεθόδων και το κατά πόσο συμβάλουν στην ίαση και την
ποιότητα ζωής των ασθενών. Τέλος, θα γίνει αναφορά στην μελλοντική έρευνα μεθόδων
ανίχνευσης (Screening), στις μεθόδους πρόληψης, αλλά και στις διαθέσιμες θεραπείες
του Καρκίνου του Προστάτη.
Prostate cancer is the second most frequent diagnosis in men and overall the
fifth leading cause of death worldwide. The purpose of this Thesis is the study of the
adequacy and the efficacy οf Machine Learning and Computational Intelligence
algorithms, for the classification of patients in two distinct categories, the High Risk and
Low Risk group for prostate cancer, according to the analysis of biochemical data such
as Prostate Specific Antigen (PSA), PSA density, PSA velocity, PSA ratio, accompanied
with the age of the artificial patients and the result of the Digital Rectal Exam (DRE),
from a total of 660 patients. The PSA values derived from the Lognormal distribution
generated in Python 3.8. We created and analysed Machine Learning algorithms such
as Decision Trees, Random Forest, Support-Vector Machine,Logistic Regression, Naïve
Bayes, K-Nearest Neighbors, K-Means and an Artificial Neural Network using the Back
Propagation algorithm. The ANN exhibited tremendous efficacy and more precisely,
accuracy of 99.49%, precision of 98.3% and recall of 100%. High results we also
achieved with Decission Trees and Random Forest algorithms. Furthermore the GUI we
introduced, is compatible with Python 3.8 and has been accomplished with the use of
Gradio Library. This minimal software, makes a decision for the need of biopsy of the
prostate with the classification of the patients in two dinstict categories, one that needs
biopsy and one that no further action is necessary and is user friendly. This
classification will help patients of the High Risk group to be further evaluated from the
Urologists and if necessary, to undergo biopsy of the prostate, for accurate and fast
detection of a possible malignancy, in order for the patients to have higher chances of
full recovery. Furthermore, we wish to show the pros and cons for the sensitivity of
biochemical methods and to clarify the degree of contribution in the cure and quality of
life. Additionally, we will mention the future research in screening methods and we will
demonstrate some advanced ideas based in the latest research (Vlontzos, et al.) in
Machine Learning of causal systems, along with the utilization of light cones from
Special Relativity Theory and how could affect the medical imaging. We also mention
ways of prevention and of course, the available advanced therapies in prostate cancer.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Main Files
Μελέτη της επάρκειας και της επίδοσης αλγορίθμων Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης, στην αναγνώριση και ταξινόμηση δεδομένων του καρκίνου του προστάτη με ταυτόχρονη ανάπτυξη Γραφικού Περιβάλλοντος Διεπαφής (GUI) Description: 509964_ΜΩΡΑΚΗΣ_ΔΗΜΗΤΡΙΟΣ.pdf (pdf)
Book Reader Info: Κυρίως σώμα διπλωματικής Size: 4.3 MB
Μελέτη της επάρκειας και της επίδοσης αλγορίθμων Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης, στην αναγνώριση και ταξινόμηση δεδομένων του καρκίνου του προστάτη με ταυτόχρονη ανάπτυξη Γραφικού Περιβάλλοντος Διεπαφής (GUI) - Identifier: 170962
Internal display of the 170962 entity interconnections (Node labels correspond to identifiers)