Γενετικοί Αλγόριθμοι βελτιστοποίησης της επίδοσης μεθόδων Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης για την ταξινόμηση του καρκίνου του μαστού

Use of Genetic Algorithms to optimize the performance of Machine Learning and Computational Intelligence methods for breast cancer classification (Αγγλική)

  1. MSc thesis
  2. Ζακάκη, Δήμητρα
  3. Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
  4. 23 Ιουλίου 2022 [2022-07-23]
  5. Ελληνικά
  6. 62
  7. Αδαμόπουλος, Αδάμ
  8. Ματζάκος, Νικόλαος | Χατζηνικολάου, Μαρία
  9. Καρκίνος του μαστού, μηχανική μάθηση, ταξινομητές, αλγόριθμος knn, αλγόριθμος k – means, επίδοση αλγορίθμων ταξινόμησης.
  10. 2
  11. 7
  12. 29
  13. Περιέχει: Πίνακες, Σχήματα, Εικόνες, Διαγράμματα
    • Η παρούσα διπλωματική εργασία αφορά στη χρήση μεθόδων μηχανικής μάθησης με σκοπό την ταξινόμηση του καρκίνου του μαστού και την εξαγωγή αποτελεσμάτων επίδοσής τους. Χρησιμοποιούνται ο αλγόριθμος ταξινόμησης k – κοντινότερων γειτόνων (knn) και ο αλγόριθμος ομαδοποίησης k – means και ως δεδομένα, το σύνολο δεδομένων Breast Cancer (Diagnostics) dataset (WBC), από το αποθετήριο UCI, το οποίο αφορά περιστατικά του καρκίνου του μαστού. Τα δεδομένα αυτά είναι ταξινομημένα με χρήση εννέα (9) χαρακτηριστικών, σε καλοήθη και κακοήθη. Στη συνέχεια, για το ποσοστό επίδοσης, υπολογίζονται οι μετρικές: ακρίβεια (accuracy), ευαισθησία (sensitivity) και εξειδίκευση (specificity). Τα αποτελέσματα που παράχθηκαν ανέρχονται στα εξής ποσοστά: ακρίβεια 100%, ευαισθησία 100%, εξειδίκευση 100%, κατά την εκτέλεση και των δύο αλγορίθμων, που οδηγεί στην μέγιστη επίδοση και άρα έγκυρη ταξινόμηση.
    • The present dissertation concerns the use of machine learning methods in order to classify breast cancer data and to extract their performance results. The k - nearest neighbors (knn) classification algorithm and the k - means clustering algorithm are used in order to transact our data which is the Breast Cancer (Diagnostics) dataset (WBC), from the UCI repository for breast cancer cases. This data is classified using nine (9) attributes, into benign and malignant. Moreover, to appraise the performance rate, the metrics that are calculated are: the accuracy, the sensitivity and the specificity. The results produced amount to the following percentages: 100% accuracy, 100% sensitivity, 100% specificity, for both algorithms, which leads to maximum performance and therefore valid classification.
  14. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.