Η παρούσα διπλωματική εργασία έχει ως θέμα τους αλγόριθμους
μηχανικής μάθησης. Ο κύριος άξονάς της είναι μια συνολική
παρουσίαση των δημοφιλέστερων αλγορίθμων επιβλεπόμενης και μη
επιβλεπόμενης μάθησης. Αρχικά έχουμε την μαθηματική παρουσίαση
των αλγορίθμων, ύστερα την εφαρμογή τους σε πραγματικά δεδομένα
με χρήση της γλώσσας προγραμματισμού R και τέλος τον σχολιασμό
και την σύγκριση των αλγορίθμων και της απόδοσής τους. Στο πρώτο
κεφάλαιο γίνεται μια εισαγωγή στην μηχανική μάθηση και στην
εξόρυξη των δεδομένων, το δεύτερο κεφάλαιο αναφέρεται στους
βασικούς αλγορίθμους για προβλήματα παλινδρόμησης, στα επόμενα
τρία κεφάλαια (3,4,5) γίνεται αναφορά στους κυριότερους αλγόριθμους
ταξινόμησης ενώ στο κεφάλαιο έξι παρουσιάζουμε τους αλγόριθμους μη
επιβλεπόμενης μάθησης. Τέλος, στο κεφάλαιο εφτά εφαρμόζουμε και
συγκρίνουμε τους αλγόριθμους ταξινόμησης σε βάση δεδομένων με
μετρήσεις σε όγκους για την διάγνωση του καρκίνου του μαστού. Οι
βάσεις δεδομένων της εργασίας καθώς και ο κώδικας στην R υπάρχει
ανεβασμένος και στο GitHub μου, στο
https://github.com/stavoikono/Thesis .
This dissertation investigates Machine Learning algorithms. The study
focuses on an overall examination of the most frequently used
supervised and unsupervised machine learning algorithms. Initially, we
have the mathematical presentation of the algorithms, then their
application to real data using the programming language R and, finally,
the commentary and comparison of the algorithms and their
performance. The first chapter is an introduction to machine learning
and data mining, the second chapter refers to the basic algorithms for
regression problems, in the next three chapters (3,4,5) reference is made
to the main classification algorithms while in chapter six we present the
unsupervised learning algorithms. Finally, in chapter seven we apply and
compare the classification algorithms in a database with tumor
measurements for breast cancer diagnosis. All the datasets used in this
thesis as well as the R code are uploaded to my GitHub at
https://github.com/stavoikono/Thesis .
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Αλγόριθμοι μηχανικής μάθησης για την εξόρυξη δεδομένων Περιγραφή: 134850_ΟΙΚΟΝΟΜΟΥ_ΣΤΑΥΡΟΣ.pdf (pdf)
Book Reader Πληροφορίες: Διπλωματική_Εργασία Μέγεθος: 3.8 MB
Αλγόριθμοι μηχανικής μάθησης για την εξόρυξη δεδομένων - Identifier: 75267
Internal display of the 75267 entity interconnections (Node labels correspond to identifiers)