Αλγόριθμοι μηχανικής μάθησης για την εξόρυξη δεδομένων

Machine learning algorithms in data mining (Αγγλική)

  1. MSc thesis
  2. Oikonomou, Stavros
  3. Μεταπτυχιακές Σπουδές στα Μαθηματικά (ΜΣΜ)
  4. 26 Σεπτεμβρίου 2020 [2020-09-26]
  5. Ελληνικά
  6. 197
  7. Sotiropoulos, Dimitrios
  8. Tsitsas, Nikolaos
  9. Μηχανική Μάθηση | Machine Learning | Εξόρυξη Δεδομένων | Data mining | Αλγόριθμοι Ταξινόμησης | Classification Algorithms | Αλγόριθμοι Παλινδρόμησης | Regression Algorithms | Μη Επιβλεπόμενη Μάθηση | Unsupervised Learning
  10. 2
  11. 3
  12. 26
  13. 0
    • Η παρούσα διπλωματική εργασία έχει ως θέμα τους αλγόριθμους μηχανικής μάθησης. Ο κύριος άξονάς της είναι μια συνολική παρουσίαση των δημοφιλέστερων αλγορίθμων επιβλεπόμενης και μη επιβλεπόμενης μάθησης. Αρχικά έχουμε την μαθηματική παρουσίαση των αλγορίθμων, ύστερα την εφαρμογή τους σε πραγματικά δεδομένα με χρήση της γλώσσας προγραμματισμού R και τέλος τον σχολιασμό και την σύγκριση των αλγορίθμων και της απόδοσής τους. Στο πρώτο κεφάλαιο γίνεται μια εισαγωγή στην μηχανική μάθηση και στην εξόρυξη των δεδομένων, το δεύτερο κεφάλαιο αναφέρεται στους βασικούς αλγορίθμους για προβλήματα παλινδρόμησης, στα επόμενα τρία κεφάλαια (3,4,5) γίνεται αναφορά στους κυριότερους αλγόριθμους ταξινόμησης ενώ στο κεφάλαιο έξι παρουσιάζουμε τους αλγόριθμους μη επιβλεπόμενης μάθησης. Τέλος, στο κεφάλαιο εφτά εφαρμόζουμε και συγκρίνουμε τους αλγόριθμους ταξινόμησης σε βάση δεδομένων με μετρήσεις σε όγκους για την διάγνωση του καρκίνου του μαστού. Οι βάσεις δεδομένων της εργασίας καθώς και ο κώδικας στην R υπάρχει ανεβασμένος και στο GitHub μου, στο https://github.com/stavoikono/Thesis .
    • This dissertation investigates Machine Learning algorithms. The study focuses on an overall examination of the most frequently used supervised and unsupervised machine learning algorithms. Initially, we have the mathematical presentation of the algorithms, then their application to real data using the programming language R and, finally, the commentary and comparison of the algorithms and their performance. The first chapter is an introduction to machine learning and data mining, the second chapter refers to the basic algorithms for regression problems, in the next three chapters (3,4,5) reference is made to the main classification algorithms while in chapter six we present the unsupervised learning algorithms. Finally, in chapter seven we apply and compare the classification algorithms in a database with tumor measurements for breast cancer diagnosis. All the datasets used in this thesis as well as the R code are uploaded to my GitHub at https://github.com/stavoikono/Thesis .
  14. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.