Τα δέντρα απόφασης είναι ένας διαδομένος και εύχρηστος τρόπος οργάνωσης και απεικόνισης βάσεων γνώσης για έμπειρα συστήματα. Ουσιαστικά πρόκειται για μια απλή μορφή αναπαράστασης κανόνων, με βάση τους οποίους γίνεται κατηγοριοποίηση των δεδομένων, και είναι ευρέως διαδεδομένα, επειδή είναι εύκολα κατανοητά από τον άνθρωπο.
Η εργασία αφορά σε μία εφαρμογή που κατασκευάζει δέντρα απόφασης χρησιμοποιώντας γενετικούς αλγόριθμους και πιο συγκεκριμένα τον αλγόριθμο GATree. Η εφαρμογή ήταν αρχικά γραμμένη σε Borland Delphi και C++ αξιοποιώντας παρωχημένες (με τα σημερινά δεδομένα) βιβλιοθήκες διαχείρισης δομών δεδομένων και έχει μεταγραφεί σε Java και στη συνέχεια σε R.
Συγκεκριμένα, εξελίχθηκαν-τροποποιήθηκαν οι συναρτήσεις της σε R, έτσι ώστε να μπορεί να χειριστεί διάφορους τύπους δεδομένων. Επίσης τροποποιήθηκε η εφαρμογή έτσι ώστε κάποιες εργασίες να εκτελούνται παράλληλα, αξιοποιώντας τον εγγενή παραλληλισμό των γενετικών αλγορίθμων αλλά και υπάρχουσες βιβλιοθήκες της R. Τέλος έγινε δοκιμή-αξιολόγησή της πάνω σε ευρέως χρησιμοποιούμενα σύνολα δεδομένων και σε περιβάλλον υπολογιστικού πλέγματος (grid) δείχνοντας με αυτό την ευκολία με την οποία η εφαρμογή μπορεί να μεταφερθεί σε διαφορετικές υπολογιστικές πλατφόρμες, αξιοποιώντας πανίσχυρα συστήματα στο cloud με απώτερο σκοπό την αύξηση της ταχύτητάς της.
Decision trees are a common and easy way to organize and visualize knowledge bases for expert systems. A decision tree is essentially a simple form of representation of a set of rules, on the basis of which data is categorized. Decision trees are widely used because they are easily understood by humans.
This work concerns an application that constructs decision trees using genetic algorithms and more specifically the GATree algorithm. The application was originally written in Borland Delphi and C ++ utilizing obsolete (in relation with today’s specifications) data structure management libraries and has been transcribed into Java and then into R.
In particular, its functions have been transcribed into R so that it can handle different types of data. The application was also modified so that some tasks can be performed in parallel, utilizing the inherent parallelism of the genetic algorithms and existing libraries of R. Finally, it was tested-evaluated on widely used data sets and in a cloud environment, thus showing the ease with which the application can be transferred to different computing platforms by utilizing powerful cloud systems with the ultimate goal of increasing its process speed.
Κατασκευή Δέντρων Απόφασης με Χρήση Γενετικών Αλγορίθμων και R: εφαρμογή σε τυποποιημένα σύνολα δεδομένων και στην εκπαίδευση Περιγραφή: 130942_ΙΑΚΩΒΑΚΗΣ_ΑΠΟΣΤΟΛΟΣ.pdf (pdf)
Book Reader Άδεια: Αναφορά Δημιουργού-Μη Εμπορική Χρήση 4.0 Διεθνές Μέγεθος: 2.2 MB
Κατασκευή Δέντρων Απόφασης με Χρήση Γενετικών Αλγορίθμων και R: εφαρμογή σε τυποποιημένα σύνολα δεδομένων και στην εκπαίδευση - Identifier: 78151
Internal display of the 78151 entity interconnections (Node labels correspond to identifiers)