Κατασκευή Δέντρων Απόφασης με Χρήση Γενετικών Αλγορίθμων και R σε Κατανεμημένο Περιβάλλον

Building Decision Trees Using Genetic Algorithms and R in a Distributed Environment» (Αγγλική)

  1. MSc thesis
  2. ΧΡΗΣΤΟΣ ΚΙΛΙΤΖΙΡΑΚΗΣ
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 29 Μαίου 2023
  5. Ελληνικά
  6. 71
  7. ΚΑΛΛΕΣ , ΔΗΜΗΤΡΙΟΣ
  8. ΚΑΛΛΕΣ, ΔΗΜΗΤΡΙΟΣ | ΡΕΦΑΝΙΔΗΣ, ΙΩΑΝΝΗΣ | Βερύκιος, Βασίλης
  9. δέντρα απόφασης, γενετικοί αλγόριθμοι, μηχανική μάθηση, κατανεμημένη υπολογιστική, client-server, GATree
  10. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (MSc) / ΠΛΣ60
  11. 4
  12. 3
  13. 4
  14. περιλαμβάνει, σχήματα, πίνακες, διαγράμματα
    • Τα δέντρα απόφασης είναι ένας διαδομένος και εύχρηστος τρόπος οργάνωσης και απεικόνισης βάσεων γνώσης για έμπειρα συστήματα. Κατά βάση πρόκειται για μια απλοποιημένη μορφή αναπαράστασης κανόνων, βάσει των οποίων πραγματοποιείται κατηγοριοποίηση των δεδομένων, και είναι ευρέως διαδεδομένα, επειδή είναι εύκολα κατανοητά από τον άνθρωπο.

      Η κατασκευή βέλτιστων δέντρων απόφασης είναι ένα NP-πλήρες πρόβλημα και πλέον χρησιμοποιούνται ευρετικοί αλγόριθμοι για να το λύσουν. Το σύστημα GATree που χρησιμοποιείται σε αυτή τη διατριβή κατασκευάζει δέντρα αποφάσεων χρησιμοποιώντας γενετικούς αλγόριθμους, παράγοντας μικρότερα δέντρα απόφασης από τους «κλασικούς» αλγόριθμους για μια σειρά προβλημάτων.

      Αυτή η διατριβή εστιάζει στην ανάπτυξη ενός προγράμματος  βασισμένου στην αρχιτεκτονική πελάτη (client) - διακομιστή (server) για την κατασκευή δέντρων αποφάσεων χρησιμοποιώντας γενετικούς αλγόριθμους, με έμφαση στη αξιοποίηση κατανεμημένων συστημάτων για τη βελτίωση της αποδοτικότητας και της επεκτασιμότητας.

      Η αρχιτεκτονική πελάτη-διακομιστή επιτρέπει στους πελάτες να αλληλοεπιδρούν με το σύστημα από τις δικές τους συσκευές,   ενώ ο διακομιστής διαχειρίζεται την ροή των βημάτων του αλγορίθμου και την κατανομή των εργασιών στους πελάτες για την κατασκευή δέντρων αποφάσεων. Η χρήση κατανεμημένων συστημάτων κατανέμει το φόρτο εργασίας σε πολλές υπολογιστικές μηχανές, βελτιώνοντας τη συνολική απόδοση και επεκτασιμότητα του προγράμματος.

      Οι προηγούμενες εφαρμογές της βασικής ερευνητικής ιδέας (της χρήσης γενετικών αλγορίθμων για την κατασκευή δέντρων απόφασης)  γράφτηκαν αρχικά σε C++, αλλά έκτοτε έχουν μεταφερθεί σε Java και R. Η τελευταία υλοποίηση έχει δοκιμαστεί σε περιβάλλοντα υπολογιστών πλέγματος και περιλαμβάνει τεχνικές για τη διαχείριση αριθμητικών δεδομένων και τη χρήση του εγγενούς παραλληλισμού γενετικών αλγορίθμων.

      Συνολικά, αυτή η εργασία δημιουργεί την υποδομή και συμβάλλει στην διαχείριση και ανάπτυξη πιο αποτελεσματικών και επεκτάσιμων συστημάτων κατασκευής δέντρων αποφάσεων μέσω της χρήσης κατανεμημένων συστημάτων και γενετικών αλγορίθμων, με πιθανές εφαρμογές σε διάφορους τομείς  της τεχνητής νοημοσύνης όπως η εξόρυξη δεδομένων και  η μηχανική μάθηση.

    • This thesis focuses on the development of a client-server program for building decision trees using genetic algorithms, with an emphasis on utilizing distributed systems to improve efficiency and scalability.

      The client-server architecture allows clients to interact with a system from their own devices, while the server manages the flow of the algorithmic steps and the distribution of tasks to clients to create decision trees. The use of distributed systems spreads the workload across multiple computational machines, improving the overall performance and scalability of the program.

      Constructing optimal decision trees is an NP-complete problem, and heuristic algorithms are now used to solve it. The GATree system used in this thesis constructs decision trees using genetic algorithms, producing smaller decision trees than "classical" algorithms for a range of problems.

      Previous implementations of the underlying concept were originally written in C++, but have since been ported into Java and R. The latest implementation has been tested in grid computing environments and includes techniques for handling numerical data and using the inherent parallelism of genetic algorithms.

      Overall, this work provides the infrastructure and contributes to the management and development of more efficient and scalable decision tree construction systems using distributed systems and genetic algorithms, with potential applications in various fields such as data mining and machine learning.

  15. Hellenic Open University
  16. Αναφορά Δημιουργού 4.0 Διεθνές