Τεχνικές Απόκρυψης σε Δέντρα Απόφασης

Data Hiding Techniques in Decision Trees (Αγγλική)

  1. MSc thesis
  2. Κυριτσάκη, Μεταξία
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 18 Σεπτεμβρίου 2022 [2022-09-18]
  5. Ελληνικά
  6. 89
  7. Καλλές, Δημήτριος
  8. Ζαφείρης, Βασίλειος | Σακκόπουλος, Ευάγγελος
  9. Δέντρα Απόφασης | Decision Trees | Απόκρυψη Κανόνων | Hiding Rules | Python
  10. 1
  11. 40
  12. Περιέχει : πίνακες, εικόνες
    • Στη σημερινή εποχή, η οποία χαρακτηρίζεται και ως εποχή της πληροφορίας, η ανάπτυξη της τεχνολογίας και των υπολογιστών, γεννούν καθημερινά έναν τεράστιο όγκο πληροφοριών και δεδομένων προς συλλογή και επεξεργασία. Σε πολλούς τομείς, όπως της υγείας, των οικονομικών, της εκπαίδευσης και πολλών άλλων, η επεξεργασία αυτών μπορεί να προσφέρει πολύτιμη γνώση για βελτίωση και εξέλιξη. Όμως η συλλογή αυτών των πληροφοριών μπορεί να οδηγήσει σε συλλογή και επεξεργασία ευαίσθητων πληροφοριών. Εκεί είναι που εμφανίζεται το πρόβλημα της ιδιοτικότητας. Στην παρούσα εργασία γίνεται εκτενής αναφορά σε δύο τεχνικές που έχουν ως σκοπό την απόκρυψη γνώσης με χρήση δέντρων απόφασης. Στην πρώτη τεχνική γίνεται χρήση του αλγόριθμου τοπικής παραμόρφωσης (LDH), ενώ στη δεύτερη χρησιμοποιούνται γραμμικές διοφαντικές εξισώσεις. Στην πρώτη περίπτωση, του LDH, ο αλγόριθμος τροποποιεί τις τιμές των χαρακτηριστικών συγκεκριμένων περιπτώσεων χωρίς να χρειάζεται να προστεθούν νέα στιγμιότυπα. Στην δεύτερη περίπτωση γίνεται χρήση γραμμικών διοφαντικών εξισώσεων για να προστεθεί ο κατάλληλος αριθμός στιγμιοτύπων για να αποκρύψουμε τον κόμβο και ταυτόχρονα να διατηρηθεί και η αρχική εντροπία του κόμβου. Δημιουργήθηκε αλγόριθμος που διαβάζοντας το δοσμένο σύνολο δεδομένων, δημιουργεί δυαδικό δέντρο απόφασης. Στο μονοπάτι που αποφασίζουμε να χρησιμοποιήσουμε, δηλαδή στο μονοπάτι όπου ανήκει το φύλλο που προσπαθούμε να αποκρύψουμε, είναι διαθέσιμα τα αρνητικά και θετικά στιγμιότυπα του κάθε κόμβου, από το φύλλο μέχρι τη ρίζα. Τα στιγμιότυπα αυτά εφαρμόζονται στις διοφαντικές εξισώσεις, όπου με βάση τα αποτελέσματα αυτών, καταλήγουμε στα επιθυμητά συμπεράσματα.
    • In today's era, which is also characterized as the information age, the development of technology and computers, give birth every day to a huge amount of information and data to be collected and processed. In many areas, such as health, finance, education and many others, the elaboration of these can provide valuable knowledge for improvement and development. But the collection of this information may lead to the collection and processing of sensitive information. This is where the problem of self-sufficiency arises. In this paper there is extensive reference to two techniques that aim to hide knowledge by using decision trees. In the first technique, the local destortion algorithm (LDH) is used, while in the second, linear diophanthantic equations are used. In the first case, of LDH, the algorithm modifies the values of the characteristics of specific cases without the need to add new instances. In the second case, linear diophanthantic equations are used to add the appropriate number of instances to hide the node and at the same time preserve the initial entropy of the node. An algorithm was created that, reading the given data set, creates a binary decision tree. On the path that we decide to use, that is, on the path where the leaf we are trying to hide belongs, the negative and positive instances of each node are available, from the leaf to the root. These instances are applied to the diophantine equations, where based on the results of these, we come to the desired conclusions.
  13. Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές