Τεχνικές Απόκρυψης Δεδομένων σε Δέντρα Απόφασης με Εφαρμογή σε Τραπεζικά Δεδομένα

Data hiding techniques in decision trees applied in Banking Data (english)

  1. MSc thesis
  2. Παπαδάκη, Μαρία
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 18 September 2021 [2021-09-18]
  5. Ελληνικά
  6. 92
  7. Καλλές, Δημήτρης
  8. Κωτσιαντής, Σωτήριος | Παπαμιχαήλ, Γεώργιος
  9. Απόκρυψη | Hiding | WEKA | WEKA | Εξόρυξη δεδομένων | Data Mining | Ιδιωτικότητα Δεδομένων | Data Privacy
  10. 2
  11. 21
  12. Περιέχει : πίνακες, εικόνες
    • Στην σύγχρονη εποχή όλο και μεγαλύτερη είναι η ανάγκη της ανακάλυψης γνώσης μέσα από σύνολα δεδομένων. Η επιστήμη της εξόρυξη δεδομένων εξελίσσεται ραγδαία τα τελευταία χρόνια και η χρήση αλγορίθμων ομαδοποίησης ή κατηγοριοποίησης και των αρχών της στατιστικής, της τεχνητής νοημοσύνης, της μηχανικής μάθησης και των συστημάτων βάσεων δεδομένων αποτελούν την νέα πραγματικότητα στις επιχειρήσεις. Στον χρηματοπιστωτικό τομέα γίνονται τεράστιες επενδύσεις στην δημιουργία μοντέλων από τα δεδομένα που συλλέγει ο οργανισμός ώστε να λαμβάνονται αποφάσεις που μεγιστοποιούν την αποτελεσματικότητα του οργανισμού. Ο ανταγωνισμός μεταξύ των οργανισμών του τραπεζικού κλάδου είναι πολύ έντονος και πολλές φορές δεδομένα που συλλέγονται είναι πολύ πιθανό να καταλήξουν σε κάποια τράπεζα του ανταγωνισμού ή να χρειαστεί να κοινοποιηθούν σε κάποιο εποπτικό φορέα. Στην παρούσα εργασία γίνεται αναφορά σε δύο τεχνικές που έχουν ως σκοπό την απόκρυψη της γνώσης μέσα από δέντρα αποφάσεων. Στην πρώτη τεχνική γίνεται χρήση γραμμικών διοφαντικών εξισώσεων για να προστεθεί ο κατάλληλος αριθμός στιγμιότυπων ώστε να αποκρύψουμε τον κόμβο αλλά να διατηρηθεί και η αρχική εντροπία του κόμβου. Στην δεύτερη τεχνική γίνεται χρήση του αλγόριθμού τοπικής παραμόρφωσης (LDH) που τροποποιεί τις τιμές των χαρακτηριστικών συγκεκριμένων περιπτώσεων χωρίς να χρειάζεται να προστεθούν νέα στιγμιότυπα. Στην συνέχεια γίνεται δημιουργία ενός μοντέλου διαχείρισης δανείων ιδιωτών με καθυστέρηση. Η τεχνική της απόκρυψης με τοπική παραμόρφωση (LDH) εφαρμόζεται στο μοντέλο μέσω εφαρμογής που έχει υλοποιηθεί για τον συγκεκριμένο αλγόριθμο. Τα αποτελέσματα της απόκρυψης αξιολογούνται για την μέτρηση της αποτελεσματικότητας της μεθόδου.
    • In recent years there is a growing need for knowledge discovery through data sets. The science of data mining is evolving rapidly and the use of grouping or categorization algorithms and the principles of statistics, artificial intelligence, machine learning and database systems are the new reality in business. In the financial sector, huge investments are made in the creation of models from the data collected by the organization in order to make decisions that maximize the efficiency of the organization. Competition between the organizations in the financial sector is very intense and quite often the data collected could likely be made available to a competing organization or need to be disclosed or made public by a supervisory body. In the present work, reference we use two techniques to hide knowledge through decision trees. In the first technique we use linear Diophantine equations to add the appropriate number of instances while we try to maintain the initial entropy of the nodes. In the second technique we use the Local Distortion Hiding (LDH) algorithm, that modifies the attributes’ values of specific instances by not requiring the addition of extra instances . Α model for managing overdue loans is created. The local distortion hiding (LDH) technique is applied to the model through an application implemented for the specific algorithm. The results of hiding are evaluated to measure the effectiveness of the method.
  13. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.