- MSc thesis
- Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
- 21 Σεπτεμβρίου 2024
- Αγγλικά
- 52
- ΣΥΜΕΩΝΙΔΗΣ ΠΑΝΑΓΙΩΤΗΣ
- Γεωργία Γκαράνη | Παναγιώτης Συμεωνίδης |Ταμπούρης Θέμης
- Differential Privacy | FAIRNESS | PRIVATE | PRIVATE AND FAIR JOB RECOMMENDATION SYSTEMS
- Εξειδίκευση στα Πληροφοριακά Συστήματα /ΠΛΣ
- 46
- ΠΕΡΙΛΑΜΒΑΝΕΙ ΠΙΝΑΚΕΣ ΚΑΙ ΔΙΑΓΡΑΜΜΑΤΑ
-
-
This thesis delves into the multifaceted world of job recommendation systems, examining the bal-
ance between performance, fairness, and privacy. Through an in-depth analysis of various algorithms-
collaborative filtering, deterministic re-ranking methods, hybrid approaches, and privacy-preserving
techniques—this study highlights their respective strengths and weaknesses in terms of accuracy,
equity, and user data protection.
Collaborative filtering has proven to be highly effective in maintaining high utility scores, con-
sistently providing relevant job recommendations. However, this approach often falls short in en-
suring fairness, particularly under noisy conditions. Moreover, traditional collaborative filtering
methods raise significant privacy concerns as they typically require centralized data collection and
processing. In contrast, re-ranking algorithms such as DetCons, DetGreedy, and DetRelaxed offer a
more balanced approach. These algorithms enhance fairness by ensuring that recommendations do
not disproportionately favor or disadvantage any particular user group, albeit with a slight trade-off
in performance.
Privacy-preserving techniques, including differential privacy, federated learning, and local dif-
ferential privacy, address the critical need for data protection in recommender systems. Differential
privacy adds controlled noise to the data, ensuring individual user data remains indistinguishable
within the dataset. Federated learning allows model training to occur on user devices, keeping raw
data local and only sharing aggregated updates. Local differential privacy further enhances this by
randomizing data on the user’s device before sharing, thus providing strong privacy guarantees.
The research employed both synthetic data and real-world datasets like XING to validate the
effectiveness of these algorithms. Metrics such as NDCG, NDKL, and XNDKL were used to com-
prehensively assess the utility, fairness, and privacy of the recommendation systems. The findings
revealed that re-ranking algorithms are generally more robust in handling noise and maintaining fair
representation across different user groups. Privacy-preserving techniques, while slightly reducing
accuracy, significantly enhance user trust and data security.
In summary, this thesis underscores the importance of choosing the right algorithm based on
the specific priorities of fairness, performance, and privacy. Re-ranking algorithms provide a bal-
anced solution, particularly effective in low to high noise scenarios, while collaborative filtering
guarantees high utility but may compromise fairness and privacy under noisy conditions. Privacy-
preserving techniques are crucial for protecting user data, making them an essential consideration
in the design of modern job recommendation systems. -
Αυτή η διπλωματική εργασία εξετάζει τον πολυδιάστατο κόσμο των συστημάτων προτάσεων εργασίας, εστιάζοντας στην ισορροπία μεταξύ απόδοσης, δικαιοσύνης και ιδιωτικότητας. Μέσα από μια εις βάθος ανάλυση διαφόρων αλγορίθμων—συνεργατικής διήθησης, ντετερμινιστικών μεθόδων ανακατάταξης, υβριδικών προσεγγίσεων και τεχνικών διασφάλισης της ιδιωτικότητας—η μελέτη αναδεικνύει τα αντίστοιχα πλεονεκτήματα και μειονεκτήματά τους όσον αφορά την ακρίβεια, την ισότητα και την προστασία των δεδομένων των χρηστών.
Η συνεργατική διήθηση έχει αποδειχθεί ιδιαίτερα αποτελεσματική στη διατήρηση υψηλών βαθμολογιών χρησιμότητας, παρέχοντας σταθερά σχετικές προτάσεις εργασίας. Ωστόσο, αυτή η προσέγγιση συχνά αποτυγχάνει να εξασφαλίσει δικαιοσύνη, ιδιαίτερα σε συνθήκες με θόρυβο. Επιπλέον, οι παραδοσιακές μέθοδοι συνεργατικής διήθησης εγείρουν σημαντικές ανησυχίες σχετικά με την ιδιωτικότητα, καθώς απαιτούν συνήθως κεντρική συλλογή και επεξεργασία δεδομένων. Αντίθετα, οι αλγόριθμοι ανακατάταξης όπως οι DetCons, DetGreedy και DetRelaxed προσφέρουν μια πιο ισορροπημένη προσέγγιση. Αυτοί οι αλγόριθμοι βελτιώνουν τη δικαιοσύνη, διασφαλίζοντας ότι οι προτάσεις δεν ευνοούν ή αδικούν δυσανάλογα καμία συγκεκριμένη ομάδα χρηστών, αν και με μικρό συμβιβασμό στην απόδοση.
Οι τεχνικές διασφάλισης της ιδιωτικότητας, συμπεριλαμβανομένων της διαφορικής ιδιωτικότητας, της ομοσπονδιακής μάθησης και της τοπικής διαφορικής ιδιωτικότητας, αντιμετωπίζουν την κρίσιμη ανάγκη προστασίας δεδομένων στα συστήματα προτάσεων. Η διαφορική ιδιωτικότητα προσθέτει ελεγχόμενο θόρυβο στα δεδομένα, διασφαλίζοντας ότι τα προσωπικά δεδομένα των χρηστών παραμένουν δυσδιάκριτα στο σύνολο δεδομένων. Η ομοσπονδιακή μάθηση επιτρέπει την εκπαίδευση μοντέλων στις συσκευές των χρηστών, διατηρώντας τα ακατέργαστα δεδομένα τοπικά και μοιράζοντας μόνο συγκεντρωμένες ενημερώσεις. Η τοπική διαφορική ιδιωτικότητα ενισχύει περαιτέρω αυτό το επίπεδο προστασίας, τυχαίως προσαρμόζοντας τα δεδομένα στη συσκευή του χρήστη πριν από την κοινή χρήση τους, παρέχοντας έτσι ισχυρές εγγυήσεις ιδιωτικότητας.
Η έρευνα χρησιμοποίησε τόσο συνθετικά δεδομένα όσο και πραγματικά σύνολα δεδομένων όπως το XING για την επικύρωση της αποτελεσματικότητας αυτών των αλγορίθμων. Μετρήσεις όπως οι NDCG, NDKL και XNDKL χρησιμοποιήθηκαν για να αξιολογήσουν συνολικά τη χρησιμότητα, τη δικαιοσύνη και την ιδιωτικότητα των συστημάτων προτάσεων. Τα ευρήματα αποκάλυψαν ότι οι αλγόριθμοι ανακατάταξης είναι γενικά πιο ανθεκτικοί στη διαχείριση θορύβου και στη διατήρηση δίκαιης εκπροσώπησης σε διαφορετικές ομάδες χρηστών. Οι τεχνικές διασφάλισης ιδιωτικότητας, αν και ελαφρώς μειώνουν την ακρίβεια, ενισχύουν σημαντικά την εμπιστοσύνη των χρηστών και την ασφάλεια των δεδομένων.
Συνοψίζοντας, αυτή η διπλωματική εργασία υπογραμμίζει τη σημασία της επιλογής του κατάλληλου αλγορίθμου με βάση τις προτεραιότητες δικαιοσύνης, απόδοσης και ιδιωτικότητας. Οι αλγόριθμοι ανακατάταξης παρέχουν μια ισορροπημένη λύση, ιδιαίτερα αποτελεσματική σε σενάρια με χαμηλό έως υψηλό θόρυβο, ενώ η συνεργατική διήθηση εγγυάται υψηλή χρησιμότητα αλλά μπορεί να υπονομεύσει τη δικαιοσύνη και την ιδιωτικότητα σε συνθήκες με θόρυβο. Οι τεχνικές διασφάλισης ιδιωτικότητας είναι κρίσιμες για την προστασία των δεδομένων των χρηστών, καθιστώντας τις ουσιώδες παράγοντα στο σχεδιασμό σύγχρονων συστημάτων προτάσεων εργασίας.
-
- Hellenic Open University
- Αναφορά Δημιουργού 4.0 Διεθνές
PRIVATE AND FAIR JOB RECOMMENDATION SYSTEMS
Ιδιωτικά και Δίκαια Συστήματα Προτάσεων Εργασίας (Ελληνική)
Κύρια Αρχεία Διατριβής
- PRIVATE AND FAIR JOB RECOMMENDATION SYSTEMS
Περιγραφή: PRIVATE AND FAIR JOB RECOMMENDATION SYSTEMS.pdf (pdf) Book Reader
Μέγεθος: 0.5 MB