- MSc thesis
- Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
- 21 Σεπτεμβρίου 2025
- Ελληνικά
- 93
- ΚΩΤΣΙΑΝΤΗΣ ΣΩΤΗΡΙΟΣ
- Συνθετικά δεδομένα, Παραγωγικά Αντίπαλα Δίκτυα (GANs), μαθησιακή αναλυτική, εκπαιδευτική πρόβλεψη, ιδιωτικότητα δεδομένων, στατιστική σύγκριση, τεχνητή νοημοσύνη
- Πρόγραμμα Σπουδών: Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα
- 1
- 47
-
-
Η παρούσα εργασία διερευνά τη δημιουργία και αξιοποίηση συνθετικών δεδομένων στο πεδίο της μαθησιακής αναλυτικής, με ιδιαίτερη έμφαση στη διασφάλιση της ιδιωτικότητας και την υπέρβαση περιορισμών πρόσβασης σε πραγματικά δεδομένα.
Στόχος είναι η αξιολόγηση της αποτελεσματικότητας των τεχνητών δεδομένων στην ενίσχυση των μοντέλων πρόβλεψης εκπαιδευτικών επιδόσεων και η σύγκρισή τους με πραγματικά δεδομένα. Αρχικά, πραγματοποιήθηκε συλλογή και προεπεξεργασία πραγματικών δεδομένων από αξιολογήσεις μαθητών, τα οποία χρησιμοποιήθηκαν ως βάση για την εκπαίδευση των GANs.
Επιπλέον, η εργασία αυτή εστιάζει κυρίως στη χρήση Παραγωγικών Αντίπαλων Δικτύων (Generative Adversarial Networks - GANs) ως μεθοδολογικό εργαλείο για την παραγωγή δεδομένων που προσομοιάζουν στατιστικά τα πραγματικά. Μέσω συγκριτικής αξιολόγησης και στατιστικής ανάλυσης, εξετάζεται η ποιότητα και η αξιοπιστία των παραγόμενων δεδομένων, καθώς και η εν δυνάμει εφαρμογή τους σε σενάρια εκπαιδευτικής πρόβλεψης. Επιπλέον, γίνεται αναφορά σε σύγχρονες βιβλιοθήκες Python που διευκολύνουν την παραγωγή τεχνητών συνόλων δεδομένων. Η μελέτη αποσκοπεί στη συμβολή στην ανάπτυξη βιώσιμων μεθόδων υποστήριξης της εκπαιδευτικής διαδικασίας, μέσα από τη χρήση αξιόπιστων συνθετικών δεδομένων που διατηρούν την επιστημονική εγκυρότητα.
Η έρευνα αναδεικνύει τα πλεονεκτήματα της παραγωγής συνθετικών δεδομένων, όπως η διατήρηση της ιδιωτικότητας και η αντιμετώπιση της ανισορροπίας δεδομένων. Ωστόσο, επισημαίνει και περιορισμούς, όπως η υπολογιστική πολυπλοκότητα των GANs. Μελλοντικές έρευνες θα μπορούσαν να εξετάσουν εναλλακτικές μεθόδους παραγωγής δεδομένων και την εφαρμογή τους σε διαφορετικά εκπαιδευτικά περιβάλλοντα. -
This study focuses on the creation and utilization of synthetic data in the field of learning analytics, with particular emphasis on ensuring privacy and overcoming access restrictions to real data.
The aim is to evaluate the effectiveness of artificial data in strengthening educational performance prediction models and to compare them with real data. Initially, real data from student assessments was collected and pre-processed, which were used as a basis for training GANs.
Furthermore, this paper focuses mainly on the use of Generative Adversarial Networks (GANs) as a methodological tool for producing data that statistically simulates real data. Through comparative evaluation and statistical analysis, the quality and reliability of the produced data are examined, as well as their potential application in educational prediction scenarios. In addition, reference is made to modern Python libraries that facilitate the production of artificial data sets. The study aims to contribute to the development of sustainable methods to support the educational process, through the use of reliable synthetic data that maintain scientific validity.
The research highlights the advantages of synthetic data generation, such as preserving privacy and addressing data imbalance. However, it also highlights limitations, such as the computational complexity of GANs. Future research could examine alternative data generation methods and their application in different educational environments.
-
- Hellenic Open University
- Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Παραγωγή τεχνητών δεδομένων και αξιοποίησή τους στην μαθησιακή αναλυτική.
Αrtificial data generation. A case study in learning analytics. (Αγγλική)
Κύρια Αρχεία Διατριβής
- Παραγωγή τεχνητών δεδομένων και αξιοποίησή τους στην μαθησιακή αναλυτική
Περιγραφή: Παραγωγή τεχνητών δεδομένων και αξιοποίησή τους στην μαθησιακή αναλυτική.pdf (pdf) Book Reader
Μέγεθος: 1.4 MB