Χρήση word-embeddings για την παραγωγή περιλήψεων από απαντήσεις σε ερωτήσεις ανοικτού τύπου στην αξιολόγηση εκπαιδευτικών διαδικασιών

Using word-embeddings to generate summaries from responses to open-ended questions in the evaluation of educational processes (Αγγλική)

  1. MSc thesis
  2. ΜΙΛΤΙΑΔΗΣ ΡΙΖΟΣ
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 20 Σεπτεμβρίου 2025
  5. Ελληνικά
  6. 93
  7. Δρ. Καρούσος , Νικόλαος
  8. Neural Word Embeddings | Επεξεργασία Φυσικής Γλώσσας (ΕΦΓ) | γλωσσικό μοντέλο Ελληνικής γλώσσας | δείκτης συνημιτονικής ομοιότητας | textRank | βάση διανυσμάτων Qdrant | S-BERT | περίληψη σε απαντήσεις ανοικτού τύπου | αναγνώριση οντοτήτων (NER)
  9. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα / ΠΛΣ
  10. 20
  11. Περιλαμβάνει: Εικόνες, Διαγράμματα, Κώδικα
    • Η εργασία αυτή στοχεύει στη χρήση της τεχνολογίας word-embedding για την εξαγωγή προτάσεων υψηλής σημαντικότητας από απαντήσεις σε ερωτήσεις ανοικτού τύπου που χρησιμοποιούνται στην αξιολόγηση εκπαιδευτικών διαδικασιών. Το word-embedding, μία τεχνική επεξεργασίας φυσικής γλώσσας (NLP), αναπαριστά τις λέξεις ως διανύσματα σε έναν πολυδιάστατο χώρο, επιτρέποντας την εντόπιση λέξεων με παρόμοιες σημασίες μέσω της εγγύτητάς τους.

      Η εργασία περιλαμβάνει βήματα όπως η ανωνυμοποίηση, η κανονικοποίηση δεδομένων και η ανάλυση προτάσεων με αλγορίθμους όπως το TextRank και η χρήση δεικτών ομοιότητας. Αντιμετωπίζει το πρόβλημα των επαναλαμβανόμενων προτάσεων που δεν προσφέρουν πρόσθετη πληροφορία, προτείνοντας τη χρήση word-embedding για τη συγχώνευση αυτών των προτάσεων σε συνοπτικές και πιο εκφραστικές.

      Στόχος της διπλωματικής εργασίας είναι η έρευνα και αξιολόγηση διαφόρων μεθόδων word-embedding, όπως τα GloVe, FastText, BERT, Doc2Vec, και άλλα, λαμβάνοντας υπόψη τη δυνατότητα χρήσης τους στην ελληνική γλώσσα και την προσαρμοστικότητά τους. Το τελικό αποτέλεσμα περιλαμβάνει ένα αρχείο που περιέχει μία λίστα σημαντικών προτάσεων χωρίς επαναληπτικότητα. Στη συνέχεια το υπόλοιπο έργο θα εξάγει ένα κείμενο εξαγωγής περιεχομένου (extractive summarization) και εν συνεχεία μία αφαιρετική σύνοψη (abstractive summarization) που θα είναι έτοιμη προς ανάγνωση.

      Η εργασία αποτελεί μέρος ενός μεγαλύτερου έργου που επιδιώκει την αυτοματοποίηση της ανάλυσης δεδομένων εκπαιδευτικής αξιολόγησης, προσφέροντας καινοτόμες λύσεις στην επεξεργασία φυσικής γλώσσας και στη βελτίωση της ποιότητας των περιλήψεων.

    • This thesis aims to utilize word-embedding technology for extracting high-importance sentences from responses to open-ended questions used in the evaluation of educational processes. Word-embedding, a natural language processing (NLP) technique, represents words as vectors in a multidimensional space, allowing for the identification of semantically similar words through their proximity.

      The study includes steps such as anonymization, data normalization, and sentence analysis using algorithms like TextRank and similarity indices. It addresses the issue of repetitive sentences that do not add additional information by proposing the use of word-embedding to merge such sentences into more concise and expressive ones.

      The goal of this thesis is to research and evaluate various word-embedding methods, such as GloVe, FastText, BERT, Doc2Vec, and others, considering their applicability to the Greek language and their adaptability. The final result includes a file containing a list of significant sentences without redundancy. Subsequently, the rest of the project will generate an extractive summary and then an abstractive summary that is ready for reading.

      This work is part of a larger project that aims to automate the analysis of educational evaluation data, offering innovative solutions in natural language processing and enhancing the quality of generated summaries.

  12. Hellenic Open University
  13. Αναφορά Δημιουργού 4.0 Διεθνές