- Bachelor’s thesis
- Πληροφορική (ΠΛΗ)
- 22 Ιουλίου 2023
- Ελληνικά
- 143
- Φιτσιλής, Παναγιώτης
- Αλέπης, Ευθύμιος | Ταμπακάς, Βασίλειος
- NLP | Ανάλυση Συναισθήματος | Μηχανική Μάθηση | Εκπαιδευτικά Δεδομένα | EDM
- Πληροφορική/ΠΛΗ40 Πρακτική Εξάσκηση σε θέματα Λογισμικού
- 2
- 2
- 91
- Περιλαμβάνει πίνακες εικόνες, διαγράμματα, και κώδικα
-
-
Οι αλλαγές που συντελούνται στην περιοχή της εκπαίδευσης τα τελευταία χρόνια είναι τεκτονικές. Κύριος φορέας αυτών των αλλαγών, θεωρείται ο ψηφιακός μετασχηματισμός και άρα η κατακόρυφη αύξηση των πόρων ηλεκτρονικής μάθησης, του εκπαιδευτικού λογισμικού καθώς και η χρήση του διαδικτύου στην εκπαίδευση. Τα εκπαιδευτικά ιδρύματα συγκεντρώνουν όλο και μεγαλύτερο όγκο ετερογενών δεδομένων, η επεξεργασία και ανάλυση των οποίων αποτελεί πραγματική πρόκληση αλλά και αποφέρει σημαντικά οφέλη, αφού η αξιοποίηση τους, όχι μόνο θα επιτρέψει την επιτάχυνση της προσαρμογή των εκπαιδευτικών συστημάτων στις προκλήσεις της εποχής, αλλά και στην εκμετάλλευση των επαναστατικών δυνατότητων των νέων εκπαιδευτικών τεχνολογιών.
Η Εξόρυξη Εκπαιδευτικών Δεδομένων (Educational Data Mining - EDM) είναι ένας αναδυόμενος κλάδος που ασχολείται με την ανάπτυξη μεθόδων για την εξερεύνηση των ολοένα πιο μεγάλης κλίμακας δεδομένων που προέρχονται από εκπαιδευτικά περιβάλλοντα, καθώς και τη χρήση αυτών των μεθόδων για την καλύτερη κατανόηση των μαθητών και της μαθησιακής διαδικασίας. Η εξόρυξη εκπαιδευτικών δεδομένων έχει αναδειχθεί ως ανεξάρτητος ερευνητικός τομέας τα τελευταία χρόνια, έχοντας ως έτος ορόσημο το 2008 με την ίδρυση του αντίστοιχου ετήσιου διεθνούς συνεδρίου. Έχουν αναπτυχθεί αρκετές μέθοδοι εξόρυξης εκπαιδευτικών δεδομένων, χωρίς κάποια από αυτές να είναι αντικειμενικά καλύτερη από τις υπόλοιπες. Τα χαρακτηριστικά που έχουν επιλεγεί να αναλυθούν, η μορφή των δεδομένων, το περιθώριο του σφάλματος αλλά και το επιθυμητό αποτέλεσμα, είναι μόνο μερικές από τις παραμέτρους που καθορίζουν τη συμπεριφορά των εφαρμοζόμενων μεθόδων.
Μια μορφή δεδομένων είναι τα λεκτικά δεδομένα που δημιουργούν οι φοιτητές απαντώντας σε ερωτηματολόγια ποιότητας στο τέλος του εξαμήνου. Η συγκεκριμένη πτυχιακή εργασία αφορά την μέθοδο της ανάλυσης συναισθήματος από κείμενο στην ελληνική γλώσσα, στοχεύοντας στην χρήση διαφορετικών προσεγγίσεων για την εξόρυξη γνώμης και την ταξινόμησή τους, ανιχνεύοντας την πολικότητα τους. Στην απλούστερη μορφή του, το παραπάνω πρόβλημα πρόκειται για πρόβλημα δυαδικής ταξινόμησης (θετικό, αρνητικό συναίσθημα).
Υπάρχουν όμως αρκετοί αλγόριθμοι που προσεγγίζουν διαφορετικά το πρόβλημα της κατηγοριοποίησης, όπως οι προσεγγίσεις που βασίζονται στη χρήση λεξικών (lexicon-based approach) ή σε αλγόριθμους μηχανικής μάθησης (machine learning-based approach). Το βασικό ερώτημα που καλούμαστε να απαντήσουμε είναι, ποιος αλγόριθμος είναι τελικά ο καλύτερος για την συγκεκριμένη ανάλυση και υπό ποιες προϋποθέσεις; Για την επίτευξη αυτού του στόχου, διενεργείται αξιολόγηση και συγκριτική ανάλυση των πειραματικών αποτελεσμάτων των επικρατέστερων αλγορίθμων με βάση την ακρίβεια, και την σωστή πρόβλεψη σε σχέση με το μέγεθος των σχολίων. Η επεξεργασία των δεδομένων υλοποιείται στην πλατφόρμα Orange και εφαρμόζονται μέθοδοι Τυχαίου Δάσους, Τεχνητού Νευρωνικού Δικτύου αλλά και ανάλυση συναισθήματος βασισμένη σε λεξικό.
-
The current changes taking place in the modern educational system, are groundbreaking. The main reason behind the constantly changing environment, is the digital transformation, which is in turn translated to the vast increase in the usage of e-learning and the growth in the usage of internet resources for self-teaching and knowledge acquiring. The educational institutions keep gathering heterogeneous data, making the challenge of analysis a very difficult task. However, a successful data analysis paradigm, can foster a speedy transition towards the new digital era, while at the same time it will provide the data users with all the tools, they need to fully emerge in a brand-new universe of cutting-edge capabilities and new revolutionary educational technologies.
Educational Data mining (EDM) is an emerging sector, concerned with developing methods for exploring the constantly increasing large-scale data that come from educational settings and using those methods to better understand students, and the settings which they learn in. EDM has been established as an individual science sector since 2008, a year that was marked from the creation and establishment of the corresponding yearly international symposium. Since then, various EDM methods have been created and used, without any method being clearly dominant over another. The characteristics that have been chosen to be analyzed, the nature of the data, the error-margin as well as the expected result are but some of the parameters that define the behavior of the aforementioned methods.
A type of data that is analyzed are the written responses received by students after completing the course-quality questionnaire at the end of the semester. The current thesis is concerned with the polarity extraction from text written in Greek language and aims towards the usage of the different approaches to extract one’s view.
There are various algorithms that approach the polarity classification problem from different angles, like the lexicon-based approach or the machine learning based approach. The most fundamental question that needs to be answered is which method is the best and most efficient for such an analysis. To achieve this goal, this thesis will evaluate and compare the experimental results of the most popular algorithms used, based on accuracy, and correctness of forecasting in relation to the comments size. Data evaluation is implemented in the Orange data mining platform, comparing sentiment analysis methods that are based on the Random Forest and Artificial Neural Network algorithms as well as on the lexicon-based approach.
-
- Hellenic Open University
- Αναφορά Δημιουργού 4.0 Διεθνές