Περιέχει : 43 εικόνες, 9 σχήματα, 15 πίνακες, 25 γραφήματα.
Στην παρούσα εργασία, μελετήσαμε το πρόβλημα της πρόβλεψης του δείκτη οικονομικού συναισθήματος ή «κλίματος» - ESI (Economic Sentiment Indicator) με εξόρυξη γνώμης από το κοινωνικό δίκτυο Twitter. Για το σκοπό αυτό, συλλέξαμε δεδομένα (tweets) από το μικροϊστολόγιο Twitter για τη χρονική περίοδο 37 διαδοχικών μηνών και συγκεκριμένα, από 01/01/2016 έως και 31/01/2019. Απαραίτητη προϋπόθεση ήταν η κατάλληλη οργάνωση και η επεξεργασία των δεδομένων. Έτσι, σχεδιάσαμε και αναπτύξαμε μια σχεσιακή βάση δεδομένων, στην οποία καταχωρήσαμε τα tweets. Υλοποιήσαμε πρόγραμμα σε Python, προκειμένου να διαχωρίσουμε τα tweets στις λέξεις που τα απαρτίζουν. Μέσω αυτών, δημιουργήσαμε ένα νέο και πρωτότυπο λεξικό συναισθήματος ώστε να εντοπίσουμε σε κάθε tweet τις λέξεις που εκφράζουν συναίσθημα. Αυτό πραγματοποιήθηκε μέσω προγράμματος Python, το οποίο παράγει το τελικό σύνολο δεδομένων. Αυτό δίδεται ως είσοδος στα μοντέλα νευρωνικών δικτύων Βαθιάς μάθησης, τα οποία υλοποιήσαμε και εκπαιδεύσαμε στο Colaboratory/TensorFlow της Google και δίδουν ως έξοδο τις τιμές πρόβλεψης του δείκτη ESI μέσω της μεθόδου Γραμμικής Παλινδρόμησης (Linear Regression). Τα αποτελέσματα πρόβλεψης αποδείχθηκαν ιδιαίτερα αξιόλογα, καθώς κατόρθωσαν να υπολογίσουν τις πραγματικές τιμές του δείκτη της μελέτης μας με εντυπωσιακά μικρό σφάλμα. Τέλος, από τη διερεύνηση που πραγματοποιήσαμε, εξάγονται πολύ ενδιαφέροντα συμπεράσματα, σχετικά με τα μοντέλα νευρωνικών δικτύων που χρησιμοποιήσαμε, την ποιότητα των δεδομένων που συλλέξαμε, όπως και τον καθοριστικό ρόλο στις επιτυχείς προβλέψεις του νέου πρωτότυπου λεξικού συναισθήματος, το οποίο δημιουργήσαμε για το σκοπό της παρούσας εργασίας.
In the present work, we studied the problem of predicting the ESI (Economic Sentiment Indicator) by extracting opinion from the Twitter social network. For this purpose, we collected data (tweets) from the Twitter micro-blog for the period of 37 consecutive months, namely from 01/01/2016 to 31/01/2019. Proper organization and processing of data was a prerequisite. Thus, we designed and developed a relational database in which we inserted the tweets. We implemented a program in Python to separate tweets into the words which they are composed of. Through them, we created a new and original sentiment lexicon to identify, in each tweet, the words which express sentiment. This was realized through the development of a new Python program, which produces the final dataset. This is given as input to the deep neural network models, which we implemented and trained in Google's Colaboratory/TensorFlow and which give as output the predictive values of the ESI indicator via the Linear regression algorithm. The predicted results were proved to be remarkable, as they managed to calculate the real values of our study indicator with an impressively small error. Finally, from our research, the conclusions that come out are very interesting, with regard to the models of neural networks that we used, the quality of the dataset that we collected, and the decisive role of the new lexicon, which we created for the purpose of this work, in the successful predictions.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Πρόβλεψη του Δείκτη Οικονομικού Κλίματος με Εξόρυξη Γνώμης από το Twitter Περιγραφή: 112856_ΛΟΥΚΟΣ_ΒΑΣΙΛΕΙΟΣ.pdf (pdf)
Book Reader Πληροφορίες: 112856_ΛΟΥΚΟΣ_ΒΑΣΙΛΕΙΟΣ.pdf (Μεταπτυχιακή Διπλωματική Εργασία, Λούκος Βασίλειος, ΠΛΣ, 2019). Μέγεθος: 9.7 MB
Πρόβλεψη του Δείκτη Οικονομικού Κλίματος με Εξόρυξη Γνώμης από το Twitter - Identifier: 77822
Internal display of the 77822 entity interconnections (Node labels correspond to identifiers)