Πρόβλεψη του Δείκτη Οικονομικού Κλίματος με Εξόρυξη Γνώμης από το Twitter

Predicting the Economic Sentiment Indicator with Opinion Mining from Twitter (Αγγλική)

  1. MSc thesis
  2. Λούκος, Βασίλειος
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 21 Σεπτεμβρίου 2019 [2019-09-21]
  5. Ελληνικά
  6. 160
  7. Ρεφανίδης, Ιωάννης
  8. Βερύκιος, Βασίλειος | Κωτσιαντής, Σωτήριος
  9. Εξόρυξη Γνώμης | Opinion Mining | Ανάλυση Συναισθήματος | Sentiment Analysis | Μηχανική Μάθηση | Machine Learning | Οικονομική Πρόβλεψη | Economic Forecasting | Δείκτης Οικονομικού Κλίματος | Economic Sentiment Indicator | ΔΟΚ | ESI | Βαθιά Μάθηση | Deep Learning | Βαθιά Νευρωνικά Δίκτυα | Deep Neural Network | Επεξεργασία Φυσικής Γλώσσας | Natural Language Processing | Λεξικό Συναισθήματος | Sentiment Lexicon | Μικροϊστολόγιο | Microblogging | Μέσα Κοινωνικής Δικτύωσης | Social Media | Twitter | Python | TensorFlow | Colab
  10. 3
  11. 33
  12. Περιέχει : 43 εικόνες, 9 σχήματα, 15 πίνακες, 25 γραφήματα.
    • Στην παρούσα εργασία, μελετήσαμε το πρόβλημα της πρόβλεψης του δείκτη οικονομικού συναισθήματος ή «κλίματος» - ESI (Economic Sentiment Indicator) με εξόρυξη γνώμης από το κοινωνικό δίκτυο Twitter. Για το σκοπό αυτό, συλλέξαμε δεδομένα (tweets) από το μικροϊστολόγιο Twitter για τη χρονική περίοδο 37 διαδοχικών μηνών και συγκεκριμένα, από 01/01/2016 έως και 31/01/2019. Απαραίτητη προϋπόθεση ήταν η κατάλληλη οργάνωση και η επεξεργασία των δεδομένων. Έτσι, σχεδιάσαμε και αναπτύξαμε μια σχεσιακή βάση δεδομένων, στην οποία καταχωρήσαμε τα tweets. Υλοποιήσαμε πρόγραμμα σε Python, προκειμένου να διαχωρίσουμε τα tweets στις λέξεις που τα απαρτίζουν. Μέσω αυτών, δημιουργήσαμε ένα νέο και πρωτότυπο λεξικό συναισθήματος ώστε να εντοπίσουμε σε κάθε tweet τις λέξεις που εκφράζουν συναίσθημα. Αυτό πραγματοποιήθηκε μέσω προγράμματος Python, το οποίο παράγει το τελικό σύνολο δεδομένων. Αυτό δίδεται ως είσοδος στα μοντέλα νευρωνικών δικτύων Βαθιάς μάθησης, τα οποία υλοποιήσαμε και εκπαιδεύσαμε στο Colaboratory/TensorFlow της Google και δίδουν ως έξοδο τις τιμές πρόβλεψης του δείκτη ESI μέσω της μεθόδου Γραμμικής Παλινδρόμησης (Linear Regression). Τα αποτελέσματα πρόβλεψης αποδείχθηκαν ιδιαίτερα αξιόλογα, καθώς κατόρθωσαν να υπολογίσουν τις πραγματικές τιμές του δείκτη της μελέτης μας με εντυπωσιακά μικρό σφάλμα. Τέλος, από τη διερεύνηση που πραγματοποιήσαμε, εξάγονται πολύ ενδιαφέροντα συμπεράσματα, σχετικά με τα μοντέλα νευρωνικών δικτύων που χρησιμοποιήσαμε, την ποιότητα των δεδομένων που συλλέξαμε, όπως και τον καθοριστικό ρόλο στις επιτυχείς προβλέψεις του νέου πρωτότυπου λεξικού συναισθήματος, το οποίο δημιουργήσαμε για το σκοπό της παρούσας εργασίας.
    • In the present work, we studied the problem of predicting the ESI (Economic Sentiment Indicator) by extracting opinion from the Twitter social network. For this purpose, we collected data (tweets) from the Twitter micro-blog for the period of 37 consecutive months, namely from 01/01/2016 to 31/01/2019. Proper organization and processing of data was a prerequisite. Thus, we designed and developed a relational database in which we inserted the tweets. We implemented a program in Python to separate tweets into the words which they are composed of. Through them, we created a new and original sentiment lexicon to identify, in each tweet, the words which express sentiment. This was realized through the development of a new Python program, which produces the final dataset. This is given as input to the deep neural network models, which we implemented and trained in Google's Colaboratory/TensorFlow and which give as output the predictive values of the ESI indicator via the Linear regression algorithm. The predicted results were proved to be remarkable, as they managed to calculate the real values of our study indicator with an impressively small error. Finally, from our research, the conclusions that come out are very interesting, with regard to the models of neural networks that we used, the quality of the dataset that we collected, and the decisive role of the new lexicon, which we created for the purpose of this work, in the successful predictions.
  13. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.