Στην παρούσα Διπλωματική Εργασία έγινε προσπάθεια να μελετηθεί μία πιθανή συσχέτιση της διακύμανσης του Δείκτη Τιμών Καταναλωτή – ΔΤΚ (Consumer Price Index – CPI) και του συναισθήματος που προκύπτει από την επεξεργασία γραπτών μηνυμάτων από το κοινωνικό δίκτυο Twitter. Σκοπός της μελέτης είναι η προσπάθεια πρόβλεψης της διακύμανσης του Δείκτη Τιμών Καταναλωτή, δεδομένης της μεγάλης σημασίας που έχει για τη λήψη καίριων αποφάσεων σε διάφορους τομείς της πολιτικής και της οικονομίας.
Για τον σκοπό της εργασίας επιλέχθηκαν ως χώρα οι Ηνωμένες Πολιτείες της Αμερικής (ΗΠΑ) και χρησιμοποιήθηκαν τα στοιχεία του Δείκτη Τιμών Καταναλωτή που δημοσιεύει κάθε μήνα το Γραφείο Στατιστικής για την Εργασία (Bureau of Labor Statistics) της χώρας. Η εξαγωγή δεδομένων από το Twitter έγινε με τη χρήση της γλώσσας προγραμματισμού Python ενώ έγινε προσπάθεια να τρέχει το πρόγραμμα σε καθημερινή βάση και να συλλέγει tweets από όλη την επικράτεια των ΗΠΑ. Στη συνέχεια έγινε ανάλυση των δεδομένων και ανίχνευση του συναισθήματος με τη χρήση της βιβλιοθήκης TextBlob της Python ανά ημέρα και υπολογισμός του μέσου όρου του συναισθήματος ανά μήνα.
Στη συνέχεια υπολογίστηκε ο βαθμός συσχέτισης των δύο μεγεθών και διαπιστώθηκε ότι είναι μικρός και σίγουρα όχι επαρκής για να υπολογιστεί με σχετική ακρίβεια η μεταβολή του Δείκτη Τιμών Καταναλωτή. Σημαντική απόκλιση παρουσιάστηκε στον μήνα Ιανουάριο όπου οι τιμές ήταν εκ διαμέτρου αντίθετες με αποτέλεσμα να επηρεάζεται σημαντικά ο βαθμός συσχέτισης των μεγεθών.
Για την αντιμετώπιση τέτοιων φαινομένων προτείνεται η συλλογή όσο το δυνατόν περισσότερων δεδομένων και για όσο το δυνατόν μεγαλύτερο χρονικό διάστημα, έτσι ώστε να καλυφθούν πιθανά μεμονωμένα φαινόμενα ή τάσεις εποχικότητας. Τέλος προτείνεται η χρήση περισσότερων του ενός εργαλείου υπολογισμού του συναισθήματος ώστε να μπορεί να γίνει σύγκριση και αξιολόγηση των εργαλείων για την εξαγωγή ακριβέστερων αποτελεσμάτων.
In this Diploma Thesis, an attempt has been made to study a possible correlation between the Consumer Price Index – CPI and the sentiment resulting from the processing of text messages from Twitter social network. The purpose of the Thesis is to anticipate the fluctuation of the Consumer Price Index, given its great importance in key decision making in various areas of politics and economy.
For the purpose of the Thesis, United States of America (USA) was selected as the country in study, along with using the monthly Consumer Price Index value published by country’s Bureau of Labor Statistics. Twitter data extraction was done using Python programming language while attempted to run the program on a daily basis and collect tweets from all over the US. Then the data were analysed and a sentiment analysis was conducted using TextBlob, a Python’s library, per day and computing the average emotion per month.
The degree of correlation between the two sizes was then calculated and found to be barely significant and certainly not sufficient to accurately predict Consumer Price Index’s values. Significant deviation occurred in January, when there were directly opposite values, resulting in worsening drastically the correlation between figures.
To deal with such phenomena, it is proposed to collect as much data as possible and for the longest possible time in order to cover possible isolated incidents or seasonality trends. Finally, it is suggested to use more than one sentiment analysis tool in order to compare and evaluate the tools and produce more accurate results.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Main Files
Πρόβλεψη δείκτη τιμών καταναλωτή με δεδομένα από το Twitter Description: Διπλωματική Εργασία_final.pdf (pdf)
Book Reader Info: Κυρίως σώμα διπλωματικής Size: 1.0 MB
Πρόβλεψη δείκτη τιμών καταναλωτή με δεδομένα από το Twitter - Identifier: 77959
Internal display of the 77959 entity interconnections (Node labels correspond to identifiers)