Εξαγωγή βασικών χαρακτηριστικών τραπεζών και χρηματοπιστωτικών οργανισμών από δεδομένα Twitter

Extraction of banks' and financial institutions' key features from Twitter data (Αγγλική)

  1. MSc thesis
  2. Καλόγρης, Γεώργιος
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 25 Οκτωβρίου 2022 [2022-10-25]
  5. Ελληνικά
  6. 157
  7. Φωκά, Αμαλία
  8. Twitter, Tweets, Banks, Adjectives, Sentiment Analysis, Social media
  9. 2
  10. 32
  11. Εικόνες 6, Πίνακες 61
    • Με την παρούσα εργασία, θα αναλυθούν τα Tweets που έχουν γραφτεί στο Twitter api, και κάνουν αναφορά στις 5 μεγαλύτερες ελληνικές τράπεζες, με σκοπό να εξαχθούν τα βασικά επίθετα που έχουν χρησιμοποιηθεί, ώστε να περιγράψουν τόσο την εκάστοτε τράπεζα, όσο και τον τρόπο με τον οποίο αντιλαμβάνεται ένας πελάτης (εν δυνάμει ή όχι) την εικόνα της εν λόγω τράπεζας. Η συλλογή των δεδομένων πραγματοποιήθηκε στους τελευταίους 3 μήνες ώστε να επιτευχθεί η τελευταία εικόνα και αντίληψη που έχει διαμορφωθεί για τις τράπεζες, χωρίς να βασιστεί σε παρελθοντικά δεδομένα ετών που ενδεχομένως να περιγράψουν μια παγιωμένη άποψη για κάποια τράπεζα. Η συλλογή και ανάλυση των δεδομένων, πραγματοποιήθηκε με προγράμματα γραμμένα σε γλώσσα Python, χρησιμοποιώντας από τις τεχνικές NLP, τις βιβλιοθήκες NLTK, τόσο για την ανάλυση όσο και για την απεικόνιση των αποτελεσμάτων. Παρόλο που η ελληνική γλώσσα είναι πλούσια σε λέξεις, ουσιαστικά, επίθετα, επιρρήματα, ιδιωματισμούς, μεταφορές και παρομοιώσεις, κατά την ανάλυσή της παρουσιάζονται αντικειμενικές δυσκολίες καθώς μια λέξη, ένα ουσιαστικό μπορεί να περιγράψει θετικά ή αρνητικά το υποκείμενο μιας πρότασης, και να μη χρησιμοποιηθεί ούτε επίθετο αλλά να λείπει από την πρόταση και το βασικότερο συστατικό της, που είναι το ρήμα.
    • In the present work, we will analyze the Tweets that have been written on the Twitter api, and refer to the 5 largest Greek banks, in order to extract the main adjectives that have been used, so as to describe both the respective bank and the way in which a customer perceives (potentially or not) the image of that bank. The data collection took place in the last 3 months in order to achieve the latest image and perception that has been formed for the banks, without relying on past years data that may describe an established view of a bank. The data collection and analysis was performed with programs written in Python language, using NLP techniques, NLTK libraries, both for the analysis and for the display of the results. Although Greek language is rich in words, nouns, adjectives, adverbs, idioms, metaphors and similes, in its analysis there are common difficulties as a word or a noun can describe positively or negatively the subject of a sentence, and not be used an adjective but also the verb, which is the main component of a sentence, to be missing.
  12. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.