- MSc thesis
- Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
- 12 Μαίου 2024
- Αγγλικά
- 67
- ΣΥΜΕΩΝΙΔΗΣ ΠΑΝΑΓΙΩΤΗΣ
- ΣΥΜΕΩΝΙΔΗΣ ΠΑΝΑΓΙΩΤΗΣ
- Sentiment Analysis, Explainable AI, Reasoning Engine καιGenerative AΙ, visualisation
- Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα/ΠΛΣ60: Εξειδικεύσεις Τεχνολογίας Λογισμικού
- 1
- 21
- Includes: Tables, Images
-
-
The massive use of digital platforms and social media makes it necessary for almost all the
companies to use and evaluate their customers reviews.
With this dissertation we tried to present an extensive study on the effectiveness of advanced
Natural Language Processing (NLP)[1] techniques focusing on semantic similarity
measures— WuPalmer[2] similarity, Path[3] similarity, Leacock-Chodorow (LCH)[4] similarity,
and Resnik (RES)[5] similarity—alongside the VADER[6] sentiment analysis tool and the
BERT[7] (Bidirectional Encoder Representations from Transformers) model. The research
aims to identify the most effective technique for interpreting customer feedback across various
diverse digital communication channels and provide to customers a useful tool through
which they can extract important information for products or interest.
For the existing reviews analysis two models are examined, VADER[6] and BERT[7].
The VADER[6] model, a lexicon and rule-based system, is assessed for its precision in sentiment
polarity detection, particularly in concise text responses. The BERT[7] model, a deep
learning powerhouse, is examined for its advanced capability to contextualize sentiments in
more elaborate and nuanced feedback.
A thorough theoretical exploration of the examined semantic similarity measures is followed.
WuPalmer[2] similarity is analyzed for its ability to quantify the conceptual distance between
words in customer feedback. Path[3] similarity is considered for its fundamental approach
in measuring semantic distances. LCH[4] similarity, an information-content-based measure,
is evaluated for its effectiveness in capturing the depth of taxonomic trees. RES[5] similarity,
another information-content-based approach, is scrutinized for its unique perspective in
considering the shared information between concepts.
Utilizing a comprehensive dataset of customer feedback for hotels in booking.com, the dissertation
conducts a comparative analysis of these methodologies. This comparison not only
seeks to determine the accuracy of each approach in classifying sentiments but also evaluates
their performance concerning computational efficiency, scalability, and adaptability to
varying feedback styles.
The research findings offer a critical insight into the advantages and limitations of each
approach, providing a valuable resource for businesses and researchers in selecting the most
fitting sentiment analysis tool for their needs. Furthermore, the study proposes an innovative
hybrid model that integrates the strengths of semantic similarity measures and sentiment
analysis tools, aiming to enhance the accuracy and reliability of customer sentiment analysis. -
Η μαζική χρήση ψηφιακών πλατφορμών και κοινωνικών δικτύων καθιστά αναγκαία για σχεδόν
όλες τις εταιρείες τη χρήση και την εκτίμηση των αξιολογήσεων των πελατών τους. Με αυτή τη
διπλωματική προσπαθήσαμε να παρουσιάσουμε μια εκτενή μελέτη σχετικά με την αποτελεσματι-
κότητα προηγμένων τεχνικών Επεξεργασίας Φυσικής Γλώσσας – Natural Language Processing
(NLP[1]), εστιάζοντας στην χρήση semantic similarity measures όπωςWuPalmer[2] similarity
, Path[3] similarity, Leacock-Chodorow (LCH)[4] similarity και Resnik (RES)[5] similarity
μαζί με χρήση των μοντέλων ανάλυσης συναισθημάτων VADER[6] και BERT[7] (Bidirectional
Encoder Representations from Transformers). Η έρευνα στοχεύει λοιπόν στην εύρεση της
πιο αποτελεσματικής τεχνικής για την ερμηνεία των ανατροφοδοτήσεων των πελατών μέσω δια-
φόρων ψηφιακών επικοινωνιακών καναλιών και την δημιουργία ενός εύχρηστου υσερ ιντερφαςε
μέσω του οποίου οι χρήστες θα μπορούνε να εξαγάγουν σημαντικές πληροφορίες για προϊόντα
ή υπηρεσίες που τους ενδιαφέρουν.
Για την ανάλυση των υφιστάμενων σχολίων των πελατών εξετάζονται δυο μοντέλα , το
VADER[6] και το BERT[7]. Το μοντέλο VADER[6], ένα σύστημα βασισμένο σε κανόνες,
αξιολογείται για την ακρίβειά του στην ανίχνευση της πολικότητας των συναισθημάτων, ιδιαίτερα
σε συνοπτικές απαντήσεις κειμένου. Το μοντέλο BERT[7] χαρακτηρίζεται από την προηγμένη
του ικανότητα να δίνει εννοιολογική έννοια στα συναισθήματα με πιο σύνθετη και λεπτομερή
ανατροφοδότηση.
Στην συνέχεια η έρευνα παρουσιάζει μια θεωρητική ανάλυση κάθε μέτρου σημασιολογικής
ομοιότητας. WuPalmer[2] similarity χαρακτηρίζεται από την ικανότητά της να ποσοτικοποιεί
την εννοιολογική απόσταση μεταξύ των λέξεων . Path[3] similarity χαρακτηρίζεται από την
ικανότητα στην προσέγγισή της μέτρηση σημασιολογικών αποστάσεων. Η LCH[4] similarity
άλλη μια μέθοδος βασισμένη στο περιεχόμενο της πληροφορίας, αξιολογείται για την αποτελε-
σματικότητά της στην καταγραφή του βάθους των ταξινομικών δέντρων.Η RES[5] similarity,
μια άλλη προσέγγιση βασισμένη στο περιεχόμενο πληροφορίας, χαρακτηρίζεται για τη μοναδική
της προοπτική στην εξέταση της κοινόχρηστης πληροφορίας μεταξύ εννοιών.
Χρησιμοποιώντας δεδομένα με ανατροφοδοτήσεις πελατών στην ηλεκτρονική πλατφόρμα
booking.com, η διατριβή διεξάγει μια συγκριτική ανάλυση των παραπάνω μεθοδολογιών. Αυτή η σύγκριση δεν επιδιώκει μόνο να καθορίσει την ακρίβεια κάθε προσέγγισης στην κατηγοριοπο-
ίηση των συναισθημάτων αλλά και να αξιολογήσει την απόδοσή τους ως προς την υπολογιστική
αποδοτικότητα, την επεκτασιμότητα, και την προσαρμοστικότητα σε διάφορα στυλ ανατροφο-
δότησης.
Τα ευρήματα της έρευνας προσφέρουν μια σημαντική εισαγωγή στα πλεονεκτήματα και τους
περιορισμούς κάθε προσέγγισης, παρέχοντας μια πολύτιμη πηγή για επιχειρήσεις και ερευνητές
στην επιλογή του πιο κατάλληλου εργαλείου ανάλυσης συναισθημάτων για τις ανάγκες τους.
Επιπλέον, η μελέτη προτείνει ένα καινοτόμο υβριδικό μοντέλο που ενσωματώνει τα δυνατά σημεία
των μέτρων σημασιολογικής ομοιότητας και των εργαλείων ανάλυσης συναισθημάτων, με στόχο
την ενίσχυση της ακρίβειας και της αξιοπιστίας της ανάλυσης συναισθημάτων πελατών.
Συνοψίζοντας η διατριβή αυτή τονίζει τον κρίσιμο ρόλο της ανάλυσης συναισθημάτων στην
ψηφιακή εποχή και προετοιμάζει το έδαφος για μελλονιτκή έρευνα στον τομέα εστιάζοντας
στην ενσωμάτωση και τη βελτιστοποίηση των τεχνικών NLP[1] για βελτίωση ανατροφοδότησης
πελατών.
-
- Hellenic Open University
- Αναφορά Δημιουργού 4.0 Διεθνές