Αναλυτική Δεδομένων και Ανάλυση Συναισθήματος από αξιολογήσεις προϊόντων

Data Analytics and Sentiment Analysis from product reviews (Αγγλική)

  1. MSc thesis
  2. ΗΛΕΚΤΡΑ ΝΙΚΟΛΗΝΤΑΓΑ-ΑΠΟΣΤΟΛΟΥ
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 23 Σεπτεμβρίου 2023
  5. Ελληνικά
  6. 92
  7. ΡΕΦΑΝΙΔΗΣ ΙΩΑΝΝΗΣ
  8. Mηχανική Mάθηση | Nευρωνικά δίκτυα | Βαθιά Νευρωνικά Δίκτυα | Επεξεργασία Φυσικής Γλώσσας | Ανάλυση Συναισθήματος | Αυτόματη Περίληψη
  9. ΠΛΣ
  10. 32
    • Η παρούσα διπλωματική εργασία βασίζεται σε ένα σύνολο δεδομένων από αξιολογήσεις βιβλίων του Amazon Books που προέρχονται από την πλατφόρμα Kaggle και εξετάζει τρεις βασικές ερευνητικές εργασίες. Αρχικά, χρησιμοποιείται μεθοδολογία αναλυτικής δεδομένων για την εξέταση και εξαγωγή χρήσιμων πληροφοριών από τις αξιολογήσεις. Στη συνέχεια, η μελέτη εξετάζει τη χρήση νευρωνικών δικτύων για την πρόβλεψη της βαθμολογίας αξιολογήσεων, με βάση το κείμενο της αξιολόγησης. Τέλος, χρησιμοποιήσαμε νευρωνικά δίκτυα Transformer, συγκεκριμένα το μοντέλο T5 (Text-to-Text Transfer Transformer), για να προβλέψουμε τον τίτλο των αξιολογήσεων χρησιμοποιώντας το κείμενό τους, χρησιμεύοντας έτσι ως μία διαφοροποιημένη μορφή ανάλυσης συναισθήματος.

      Κατά την έρευνά μας, αναπτύξαμε συνολικά πέντε διαφορετικά μοντέλα. Για την πρόβλεψη των βαθμολογιών των αξιολογήσεων, δημιουργήσαμε τέσσερα μοντέλα: δύο Νευρωνικά Δίκτυα Συνελικτικού Τύπου (Convolutional Neural Networks, CNNs) και δύο Νευρωνικά Δίκτυα Επαναλαμβανόμενου Τύπου (Recurrent Neural Networks, RNNs) με μονάδες Μακράς Βραχυπρόθεσμης Μνήμης (Long Short-Term Memory, LSTM). Αυτά τα μοντέλα διαμορφώθηκαν έτσι ώστε να προβλέπουν τις βαθμολογίες τόσο ως εργασίες παλινδρόμησης όσο και ως εργασίες ταξινόμησης. Για την πρόβλεψη των τίτλων των αξιολογήσεων, χρησιμοποιήσαμε το μοντέλο T5 (Text-to-Text Transfer Transformer), αντιμετωπίζοντας αυτή την εργασία ως πρόβλημα αυτόματης σύνοψης.

      Κατά τη συγκριτική ανάλυση, διαπιστώθηκε ότι τα δίκτυα RNN/LSTM απέδωσαν ελαφρώς πιο ακριβείς προβλέψεις για τις βαθμολογίες των αξιολογήσεων. Επίσης, διαπιστώσαμε ότι τόσο τα μοντέλα CNN όσο και τα μοντέλα LSTM αποδίδουν καλύτερα όταν η πρόβλεψη των αξιολογήσεων διαμορφώνεται ως πρόβλημα ταξινόμησης και όχι ως εργασία παλινδρόμησης. Τέλος, το μοντέλο T5 Transformer παρουσίασε υποσχόμενες επιδόσεις στη δημιουργία συνοπτικών και εύστοχων τίτλων αξιολογήσεων.

      Τα ευρήματά μας συμβάλλουν στη συνεχιζόμενη συζήτηση σχετικά με τις πρακτικές εφαρμογές των διαφόρων αρχιτεκτονικών νευρωνικών δικτύων σε εργασίες επεξεργασίας φυσικής γλώσσας (NLP), ιδίως στο πλαίσιο της ανάλυσης αξιολογήσεων.

    • This thesis is based on a dataset of Amazon Books reviews obtained from the Kaggle platform and examines three main research tasks. First, a data analytics methodology is used to examine and extract useful information from the reviews. Next, the study examines the use of neural networks to predict review scores based on the review text. Finally, we used Transformer neural networks, specifically the T5 (Text-to-Text Transfer Transformer) model, to predict the title of a review using its text, thus serving as a differentiated form of sentiment analysis.

      During our research, we developed a total of five different models. To predict ratings of the reviews, we created four models: two Convolutional Neural Networks (CNNs) and two Recurrent Neural Networks (RNNs) with Long Short-Term Memory (LSTM) units. These models were configured to predict scores as both regression and classification tasks. To predict the titles of the reviews, we used the T5 (Text-to-Text Transfer Transformer) model, treating this task as an automatic summarization problem.

      In the comparative analysis, we found that the RNN/LSTM networks yielded slightly more accurate predictions of the review scores. We also observed that both the CNN and LSTM models performed better when the prediction of ratings was formulated as a classification problem rather than a regression task. Finally, the T5 Transformer model showed promising performance in generating concise and accurate review titles.

      Our findings contribute to the ongoing debate about the practical applications of various neural network architectures in natural language processing (NLP) tasks, particularly in the context of reviews analysis.

  11. Hellenic Open University
  12. Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές