Αναγνώριση Τάσεων σε Καινοτόμα Καταναλωτικά Προϊόντα (Gadgets) με τη Χρήση Μεθόδων Ανάλυσης Συναισθήματος: Μία Εφαρμογή στην Περιοχή των Κοινωνικών Δικτύων.
Εξόρυξη Δεδομένων | Data Mining | Ανάλυση Συναισθήματος | Sentiment Analysis | Κοινωνικά Δίκτυα | Social Networks | Διαδίκτυο | Internet | Σχεδιασμός Λογισμικού | Software Design | Τεχνολογία Λογισμικού | Software Engineering | Γλώσσες Προγραμματισμού | Programming Languages | Διαχείριση Δεδομένων | Data Management | Ανάλυση Δεδομένων | Data Analysis
2
7
41
Περιέχει : εικόνες, σχήματα, γραφήματα, πίνακες.
Η καθολική κυριαρχία σε παγκόσμιο επίπεδο των έξυπνων συσκευών (Smartphones, Smartwatch, Tablets, Wearables, που αποτελούν την ναυαρχίδα των προϊόντων που αναγνωρίζουμε με τον όρο Gadgets*) και η συμμετοχή και χρήση των κοινωνικών δικτύων από την συντριπτική πλειοψηφία του παγκόσμιου πληθυσμού και ειδικότερα των νεότερων γενεών, δημιουργεί καθημερινά ένα τεράστιο όγκο δεδομένων που περιέχει προσωπικές, υποκειμενικές και αντικειμενικές απόψεις και πληροφορίες για κάθε πιθανό θέμα. Ο όγκος των πληροφοριών αυτών είναι ιδιαίτερα σημαντικός για όλες τις επιχειρηματικές, κοινωνικές, οικονομικές, πολιτικές κ.λ.π. δραστηριότητες. Η γνώμη και η τοποθέτηση των χρηστών για κάποιο θέμα, προϊόν ή υπηρεσία αποτελεί κρίσιμο παράγοντα για τον αποδέκτη αυτής της πληροφορίας. Μία εταιρεία μπορεί να κερδίσει το ανταγωνιστικό πλεονέκτημα ενός προϊόντος προσδιορίζοντας την τάση του κοινού για το προϊόν την δεδομένη χρονική περίοδο. Προϋπόθεση βέβαια είναι να έχει πρόσβαση στις τοποθετήσεις (γνώμες) που εκφράζει το κοινό κυρίως στα κοινωνικά δίκτυα (twitter, facebook, …) καθώς επίσης και την δυνατότητα να τις αναλύσει αυτοματοποιημένα (λόγω τεράστιου όγκου), να τις διαβαθμίσει, να τις κατατάξει και εντέλει να εξάγει συμπεράσματα. Η Ανάλυση Συναισθήματος ως επιστημονικό πεδίο της Τεχνητής Νοημοσύνης καλείται και έχει την δυνατότητα να εκμεταλλευτεί τις πληροφορίες από τα κοινωνικά δίκτυα, διαβάζοντας, μαθαίνοντας και τελικά, εξάγοντας συμπεράσματα χρήσιμα για κάθε ενδιαφερόμενο. Η Ανάλυση Συναισθήματος (Sentiment Analysis) στα κοινωνικά δίκτυα παρουσιάζει ιδιαίτερα μεγάλο ενδιαφέρον για την ερευνητική κοινότητα και τις επιχειρήσεις. Στόχος της είναι η αυτόματη αναγνώριση της γνώμης που εκφράζεται μέσα από τις δημοσιεύσεις των χρηστών στα κοινωνικά δίκτυα για κάποιο θέμα ενδιαφέροντος και η ταξινόμηση αυτής της γνώμης ως θετικής, αρνητικής ή ουδέτερης που ονομάζεται πολικότητα.
Η παρούσα διπλωματική εργασία έχει ως αντικείμενο μελέτης την ανάλυση συναισθήματος με τεχνικές επιβλεπόμενης μηχανικής μάθησης από κείμενα (tweets) που προέρχονται από το κοινωνικό δίκτυο Twitter και αφορούν στην τάση των ανθρώπων απέναντι σε καινοτόμα προϊόντα (Gadgets). Με τον όρο τάση μελετάται η προδιάθεση, η υιοθέτηση, η χρήση και η αξιολόγηση νέων τεχνολογιών και γενικότερα η στάση του κοινού απέναντι σε αυτά. Η εργασία εστιάζει σε δύο κυρίως σημεία που διαφοροποιούνται από την υπάρχουσα
βιβλιογραφία:
(α) Ερευνά την πιθανότητα εφαρμογής σε μεικτά σύνολα δεδομένων παρακάμπτοντας το πλαίσιο που αναφέρεται στον αυστηρό προσδιορισμό τόσο του πεδίου μελέτης όσο και των ορίων πάνω στα οποία θα εφαρμοστεί η Ανάλυση Συναισθήματος (Domain Specific). Σαφώς στα μεικτά σύνολα δεδομένων τα επιμέρους υποσύνολα δεν είναι απολύτως ξένα μεταξύ τους αλλά ούτε και απόλυτα προσδιορισμένα.
(β) Μετά την εκπαίδευση του Naive Bayes Algorithm και τον έλεγχο της αποτελεσματικότητας και της ακρίβειας του σε σύνολα δεδομένων γνωστής πολικότητας, ο αλγόριθμος εφαρμόζεται σε κείμενα άγνωστης πολικότητας και μελετάται η ορθότητα της πρόβλεψης του αποτελέσματος δηλαδή η σωστή κατάταξη στην αντίστοιχη κατηγορία πολικότητας.
Τα αποτελέσματα της ΔΕ υποδεικνύουν ότι είναι δυνατή σε μεγάλο βαθμό η πρόβλεψη της τάσης του κοινού απέναντι σε καινοτόμα προϊόντα λαμβάνοντας υπόψη τα tweets των χρηστών για τα προϊόντα αυτά.
*Gadget : Mηχανική ή ηλεκτρονική συσκευή η οποία θεωρείται καινοτομία (νεωτερισμός) και συνήθως διαθέτει και εκτελεί συγκεκριμένες έξυπνες λειτουργίες. Μπορεί να είναι και εργαλείο. Συνήθως έχει σχετικά μικρό μέγεθος και η λειτουργία της κάνει την ζωή του χρήστη της πιο εύκολη και πιο ευχάριστη. Ιδιαίτερα πολύπλοκες συσκευές όπως τα smartphones, tablets, laptops συνήθως δεν τα αποκαλούμε Gadgets αν και ιεραρχικά βρίσκονται στην κορυφή του όρου.
The global domination of smart devices (Smartphones, Smartwatch, Tablets and Wearables which are the flagship of the category we define by the term Gadgets*), as well as the participation and the use of the social networks by the majority of the global population and especially the younger generations, creates daily a great volume of data which contain personal, subjective and objective aspects and information for every possible topic. This volume of data is important for every business, political, social, financial and other activities. The user’s opinion and statements on a specific topic, product or service consists a critical factor for the receiver of this information. A company can gain the competitive advantage of a product by defining the tendency of its audience for the product over the given time period. A prerequisite is to have access to statements (opinions) that the public expresses, especially in social media (Twitter, Facebook, etc.) as well as the capability to automatically analyze them (due to the huge volume), scale them, classify them and finally draw conclusions. Sentiment Analysis as a scientific field of Artificial Intelligence is objected to and can exploit the information from social networks, reading, learning and finally, drawing conclusions useful to anyone concerned. Sentiment Analysis on social networks presents a great interest in the research community as well as the businesses. Its objective is the automated recognition of the opinion expressed through the posts users make on social networks about a subject of interest and the classification of this opinion as positive, negative or neutral, which is called polarity.
This diploma thesis deals with the Sentiment Analysis with supervised machine learning techniques from tweets related to the tendency of people about specific gadgets. The term tendency studies the predisposition, adoption, use, and evaluation of new technologies and more generally the attitude of the public towards them. This thesis focuses on two main points that are distinctive from the existing bibliography:
(a) It investigates the possibility of implementation on mixed datasets bypassing the framework that refers to the strict definition of both the field of study as well and the limits on which Sentiment Analysis will be applied (Domain Specific). Clearly, in mixed data sets, the individual subsets are not wholly irrelevant to each other or even completely determined.
(b) After training the Naive Bayes Algorithm and checking its efficiency and accuracy in datasets of known polarity, the algorithm is applied to texts of unknown polarity and the prediction’s accuracy of the result, meaning the correct classification in the corresponding polarity category.
The results of this thesis suggest that the prediction of the tendency of the public towards innovative products taking into consideration the tweets of the users concerning these products is possible.
*Gadget: Mechanic or electronic device which is considered as an innovation and usually can perform an amount of specific smart functions. It can be a tool as well. Usually comes in small sizes and the operation of it by its user makes his life more convenient and pleasant. Particularly complex devices such as smartphones, tablets, laptops are not called as “Gadgets”, even if hierarchically are on the top of this term.
Αναγνώριση Τάσεων σε Καινοτόμα Καταναλωτικά Προϊόντα (Gadgets) με τη Χρήση Μεθόδων Ανάλυσης Συναισθήματος: Μία Εφαρμογή στην Περιοχή των Κοινωνικών Δικτύων. Περιγραφή: ΑΜ104524_Κυτάνης_Στέφανος.pdf (pdf)
Book Reader Άδεια: Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές Πληροφορίες: Κυρίως σώμα διπλωματικής Μέγεθος: 5.1 MB
Αναγνώριση Τάσεων σε Καινοτόμα Καταναλωτικά Προϊόντα (Gadgets) με τη Χρήση Μεθόδων Ανάλυσης Συναισθήματος: Μία Εφαρμογή στην Περιοχή των Κοινωνικών Δικτύων. - Identifier: 77544
Internal display of the 77544 entity interconnections (Node labels correspond to identifiers)