- MSc thesis
- Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
- 24 Σεπτεμβρίου 2023
- Ελληνικά
- 56
- ΦΩΚΑ ΑΜΑΛΙΑ
- ΑΜΑΛΙΑ ΦΩΚΑ | ΤΖΑΓΚΑΡΑΚΗΣ, ΕΜΜΑΝΟΥΗΛ | ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ
- Αυτόματη Περίληψη | Mηχανική Mάθηση | αφαιρετική περιληψη πολλαπλών κειμένων
- ΠΛΣΔΕ
- 2
- 31
-
-
Η παρούσα εργασία ασχολείται με την υλοποίηση μιας εφαρμογής για την αυτόματη συλλογή ειδησεογραφικών άρθρων από διαδικτυακές πηγές και την αυτόματη περίληψη αυτών των άρθρων. Ο καταιγισμός πληροφορίας στο διαδίκτυο έχει προκαλέσει υπερφόρτωση πληροφορίας, με αποτέλεσμα η εύρεση, η απορρόφηση και η επεξεργασία της να είναι πολύ δύσκολη και χρονοβόρα. Για την ενημέρωση μας για ένα θέμα μπορεί να χρειαστεί να ανατρέξουμε σε πολλές διαδικτυακές πηγές. Σε πολλές δε περιπτώσεις βρισκόμαστε αντιμέτωποι με αναδημοσιεύσεις, με αποτέλεσμα να σπαταλάμε πολύτιμο χρόνο.
Από την άλλη, η δημιουργία χειροκίνητα περιλήψεων ειδησεογραφικών άρθρων είναι μια χρονοβόρα διαδικασία, η οποία απαιτεί την ενασχόληση εξειδικευμένων επαγγελματιών, και είναι αδύνατο να είναι διαθέσιμη τη στιγμή που τη χρειαζόμαστε.
Η εφαρμογή αυτή έχει σκοπό να μειώσει το χρόνο που απαιτείται για την αναζήτηση της πληροφορίας για ένα θέμα μέσω της αυτόματης αναζήτησης κειμένων, αλλά και του χρόνου που απαιτείται για την πρόσληψη της, αφού προσφέρεται σε μορφή περίληψης. Με αυτόν τον τρόπο αποφεύγεται η ανάγκη για επίσκεψη πολλών σελίδων και την ανάγνωση πολλών κειμένων, αρκετά από τα οποία περιέχουν αναδημοσιεύσεις.
Η υλοποίηση γίνεται με την υλοποίηση ενός μηχανισμού για την αυτόματη αναζήτηση, συγκέντρωση και ανάκτηση των άρθρων. Στη συνέχεια, αφού διασφαλίσουμε ότι τα άρθρα που συλλέγουμε είναι μοναδικά, χρησιμοποιούμε τεχνικές μηχανικής μάθησης και επεξεργασίας φυσικής γλώσσας για να δημιουργήσουμε μία μοναδική περίληψη η οποία περιέχει τις σημαντικές πληροφορίες όλων των άρθρων.
Έτσι, συμβάλλουμε στη μείωση του χρόνου και της ενέργειας που απαιτείται για την ενημέρωση μας σχετικά με ένα θέμα.
-
The present work deals with the implementation of an application for automatically collecting news articles from online sources and automatically summarizing these articles. The flood of information on the internet has caused information overload, making finding, absorbing and processing it very difficult and time-consuming. In order to inform us about a topic we may need to refer to many online sources. And in many cases we are faced with republishing, as a result of which we waste valuable time.
On the other hand, manually creating summaries of news articles is a time-consuming process, which requires the involvement of specialized professionals, and is impossible to have available at the moment we need it.
This application aims to reduce the time required to search for information on a topic through automatic text search, but also the time required to receive it, since it is offered in summary form. This avoids the need to visit many pages and read many texts, many of which contain reposts.
The implementation is done by implementing a mechanism for the automatic search, aggregation and retrieval of the articles. Then, after ensuring that the articles we collect are unique, we use machine learning and natural language processing techniques to create a single summary that contains the important information of all the articles.
Thus, we help reduce the time and energy required to inform us about a topic.
-
- Hellenic Open University
- Αναφορά Δημιουργού 4.0 Διεθνές