- MSc thesis
- Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
- 24 Σεπτεμβρίου 2023
- Ελληνικά
- 128
- ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ
- ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ | ΑΜΑΛΙΑ ΦΩΚΑ
- μηχανική μάθησης, επεξεργασία φυσικής γλώσσας, αλγόριθμοι, κατηγοριοποίηση, δημιουργία τίτλου, νευρωνικά δίκτυα, transformers, machine learning, natural language processing, algorithms, classification, title generation, neural networks
- ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ
- 2
- 7
-
-
Στην παρούσα εργασία, εξετάζουμε τις τεχνικές μηχανικής μάθησης που εφαρμόζονται στην επεξεργασία φυσικής γλώσσας, με κύριο στόχο να κατανοήσουμε και να αξιοποιήσουμε διάφορους αλγορίθμους για την κατηγοριοποίηση των κειμένων και τη δημιουργία συντομευμένων τίτλων για τα κείμενα του συνόλου δεδομένων που αναλύουμε. Στόχος μας είναι να εξοικειωθούμε με διάφορες τεχνικές και αλγορίθμους της μηχανικής μάθησης και να προσεγγίσουμε το πρόβλημα του εντοπισμού των κατηγοριών των κειμένων και της παραγωγής συνοπτικών τίτλων με ακρίβεια και αποδοτικότητα.
Καθώς αντιμετωπίζουμε ένα ευρύ φάσμα τεχνικών και αλγορίθμων, είναι απαραίτητο να πραγματοποιήσουμε πολλαπλές δοκιμές για να εξετάσουμε την απόδοση τους και να επιλέξουμε την πιο κατάλληλη προσέγγιση για τις ανάγκες μας. Η προσαρμογή των παραμέτρων και η βελτιστοποίηση των μοντέλων είναι κρίσιμες διαδικασίες για να επιτύχουμε τα επιθυμητά αποτελέσματα.
Στην πορεία της εργασίας, θα διερευνήσουμε τον ρόλο της δομής των δεδομένων, την επιλογή των χαρακτηριστικών και τις μετρικές αξιολόγησης για την επίτευξη βέλτιστης απόδοσης των αλγορίθμων. Συνειδητοποιούμε ότι η επίτευξη υψηλής ακρίβειας δεν είναι ο μόνος στόχος καθώς η εκτέλεση των αλγορίθμων σε ικανοποιητικό χρόνο είναι επίσης ζωτικής σημασίας για την πρακτική εφαρμογή τους.
Επομένως, η προσέγγισή μας θα εστιάζει επίσης στην αξιολόγηση του χρόνου εκτέλεσης των αλγορίθμων και στον προσδιορισμό της βέλτιστης ισορροπίας μεταξύ ακρίβειας και απόδοσης. Η εργασία μας θα παρουσιάσει τα αποτελέσματα των διαφόρων δοκιμών και θα παρέχει συγκριτική ανάλυση για τις επιδόσεις των αλγορίθμων.
Συνεπώς, κατά την εξέταση των τεχνικών μηχανικής μάθησης και των αλγορίθμων για την επεξεργασία φυσικής γλώσσας, θα επικεντρωθούμε στον εύρωστο σχεδιασμό και τη βελτιστοποίηση των μοντέλων μας, ώστε να επιτύχουμε τόσο αξιόπιστα αποτελέσματα όσο και επαρκείς χρόνους εκτέλεσης για την πρακτική εφαρμογή τους. Οι πειραματισμοί μας και η προσεκτική αξιολόγηση θα μας βοηθήσουν να αντιληφθούμε τις δυνατότητες και τα όρια των μοντέλων μας, προσφέροντάς μας μια ευρύτερη κατανόηση για τη χρήση της μηχανικής μάθησης στην επεξεργασία φυσικής γλώσσας.
-
In this study, we examine the application of machine learning techniques in various stages of natural language processing. Our main goal is to understand and utilize various algorithms for text categorization and the generation of concise titles for the texts within the dataset we analyze. Our objective is to become familiar with different machine learning techniques and algorithms and approach the problem of identifying text categories and producing summaries with accuracy and efficiency.
As we deal with a wide range of techniques and algorithms, conducting multiple trials becomes essential to assess their performance and select the most suitable approach for our needs. The adaptation of parameters and model optimization are critical processes to achieve the desired outcomes.
Throughout the course of the study, we will explore the role of data structures, feature selection, and evaluation metrics to achieve the best performance of the algorithms. We acknowledge that achieving high accuracy is not the sole objective, as the execution time of the algorithms is also vital for practical application.
Therefore, our approach will also focus on robust model design and optimization to achieve reliable results and adequate execution times for practical application. Our experimentation and careful evaluation will help us understand the capabilities and limitations of our models, providing us with a broader understanding of utilizing machine learning in natural language processing.
-
- Hellenic Open University
- Αναφορά Δημιουργού 4.0 Διεθνές