Please use this identifier to cite or link to this item: https://apothesis.eap.gr/handle/repo/35865
Title: Εφαρμογή , Ανάπτυξη και Αξιολόγηση Τεχνικών Εξαγωγής Χωροχρονικών Πληροφοριών Από Κείμενα με Χρήση Τεχνικών Μηχανικής Μάθησης.
Authors: Μαγκούτης, Βασίλειος
metadata.dc.contributor.advisor: Μαρκέτος, Γεράσιμος
Keywords: Αποκάλυψη Ονοματικών Οντοτήτων;Εξαγωγή πληροφοριών;γλώσσα προγραμματισμού python;μηχανική μάθηση;MIT information extraction;eigenwords;Δομημένες μηχανές διανύσματος υποστήριξης;Named Entity Recognition;Information Extraction;programming language Python;Machine Learning;MIT information extraction;eigenwords;Structured SVMs;MITIE
Issue Date: 23-Sep-2017
Abstract: Η εξαγωγή πληροφοριών από γραπτές πηγές δεν είναι καινούριο πρόβλημα, το οποίο λυνόταν με μελέτη και επεξεργασία της γραπτής πηγής από άνθρωπο. Την αλλαγή σε αυτό έφερε η ανακάλυψη του ηλεκτρονικού υπολογιστή, από την εμφάνιση του οποίου και ύστερα αναπτύχθηκε το πεδίο της μηχανικής μάθηση και κατά συνέπεια η εξαγωγή πληροφοριών από γραπτές πηγές με τη χρήση μηχανικής μάθησης. Αρχικά υπήρχαν οι κανόνες μέσα από τους οποίους μάθαινε ο αλγόριθμος αλλά η τεχνολογία εξελίχθηκε γοργά με αποτέλεσμα οι σημερινοί αλγόριθμοι να είναι εκπληκτικά εύστοχοι, να απαιτούν ελάχιστη προσπάθεια εκπαίδευσης αφού εκπαιδεύονται στην ουσία από μη επιβλεπόμενη ή ημιεπιβλεπόμενη μάθηση. Το εργαλείο MITIE (MIT information extraction) συνδυάζει τις αναπαραστάσεις λέξεων από διανύσματα (eigenwords) με τη μηχανική μάθηση μέσω δομημένων μηχανών διανύσματος υποστήριξης (Structured Support Vector Machines). Τεχνολογικές εξελίξεις έχουν γίνει και στον τομέα της ανάπτυξης λογισμικού όπου η τεχνολογία προστάζει τη χρήση τμηματικού προγραμματισμού (modular programming) για την ανάπτυξη του κώδικα των εφαρμογών, με σκοπό τη μη επανάληψη των γραμμών κώδικα και την εύκολη συντήρηση τους. Σε αυτή την διπλωματική εργασία πραγματοποιείται εκπαίδευση μοντέλων δεδομένων με την χρήση του εργαλείου MITIE, τα οποία μπορούν να ανιχνεύσουν χωροχρονικά δεδομένα σε ένα κείμενο και να τα αντιστοιχίσουν στο γεγονός στο οποίο αυτά αναφέρονται. Στη συνέχεια, τα μοντέλα αυτά και ο αλγόριθμος αποκάλυψης ενσωματώνονται σε διεπαφή προγραμματισμού εφαρμογών (api) ώστε να αποτελέσουν μια βιβλιοθήκη και να είναι αυτόνομα και επαναχρησιμοποιήσιμα. Τέλος, με τη χρήση και άλλων τεχνολογιών (python, postgreSQL, bootstrap) δημιουργείται γραφική διεπαφή χρήστη μέσα από την οποία μπορεί να γίνει χρήση του αλγορίθμου. Λέξεις κλειδιά : Αποκάλυψη Ονοματικών Οντοτήτων – Εξαγωγή πληροφοριών – γλώσσα προγραμματισμού python – μηχανική μάθηση – MIT information extraction – διεπαφή προγραμματισμού – eigenwords – Δομημένες μηχανές διανύσματος υποστήριξης Περιεχόμενο : Η εργασία αυτή συνοδεύεται από πηγαίο κώδικα σε γλώσσα python
Appears in Collections:ΠΛΣ Διπλωματικές Εργασίες

Files in This Item:
File Description SizeFormat 
PLSDE_Magkoutis_Vasileios_112857.pdf
  Restricted Access
Συνολική εργασία1.75 MBUnknownView/Open


Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.