Η παρούσα εργασία έχοντας ως στόχο να προσεγγίσει την εξαγωγή πληροφορίας στα πλαίσια της «ιστορικής διάστασης» επικεντρώνεται στην αναζήτηση, αναγνώριση και αναπαράσταση των χρονικών και χωρικών εννοιών μέσα από τα ιστορικά κείμενα της Ελληνικής γλώσσας. Λαμβάνοντας υπ’ όψη τις ιδιαιτερότητες της ιστορικής πληροφορίας, αναλύθηκε, σχεδιάστηκε κι αναπτύχθηκε το σύστημα αναγνώρισης χρονικών εκφράσεων και χωρικών οντοτήτων της Ελληνικής γλώσσας GTESER (Greek Temporal Expressions and Spatial Entities Recognizer). Το σύστημα θα είναι δυνατό να εξυπηρετήσει στην κατηγοριοποίηση του περιεχομένου ιστορικών ψηφιακών βάσεων, με την αυτόματη δημιουργία μεταδεδομένων χρονικών εννοιών και τοποθεσιών, βασισμένων στο πρότυπο ΧML, ώστε αυτά να χρησιμοποιηθούν για την εξαγωγή σημασιολογικής πληροφορίας. Η αυτόματη αναγνώριση των χρονικών εκφράσεων των κειμένων βασίζεται σε γραμματικούς κανόνες. Η αναγνώριση των χωρικών οντοτήτων βασίζεται σε γεωγραφικό λεξικό. Το εννοιολογικό μοντέλο απεικονίστηκε σε οντολογία εκφρασμένη σε γλώσσα OWL, για την διαχείριση της οποίας χρησιμοποιήθηκε το εργαλείο Protégé.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Ανάλυση κειμένου στη χρονική, χωρική και ιστορική διάσταση [Cd-rom] : [Διπλωματική διατριβή] - Identifier: 78110
Internal display of the 78110 entity interconnections (Node labels correspond to identifiers)