Τα τελευταία χρόνια, η ανάγκη για τη διερεύνηση των δικτύων οδήγησε στην ανάπτυξη του πεδίου της εξόρυξης γνώσης από τα γραφήματα, το οποίο αποτελεί ένα δυναμικό εργαλείο για την αναπαράσταση δεδομένων. Τα γραφήματα έχουν αναδειχθεί ως πολύ σημαντικά για τη μοντελοποίηση πολύπλοκων δομών και για την ανάλυση των τοπολογικών χαρακτηριστικών μεγάλων και πολύπλοκων δικτύων, ειδικότερα μάλιστα κατά τα τελευταία χρόνια, λόγω της τεράστιας ανάπτυξης του Παγκόσμιου Ιστού και της μεγάλης δημοτικότητας των κοινωνικών δικτύων. Σε αυτό το είδος δικτύων, μεταφέρονται πληροφορίες και δεδομένα μεγάλου όγκου μεταξύ εκατομμυρίων χρηστών. Ο απλούστερος τρόπος ανάλυσής τους είναι εφικτός μέσω της μετατροπής τους σε γραφήματα, όπου οι κόμβοι αναπαριστούν τους χρήστες και οι ακμές μεταξύ των κόμβων περιγράφουν τις μεταξύ τους σχέσεις.
Τα γραφήματα είναι τα πιο συχνά χρησιμοποιούμενα αφηρημένα δεδομένα στον τομέα της επιστήμης των υπολογιστών και επιτρέπουν μια πιο σύνθετη και περιεκτική παρουσίαση των δεδομένων. Πολλά ζητήματα σε πραγματικές εφαρμογές πρέπει να περιγράφονται χρησιμοποιώντας μια γραφική δομή, και η επεξεργασία των δεδομένων γραφημάτων απαιτείται σχεδόν σε όλες τις περιπτώσεις, όπως για παράδειγμα η βελτιστοποίηση σιδηροδρομικών διαδρομών, η πρόβλεψη ασθενειών-κρουσμάτων, η ανάλυση της τεχνικής βιβλιογραφίας δικτύων, οι αναδυόμενες εφαρμογές όπως τα κοινωνικά δίκτυα, η ανάλυση σημασιολογικών δικτύων, η ανάλυση βιολογικών δικτύων πληροφοριών και πολλές ακόμη. Η τεχνική της εξόρυξης γραφημάτων έχει αναπτυχθεί για μεγάλο χρονικό διάστημα και οι θεωρίες συνεχώς βελτιώνονται.
Στην παρούσα εργασία, γίνεται μια αναφορά στα παγκόσμια πρότυπα γραφημάτων και στους τομείς που έχουν υλοποιηθεί. Στην συνέχεια απαριθμούνται τα διάφορα μοτίβα που χρησιμοποιούνται, οι γεννήτριες γραφημάτων καθώς και η κατηγοριοποίησή τους. Τέλος, αναλύεται το μοντέλο γραφημάτων R-MAT και οι παραλλαγές του , καθώς επίσης και μια εφαρμογή δημιουργίας γραφημάτων.
In recent years, the need to explore networks has led to the development of the field of knowledge extraction from graphs, which is a dynamic tool for data representation. Graphs have emerged as very important for modeling complex structures and for analyzing the topological characteristics of large and complex networks, especially in recent years due to the huge growth of the World Wide Web and the great popularity of social networks. In this type of networks, large volumes of information and data are transferred between millions of users. The simplest way to analyze them is by converting them into graphs, where nodes represent users and edges between nodes describe the relationships between them.
Graphs are the most commonly used abstract data in computer science and allow a more complex and comprehensive presentation of data. Many issues in real-world applications need to be described using a graphical structure, and graph data processing is required in almost all cases, for example, railway route optimization, disease-case prediction, technical network literature analysis, emerging applications such as social networks, semantic network analysis, biological information network analysis, and many more. The technique of graph mining has been developed over a long period of time and the theories are constantly being improved.
In this paper, a review of the global graph standards and the areas where they have been implemented is presented. The various patterns used, graph generators and their categorization are then listed. Finally, graph models such as R-MAT are implemented, and an application to generate a random graph.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΚΑΙ ΑΝΑΛΥΣΗ ΓΕΝΝΗΤΡΙΩΝ ΓΡΑΦΗΜΑΤΩΝ Περιγραφή: std142912_Γκεβετζές_Αριστείδης.pdf (pdf)
Book Reader Πληροφορίες: ΚΥΡΙΩΣ ΣΩΜΑ ΔΙΠΛΩΜΑΤΙΚΗΣ Μέγεθος: 2.1 MB
ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΚΑΙ ΑΝΑΛΥΣΗ ΓΕΝΝΗΤΡΙΩΝ ΓΡΑΦΗΜΑΤΩΝ - Identifier: 169788
Internal display of the 169788 entity interconnections (Node labels correspond to identifiers)