Μόλις 30 χρόνια από τη δημιουργία του παγκοσμίου ιστού από τον Tim Berners-Lee, σε συνδυασμό με την είσοδο και μετάβαση στην ψηφιακή εποχή από την αναλογική, τα δεδομένα έχουν αυξηθεί και συνεχίζουν να αυξάνονται με ξέφρενους και ιλιγγιώδης ρυθμούς. Ενδεικτικά, στις ημέρες μας μπορούμε να αναφέρουμε ότι μόνο από το διαδίκτυο διακινούνται περίπου 28 εκατομμύρια terrabytes τον μήνα χωρίς να παρουσιάζονται μειωτικές ή σταθεροποιητικές τάσεις ως προς το πλήθος τους. Η τάση και ο ρυθμός τους είναι συνεχώς αυξητικός.
Μέσα από τα δεδομένα υπάρχει μια έκρηξη της πληροφορίας. Έτσι έχουμε επέλθει σε ένα σημείο όπου «πνιγόμαστε» από τον τεράστιο πληροφοριακό όγκο που υπάρχει παντού γύρω μας. Αυτή η υπερφόρτωση της πληροφορίας ανάγκασε τον άνθρωπο να προσπαθήσει να εκμεταλλευτεί και να επεξεργαστεί τα δεδομένα. Ο τρόπος – η τεχνική με την οποία ο χρήστης προσπαθεί να αναπαραστήσει ένα σύνολο δεδομένων με τη χρήση γραφικών (δισδιάστατα, τρισδιάστατα) ονομάζεται Οπτικοποίηση δεδομένων. Η κύρια χρήση της είναι η εύπεπτη και τάχιστη απορρόφηση της πληροφορίας από τον αναγνώστη, μέσα από ένα δυσανάγνωστο και τεράστιο σύνολο δεδομένων.
Η οπτικοποίηση των δεδομένων θα πρέπει να γίνει με τέτοιον τρόπο ώστε να υπάρξει ένα ταξίδι πληροφορίας, από τα απλά δεδομένα που βρίσκονται παντού στην εξόρυξη γνώσης. Παρόλο που στις ημέρες μας έχουμε δει έστω μία οπτικοποίηση με την χρήση τουλάχιστον απλών γραφημάτων (όπως bar chart, pie chart, line Chart), η προσπάθεια του ανθρώπου για την οπτικοποίηση της πληροφορίας χρονολογείται πολύ παλιά.
Μία μορφή που χρησιμοποίησε ο άνθρωπος για την οπτικοποίηση της πληροφορίας είναι και το δέντρο. Ένα τόσο συνηθισμένο αντικείμενο, χάρη στη δεντρική δομή του στάθηκε σημαντικό μοντέλο για την επεξεργασία και ιεράρχηση της πληροφορίας. Ακολούθησαν πολλά εναλλακτικά μοντέλα τα οποία μπορούσαν να αντιμετωπίζουν και διαφορετικά προβλήματα οπτικοποίησης.
Στην σημερινή εποχή υπάρχει μια τεράστια παλέτα από εργαλεία, που μπορούν να μας κάνουν την οπτικοποίησή μας εύκολη υπόθεση. Μέσα λοιπόν από μία λίστα από εργαλεία συμφωνήθηκε η χρήση της βιβλιοθήκης D3.js της γλώσσας προγραμματισμού JavaScript. Με τη χρήση τριών συνόλων δεδομένων προσπαθήσαμε και αναδείξαμε το πρόβλημα της μείωσης του πληθυσμού στην Ελλάδα. Η οπτικοποίησή μας, κατάφερε να απαντήσει σε μια σειρά από ερωτήματα όπου χωρίς τη χρήση της, διαβάζοντας απλά τα δεδομένα θα ήταν αδύνατο να απαντηθούν.
Just 30 years after Tim Berners-Lee's creation of the world web, coupled with the transition to the new digital age, data has increased and continues to grow with frantic and dizzying speed. Indicatively, we can mention that today about 28 million terrabytes are being transported every month, an amount that is steadily increasing without any indication that this trend is going to be stabilized.
This data contain an explosion of information. We have come to a point where we are being overwhelmed by the huge volume of information that exists everywhere around us. This overload of information has forced people to try to exploit and process the data. The way - the technique by which a user attempts to represent a set of data using graphics (two-dimensional, three-dimensional) is called Data Visualization. Its main use is to transform the information contained in a vast and unreadable set of data to a form digestible and rapidly absorbed by the reader.
The visualization of the data should be done in such a way that there is a journey of information, from the simple data found everywhere, to the mining of knowledge. Although we have even seen a visualization using at least simple charts (such as bar chart, pie chart, line chart), the human effort to visualize information is a very long endeavor.
A form used by humans to visualize information is the tree. A commonly used object, witch thanks to its structure, has been an important model for processing and prioritizing information. There are also many alternative models that are able to address different visualization problems.
Nowadays there is a huge palette of tools that can make our visualization an easy task. From this list of tools, we choose to use the D3.js library of the JavaScript programming language. Using three sets of data we tried and highlighted the problem of population decline in Greece. The resulting visualization has succeeded in answering a number of questions that, without using it and simply reading the data, would have been impossible to answer.
Hellenic Open University
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Οπτικοποίηση Δεδομένων με Στόχο την Εξόρυξη Γνώσης Περιγραφή: HOU-CS-UGP-2017-301.pdf (pdf)
Book Reader Πληροφορίες: primary:true Μέγεθος: 9.0 MB
Οπτικοποίηση Δεδομένων με Στόχο την Εξόρυξη Γνώσης - Identifier: 143207
Internal display of the 143207 entity interconnections (Node labels correspond to identifiers)