Προκλήσεις στην Ανάλυση Μεγάλων Δεδομένων

Big Data Analytics Challenges (Αγγλική)

  1. MSc thesis
  2. Σούμπλης, Αλέξανδρος
  3. Συστήματα Κινητού και Διάχυτου Υπολογισμού (ΣΔΥ)
  4. 25 Απριλίου 2021 [2021-04-25]
  5. Ελληνικά
  6. 156
  7. Ψάννης, Κωνσταντίνος
  8. Στρατογιάννης, Δημήτριος | Καμέας, Αχιλλέας
  9. Μεγάλα Δεδομένα | Αναλυτική Μεγάλων Δεδομένων | Big Data | Big Data Analytics
  10. 2
  11. 110
  12. Περιέχει: Πίνακες και εικόνες
    • Η εξέλιξη της πληροφορικής και των δικτύων δεδομένων έχουν οδηγήσει σε μια πρωτοφανή παραγωγή ψηφιακών δεδομένων από πολλαπλές πηγές και σε πολλαπλούς τομείς της ψηφια- κής αλλά και φυσικής καθημερινότητας ανθρώπων, επιχειρήσεων και συστημάτων. Ενδεικτι- κά αναφερόμαστε σε επιχειρηματικά δεδομένα, χρηματοοικονονικά δεδομένα, επιστημονικά δεδομένα, δεδομένα τηλεμετρίας, δεδομένα ψυχαγωγίας κλπ. Ο όγκος των δεδομένων που παράγονται είναι τεράστιος και γι’ αυτό αναφερόμαστε σε αυτά με τον γενικό όρο Μεγάλα Δεδομένα. Τα Μεγάλα Δεδομένα τα τελευταία χρόνια αποτελούν πηγή παραγωγής γνώσης και τελικά πλούτου. Για την παραγωγή γνώσης χρησιμοποιούνται μέθοδοι συνδυασμού και ανάλυσης Μεγάλων Δεδομένων από μοντέλα Μηχανικής Μάθησης και Βαθειάς Μηχανικής Μάθησης. Όμως η ανάλυση των δεδομένων έχει να αντιμετωπίσει ποικίλες προκλήσεις που πηγάζουν από την ίδια την φύση των δεδομένων. Τεράστιος όγκος με, συνήθως, ταχύτατο ρυθμό παρα- γωγής νέων δεδομένων. Ποικιλομορφία δεδομένων διαφορετικών τύπων και στην πλειονότη- τα τους αδόμητα ή ημιδομημένα. Επιπλέον, τα Μεγάλα Δεδομένα χαρακτηρίζονται από υψη- λό βαθμό μεταβλητότητας τόσο στον όγκο, όσο και στον τύπο αλλά και την ποιότητα τους. Η ποιότητα και η αξιοπιστία των Μεγάλων Δεδομένων αποτελεί κρίσιμο παράγοντα για κάθε ανάλυση και απαιτούνται ειδικές τεχνικές για την αξιολόγηση της ποιότητας τους. Επιπλέον, για την ανάλυση των Μεγάλων Δεδομένων, υπάρχει πληθώρα άλλων προκλήσεων όπως η οπτικοποίηση τους, η ανωνυμοποίηση, η ιδιωτικότητα και η ακεραιότητα αυτών. Τέλος σημαντική πρόκληση αποτελεί και το οικολογικό αποτύπωμα της ανάλυσης των με- γάλων δεδομένων τόσο για την αποθήκευση τους όσο και για την επεξεργασία και τις απαι- τήσεις σε ηλεκτρική ενέργεια που προκύπτει από αυτά.
    • The fields of computing and digital networks meet a continuous growth throughout the years. This growth has lead to the creation of unprecedented amount of data from various sources and across numerous fields of digital and physical activities. Those sources include but are not limited to data produced from businesses and financial systems, scientific observation and experiments, telemetry and activity tracking, entertainment, etc. We refer to this vast amount of data produced with the term “Big Data”. The Big Data, especially during the last decade, proved to be a valuable source of knowledge that among others can produce wealth. The extraction of knowledge from Big Data it tightly related to the advance on the fields of Machine Learning and Deep Machine Learning. Yet, the greatest the advance in the field of Big Data, the greatest the challenges that arise. The majority of those challenges have their root in the nature of Big Data and specifically to the fact that we have to deal with huge quantity of data produced rapidly from numerous sources. Moreover, Big Data are not necessarily structured data and have great variety in terms of volume, type and quality. The quality and reliability of the data is a major challenge and requires special care and advanced techinques to evaluate the quality of the data and also the level of trust to these. Last but not least there are other kind of important challenges related to the security, integrity and privacy of the data, the visualization techinques and their long-term preservation. A side effect of all the above, particualarly important nowdays, is the ecological footprint for collecting, processing and preserving Big Data.
  13. Αναφορά Δημιουργού-Μη Εμπορική Χρήση 4.0 Διεθνές