Σχεδίαση δημιουργία και διαχείριση αποθήκης δεδομένων στο νέφος

Cloud data warehouse design, development and management (english)

  1. MSc thesis
  2. ΓΕΩΡΓΙΟΣ ΤΡΙΦΤΗΣ
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 18 May 2025
  5. Ελληνικά
  6. 127
  7. Γκαράνη Γεωργία
  8. Γκαράνη Γεωργία | Κωτσιαντής Σωτήριος | Ταμπούρης Ευθύμιος
  9. Βάσεις Δεδομένων | Αποθήκες Δεδομένων | Yπολογιστικό νέφος | Νεφοϋπολογιστικές Αποθήκες Δεδομένων
  10. Μεταπτυχιακή εξειδίκευση στα Πληροφοριακά Συστήματα / ΠΛΣ60
  11. 3
  12. 100
  13. Περιλαμβάνει πίνακες
    • Η παρούσα εργασία εξετάζει τη σημασία και τις τεχνολογικές εξελίξεις στις αποθήκες δεδομένων, τόσο σε παραδοσιακό περιβάλλον όσο και στο υπολογιστικό νέφος. Μελετά τη διαχρονική ανάπτυξη της αποθήκευσης και διαχείρισης δεδομένων, παρουσιάζοντας τις βασικές αρχές των αποθηκών δεδομένων και τη σύγκρισή τους με τις λίμνες δεδομένων. Παράλληλα, αναλύεται το υπολογιστικό νέφος, τα διαφορετικά μοντέλα ανάπτυξης και υπηρεσιών του, καθώς και οι προκλήσεις και τα ζητήματα ασφάλειας που σχετίζονται με αυτό.

      Αρχικά, η εργασία εστιάζει στην παρουσίαση των αποθηκών δεδομένων, αναλύοντας την αρχιτεκτονική τους, τις βασικές λειτουργίες, και τις τεχνικές επεξεργασίας και ανάλυσης δεδομένων. Εξετάζονται επίσης τα πλεονεκτήματα και οι προκλήσεις που αντιμετωπίζουν οι οργανισμοί κατά την υιοθέτηση αποθηκών δεδομένων. Στη συνέχεια, αναλύεται η μετάβαση των αποθηκών δεδομένων στο υπολογιστικό νέφος, η οποία προσφέρει επεκτασιμότητα, ευελιξία και αυξημένη αποδοτικότητα. Η εργασία συγκρίνει τις παραδοσιακές και τις  νεφοϋπολογιστικές αποθήκες δεδομένων, εξετάζοντας την απόδοσή τους, την ασφάλεια και το κόστος συντήρησης.

      Η ανάλυση περιλαμβάνει επίσης πρακτική υλοποίηση και αξιολόγηση τόσο μιας παραδοσιακής αποθήκης δεδομένων όσο και μιας αποθήκης δεδομένων βασισμένης στο υπολογιστικό νέφος, χρησιμοποιώντας την πλατφόρμα Apache Druid. Παρουσιάζονται τα βήματα σχεδιασμού, η διαδικασία υλοποίησης, καθώς και η αξιολόγηση της απόδοσης των δύο προσεγγίσεων. Η εργασία συγκρίνει τις δύο υλοποιήσεις βάσει της ταχύτητας επεξεργασίας δεδομένων, της ευκολίας διαχείρισης, των απαιτήσεων αποθήκευσης και της συνολικής αποδοτικότητας.

      Ένα από τα κύρια ευρήματα της μελέτης είναι ότι οι αποθήκες δεδομένων στο υπολογιστικό νέφος προσφέρουν μεγαλύτερη ευελιξία και κλιμάκωση σε σύγκριση με τις παραδοσιακές λύσεις. Παρόλα αυτά, η μετάβαση στο νέφος απαιτεί ιδιαίτερη προσοχή σε ζητήματα ασφάλειας, δεδομένης της ευαισθησίας των δεδομένων και των πιθανών κινδύνων παραβίασης. Η εργασία καταλήγει στο συμπέρασμα ότι η επιλογή μεταξύ παραδοσιακής και νεφοϋπολογιστικής αποθήκης δεδομένων εξαρτάται από τις ανάγκες του εκάστοτε οργανισμού, το κόστος υποδομής και τη στρατηγική διαχείρισης των δεδομένων.

      Τέλος, η μελέτη προτείνει μελλοντικές κατευθύνσεις για την περαιτέρω έρευνα, όπως η ενσωμάτωση τεχνητής νοημοσύνης στις αποθήκες δεδομένων, η ανάπτυξη βελτιωμένων μεθόδων ασφαλείας και η διερεύνηση νέων τεχνολογιών που θα επιτρέψουν την πιο αποτελεσματική διαχείριση δεδομένων σε περιβάλλοντα νέφους.

    • This paper examines the significance and technological advancements in data warehouses, both in traditional environments and cloud computing. It explores the historical development of data storage and management, presenting the fundamental principles of data warehouses and their comparison with data lakes. At the same time, cloud computing is analyzed, including different deployment and service models, as well as the challenges and security concerns associated with it.

      Initially, the study focuses on the presentation of data warehouses, analyzing their architecture, core functions, and data processing and analysis techniques. The advantages and challenges organizations face when adopting data warehouses are also examined. Subsequently, the transition of data warehouses to cloud computing is analyzed, offering scalability, flexibility, and increased efficiency. The paper compares traditional and cloud-based data warehouses, evaluating their performance, security, and maintenance costs.

      The analysis also includes a practical implementation and evaluation of both a traditional data warehouse and a cloud-based data warehouse using the Apache Druid platform. The design steps, implementation process, and performance assessment of both approaches are presented. The study compares the two implementations based on data processing speed, ease of management, storage requirements, and overall efficiency.

      One of the key findings of the study is that cloud-based data warehouses provide greater flexibility and scalability compared to traditional solutions. However, transitioning to the cloud requires careful consideration of security issues, given the sensitivity of data and the potential risks of breaches. The study concludes that the choice between a traditional and a cloud-based data warehouse depends on the specific needs of an organization, infrastructure costs, and data management strategies.

      Finally, the study suggests future directions for further research, such as integrating artificial intelligence into data warehouses, developing enhanced security methods, and exploring new technologies that will enable more efficient data management in cloud environments.

  14. Hellenic Open University
  15. Αναφορά Δημιουργού 4.0 Διεθνές