Εφαρμογή μαθηματικών μοντέλων για την ανάπτυξη αποτελεσματικών αλγορίθμων χειρισμού μεγάλης κλίμακας δεδομένων

Application of mathematical models for the development of efficient large scale data handling algorithms (Αγγλική)

  1. MSc thesis
  2. Τσαβδάρης, Ευάγγελος
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 20 Σεπτεμβρίου 2021 [2021-09-20]
  5. Ελληνικά
  6. 64
  7. Καραπιπέρης , Δημήτρης
  8. Βερύκιος, Βασίλειος | Σακκόπουλος, Ευάγγελος
  9. Big Data | Markov bound | Chebyshev bound | Chernoff bound
  10. 3
  11. 26
  12. Περιέχει: Διαγράμματα, εικόνες
    • Στην διπλωματική αυτή εργασία ασχολήθηκα με την μελέτη γνωστών πιθανοτικών ορίων και την εφαρμογή τους σε γνωστές κατανομές. Τα πιθανοτικά όρια τα οποία θα διερευνήσουμε είναι η ανισότητα Markov, η ανισότητα Chebyshev και η ανισότητα Chernoff. Αν και είναι αποδεδειγμένη η χρησιμότητα τους, ειδικά σε προβλήματα που δεν έχουμε γνωστή κατανομή, σκοπός μας είναι να μελετήσουμε την σύγκλιση τους ή την απόκλιση τους σε σχέση με τις κανονικές πιθανότητες. Οι γνωστές κατανομές, αν και είναι πάρα πολλές και είναι δύσκολο να συμπεριληφθούν όλες στην διπλωματική αυτή, θα ασχοληθούμε με τις πιο βασικές συνεχείς και διακριτές. Αυτές είναι η Διωνυμική, η Poisson, η Γεωμετρική και η Υπεργεωμετρική από τις διακριτές, ενώ από τις συνεχείς είναι η Εκθετική, η Γάμμα, η Ομοιόμορφη και η Κανονική. Για την μελέτη αυτή θα χρησιμοποιήσουμε και το πρόγραμμα R, γνωστό για τις εφαρμογές του στον τομέα της Στατιστικής. Με την εφαρμογή των πιθανοτικών ορίων και τον υπολογισμό της κανονικής πιθανότητας μέσω του προγράμματος η μελέτη αυτή γίνεται πιο ουσιαστική και ξεφεύγει από την καθαρή απλή θεωρητική σύγκριση. Μια άλλη πτυχή στη σύγκριση αυτή των πιθανοτικών ορίων με την οποία θα ασχοληθούμε είναι ο χρόνος εκτέλεσης σε συνάρτηση με το μέγεθος του δείγματος. Θα μελετήσουμε και κατ’ επέκταση θα διερευνήσουμε σε δείγμα πολλαπλάσιου του 10 (πχ 100, 1000, …) την μεταβολή του χρόνου των πιθανοτικών ορίων και την σύγκριση μεταξύ τους. Στόχος παραμένει η εξατομίκευση κάθε πιθανοτικού ορίου στην εφαρμογή τους πάνω στις γνωστές κατανομές, η ανάλυση τους και άμεση σύγκριση μεταξύ τους.
    • In this dissertation I deal with the study of known probabilistic limits and their application in known distributions. The probable limits we will explore are the Markov inequality, the Chebyshev inequality and the Chernoff inequality. Although their usefulness has been proven, especially in problems for which we do not have a known distribution, our aim is to study their convergence or their divergence with respect to normal probabilities. The known distributions, although they are too many and it is difficult to include all of them in this diploma, we will deal with the most basic continuous and distinct ones. These are Bionomic, Poisson, Geometric and Hypergeometric from the distinct ones, while from the continuous ones are the Exponential, the Gamma, the Uniform and the Normal. For this study we will use the R program known for its applications in the field of Statistics. By applying the probabilistic limits and calculating the normal probability through the program, this study becomes more substantial and goes beyond the purely simple theoretical comparison. Another aspect in this comparison of probability limits that we will deal with is the execution time as a function of the sample size. We will study and consequently investigate in a sample of multiples of 10 (eg 100, 1,000…) the change of the time of probabilistic limits and comparing them. The goal remains the individualization of each possible limit in their application on the known distributions, their analysis and direct comparison between them.
  13. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.