Μηχανισμοί πρόβλεψης κινήσεων σε διάχυτα περιβάλλοντα

Mobility prediction scheme in ubiquitous environments (Αγγλική)

  1. MSc thesis
  2. Adraktas, Antonios
  3. Συστήματα Κινητού και Διάχυτου Υπολογισμού (ΣΔΥ)
  4. 21 Μαίου 2022 [2022-05-21]
  5. Ελληνικά
  6. 54
  7. Nikopolitidis, Petros
  8. Psannis, Konstantinos
  9. machine learning | Bayesian networks | mobility predictions | Python | model evaluation | synthetic data
  10. 1
  11. 33
  12. tables, diagrams, pictures included
    • Στην παρούσα εργασία υλοποιήθηκε ένα μοντέλο πρόβλεψης κινητικότητας χρηστών με μηχανική μάθηση που βασίζεται σε έναν αλγόριθμο τύπου Bayesian Network. Τα δεδομένα βασίζονται στις δραστηριότητες- τοποθεσίες ατόμων με βάση μια τυπική εργασιακή ζωή κάποιου υπαλλήλου, δηλαδή σπίτι, γραφείο, σε εξωτερική συνάντηση κλπ., καθώς και πληροφορία για το είδος του εκάστοτε υπαλλήλου και αν έχει κάποια επείγουσα προσωπική δουλειά. Σκοπός είναι η πρόβλεψη της επόμενης δραστηριότητας του χρήστη. Παράχθηκαν συνθετικά δεδομένα για χρήση στο μοντέλο, αφού δεν βρέθηκε κατάλληλο δημόσια διαθέσιμο σετ δεδομένων τοποθεσία-δραστηριοτήτων χρηστών. Η υλοποίηση όλων των διεργασιών έγινε σε γλώσσα Python. Η απόδοση του μοντέλου αξιολογήθηκε με διάφορα μετρικά στοιχεία τόσο συνολικά όσο και στις επιμέρους καταστάσεις της κλάσης πρόβλεψης. Συγκρίθηκαν τα αποτελέσματα με ή χωρίς την πληροφορία πλαισίου του χρήστη, όπου αναδείχθηκε η αξία της επιπλέον πληροφορίας εισόδου. Ακόμα, για την εξαγωγή αντικειμενικότερης ένδειξης της ακρίβειας του μοντέλου έγιναν δοκιμές με δεδομένα δοκιμής με ίδιο αριθμό δειγμάτων στις διαφορετικές καταστάσεις της κλάσης πρόβλεψης, όπου το μοντέλο είχε ακρίβεια 56%. Τέλος, έγινε σύγκριση του υλοποιημένου μοντέλου με άλλους γνωστούς αλγορίθμους όπου δεν βρέθηκε κάποιος αλγόριθμος με καλύτερη απόδοση στο συγκεκριμένο πρόβλημα. Σ’ αυτήν την σύγκριση βρέθηκε ένα μοντέλο που βασίζεται σε αλγόριθμο Decision Trees να εμφανίζει πανομοιότυπα αποτελέσματα.
    • In this thesis a mobility prediction machine learning scheme was developed based on a Bayesian Network algorithm. Input data are based on the activities-locations of users from typical work life examples of a private company employee, such as home, office, head office, outside meeting. They also include contextual information about the employee type (high-level, common, marketing) and whether users have household work. Goal is to predict the next state of each user based on the current state and the context data. Synthetic data were produced for usage in the model as no suitable publicly available data set with user locations-activities was found. Development of all processes was made in Python. Performance evaluation of the model was assessed using different metrics both as a whole with accuracy and in each different state of the target class with precision, recall and f1-score. Comparison with and without the usage of the context data were made where the importance of context data for better predictions was verified. To obtain a better accuracy metric that assess all states equally comparison was made with a test set with balanced and non-balanced samples in the different states in the target class. In the balanced case accuracy was 56% while in the non-balanced it was 70%, as states with worse predictions had fewer representation in the data. Finally, comparison of performance of the developed model against other commonly used algorithms in classification problems was performed, where no other model was found with better performance in the given problem. In this comparison, a Decision Tree algorithm had identical results and performance with our model.
  13. Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές