Please use this identifier to cite or link to this item: https://apothesis.eap.gr/handle/repo/35102
Title: Συγκριτική ανάλυση μεθόδων ανίχνευσης ακραίων σημείων με εφαρμογή σε πωλήσεις ταχυκίνητων καταναλωτικών αγαθών.
Authors: Μπατσίλα, Μαρία
Advisor: Γεωργίου, Βασίλειος
Keywords: ακραία σημεία;outliers;ανωμαλίες;anomalies;εξωκείμενα σημεία;extreme points;ανίχνευση ακραίων σημείων;outlier detection;χρονοσειρές;time series
Issue Date: 23-Sep-2017
Abstract: Η πρόοδος της τεχνολογίας έχει οδηγήσει στην ανάπτυξη υπολογιστών, λογισμικού και αποθηκευτικών μέσων, τα οποία έχουν τη δυνατότητα να συγκεντρώνουν, να οργανώνουν και να αποθηκεύουν μεγάλο όγκο δεδομένων καθημερινά. Η ανίχνευση ακραίων σημείων, η ανακάλυψη, δηλαδή, σπάνιων ή ασυνήθιστων γεγονότων ή εξαιρέσεων, έχει συγκεντρώσει μεγάλο ενδιαφέρον τα τελευταία χρόνια, καθώς αποτελεί ένα σημαντικό κομμάτι στην ανάλυση δεδομένων. Η σημαντικότητα της ανάλυσης των ακραίων σημείων έγκειται στο γεγονός ότι αυτά, ενώ λανθασμένα μπορεί να θεωρηθούν ως σφάλματα ή θόρυβος, τελικά έχουν τη δυνατότητα να προσφέρουν πολύτιμη πληροφόρηση στον αναλυτή, η οποία θα οδηγήσει στη σωστή λήψη αποφάσεων, με απώτερο σκοπό την πρόληψη σφαλμάτων, τη βελτίωση της ποιότητας και, τελικά, το κέρδος. Η ανίχνευση ακραίων σημείων βρίσκει εφαρμογές σε πολλές δραστηριότητες, όπως στην ανακάλυψη μη νόμιμης χρήσης πιστωτικών καρτών και παραβατικότητας στις ηλεκτρονικές συναλλαγές, στην πρόβλεψη καιρικών φαινομένων, στο marketing, στην ανάλυση της συμπεριφοράς καταναλωτών, κ.ά. Η επιστήμη της Στατιστικής έχει παραδοσιακά ασχοληθεί με την ανάπτυξη μεθόδων για την ανίχνευση ακραίων σημείων. Πιο πρόσφατα, οι αναλυτές της εξόρυξης δεδομένων (data mining) και της μηχανικής μάθησης (machine learning) έχουν επίσης αναπτύξει τεχνικές για τον εντοπισμό της μη φυσιολογικής συμπεριφοράς σε σύνολα δεδομένων. Σκοπός της παρούσας διπλωματικής εργασίας είναι, αρχικά, να παρουσιάσει τις κατηγορίες των διαφόρων μεθόδων για την ανίχνευση ακραίων σημείων, οι οποίες έχουν αναπτυχθεί στο πέρασμα του χρόνου και τα πεδία στα οποία βρίσκει εφαρμογή η ανάλυση τέτοιων δεδομένων. Στη συνέχεια, θα παρουσιαστούν, πιο συγκεκριμένα, χρησιμοποιούμενες μέθοδοι για την ανίχνευση εξαιρέσεων σε δεδομένα χρονολογικών σειρών. Τελικά, με τη χρήση της στατιστικής γλώσσας προγραμματισμού R, οι παραπάνω μέθοδοι θα εφαρμοστούν σε δεδομένα πωλήσεων ταχυκίνητων καταναλωτικών προϊόντων και θα δοθούν συμπεράσματα.
Appears in Collections:ΔΙΠ Διπλωματικές Εργασίες

Files in This Item:
File Description SizeFormat 
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ_Μαρία_Μπατσίλα.pdfΚυρίως άρθρο3.3 MBAdobe PDFView/Open


Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.