Βασική ιδέα της μεθόδου boosting αποτελεί η στάθμιση των παραδειγμάτων εκπαίδευσης σύμφωνα με τη δυσκολία της ταξινόμησης τους. Περιλαμβάνει μία επαναληπτική διαδικασία η οποία προσαρμόζει την κατανομή των παραδειγμάτων εκπαίδευσης με τέτοιο τρόπο ώστε οι ταξινομητές βάσης να εστιάζουν στα παραδείγματα που ταξινομούνται δύσκολα. Σε αυτή τη διπλωματική εργασία πραγματοποιείται μια εμπειρική σύγκριση αλγορίθμων boosting σε πραγματικά δεδομένα. Εξετάζονται ειδικές περιπτώσεις όπως δεδομένα που έχουν ανισορροπία στις κατηγορίες τους και δεδομένα στα οποία έχει προστεθεί τεχνητός θόρυβος. Δημιουργείται εμπειρικά ένα μοντέλο που μπορεί να προβλέπει για ένα άγνωστο αρχείο με βάση κάποια χαρακτηριστικά του, έναν αλγόριθμο boosting με υψηλή ακρίβεια ταξινόμησης για το συγκεκριμένο αρχείο.
The basic idea of boosting is the weighting of the training examples according to the difficulty of their classification. It consists of an iterative process that adjusts the distribution of training examples in such a way that the base classifiers focus on examples which are 'hardly" classified correctly. In this thesis, an empirical comparison of boosting algorithms is performed on real data. Special cases are examined such as imbalanced datasets and data with added artificial noise. A model that can choose a boosting algorithm with high accuracy for a particular dataset, based on some basic characteristics of the dataset, is empirically created.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.