Στην παρούσα πτυχιακή εργασία ασχοληθήκαμε με την ταξινόμηση εικόνων με βάση το
περιεχόμενο τους. H ταξινόμηση των εικόνων επιτυγχάνεται με τη χρήση μηχανικής
μάθησης (machine learning) και πιο συγκεκριμένα με την επιτηρούμενη μάθηση
(supervised learning).
Εξετάσαμε τον τρόπο που πρέπει να γίνει η κωδικοποίηση των εικόνων αλλά και των
κατηγοριών της κάθε εικόνας ώστε να είναι εφικτή η εκπαίδευση του Τεχνητού
Νευρωνικού Δικτύου. Χρησιμοποιήσαμε συνελικτικά νευρωνικά δίκτυα (convolutional
neural networks) τα οποία βελτιώνουν την διαδικασία της κατηγοριοποίησης
χρησιμοποιώντας συνελικτικά επίπεδα. Στην εργασία έγινε αξιολόγηση διαφορετικών
αρχιτεκτονικών για την μοντελοποίηση του προβλήματος με συνελικτικά νευρωνικά
δίκτυα και βαθειά μάθηση (deep learning), διαφορετικών συναρτήσεων ενεργοποίησης,
βελτιστοποιητών (optimizers) αλλά και μεθόδων regularization που βοηθούν στην
εξάλειψη του προβλήματος της υπέρ-εκπαίδευσης (overfitting).
Η μεταφορά γνώσης (Transfer learning) είναι μια μέθοδος που μπορεί να βελτιώσει αλλά
και να επιταχύνει την διαδικασία της εκπαίδευσης. Εξετάσαμε αρχιτεκτονικές και προ-
εκπαιδευμένα στο ImageNet σύνολο δεδομένων τεχνητά νευρωνικά δίκτυα όπως τα VGG,
DenseNet, InceptionResnetV2 και EfficientNet. Εφαρμόσαμε την μέθοδο του Image
Augmentation που τροποποιεί ελαφρά τις εικόνες με τυχαίο τρόπο, δημιουργώντας νέα
παραδείγματα ελαφρά αλλαγμένα από τα πρωτότυπα, με αποτέλεσμα να βελτιώνει σε
πολλές περιπτώσεις την κατηγοριοποίηση των εικόνων.
Στην παρούσα πτυχιακή εργασία ασχοληθήκαμε με την ταξινόμηση εικόνων με βάση το
περιεχόμενο τους. H ταξινόμηση των εικόνων επιτυγχάνεται με τη χρήση μηχανικής
μάθησης (machine learning) και πιο συγκεκριμένα με την επιτηρούμενη μάθηση
(supervised learning).
Εξετάσαμε τον τρόπο που πρέπει να γίνει η κωδικοποίηση των εικόνων αλλά και των
κατηγοριών της κάθε εικόνας ώστε να είναι εφικτή η εκπαίδευση του Τεχνητού
Νευρωνικού Δικτύου. Χρησιμοποιήσαμε συνελικτικά νευρωνικά δίκτυα (convolutional
neural networks) τα οποία βελτιώνουν την διαδικασία της κατηγοριοποίησης
χρησιμοποιώντας συνελικτικά επίπεδα. Στην εργασία έγινε αξιολόγηση διαφορετικών
αρχιτεκτονικών για την μοντελοποίηση του προβλήματος με συνελικτικά νευρωνικά
δίκτυα και βαθειά μάθηση (deep learning), διαφορετικών συναρτήσεων ενεργοποίησης,
βελτιστοποιητών (optimizers) αλλά και μεθόδων regularization που βοηθούν στην
εξάλειψη του προβλήματος της υπέρ-εκπαίδευσης (overfitting).
Η μεταφορά γνώσης (Transfer learning) είναι μια μέθοδος που μπορεί να βελτιώσει αλλά
και να επιταχύνει την διαδικασία της εκπαίδευσης. Εξετάσαμε αρχιτεκτονικές και προ-
εκπαιδευμένα στο ImageNet σύνολο δεδομένων τεχνητά νευρωνικά δίκτυα όπως τα VGG,
DenseNet, InceptionResnetV2 και EfficientNet. Εφαρμόσαμε την μέθοδο του Image
Augmentation που τροποποιεί ελαφρά τις εικόνες με τυχαίο τρόπο, δημιουργώντας νέα
παραδείγματα ελαφρά αλλαγμένα από τα πρωτότυπα, με αποτέλεσμα να βελτιώνει σε
πολλές περιπτώσεις την κατηγοριοποίηση των εικόνων.
In our report we examine the creation of an application that classifies images in 2 or more
categories with the help of a mathematical model. We use machine learning for the classification and more concrete supervised learning. We
examine the proper image and categories encoding in order for the training to be feasible.
Convolutional neural networks improves the process of classification using convolutional
layers. We examine several modern convolutional network architectures for modeling the
problem using deep learning, different activation functions, optimizers and regularization
methods that helps reduce the overfitting problem.
Transfer learning is a method that improves and accelerates the training process. We
examine pre-trained networks on ImageNet dataset such as EfficientNets, DenseNets,
InceptionResnetsV2 and VGG. We also use Image Augmentation witch slightly
transforms images in a random way and effectively creates new examples, that sometimes
improves image classification.
Hellenic Open University
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.
Κύρια Αρχεία Διατριβής
Ταξινόμηση εικόνων με βάση το περιεχόμενο Περιγραφή: 83816_ΒΕΖΑΛΗΣ_ΧΡΗΣΤΟΣ.pdf (pdf)
Book Reader Μέγεθος: 2.6 MB
Ταξινόμηση εικόνων με βάση το περιεχόμενο - Identifier: 160414
Internal display of the 160414 entity interconnections (Node labels correspond to identifiers)