Ταξινόμηση εικόνων με βάση το περιεχόμενο

Content based Image classification (Αγγλική)

  1. Bachelor’s thesis
  2. Βεζαλής Χρήστος
  3. Πληροφορική (ΠΛΗ)
  4. 18 Ιουλίου 2020 [2020-07-18]
  5. Ελληνικά
  6. 96
  7. Κωτσιαντής , Σωτήρης
  8. Σγάρμπας , Κυριάκος | Αναγνωστόπουλος , Χρήστος-Νικόλαος
  9. Ταξινόμηση εικόνων | Image Classification | Υπολογιστική Όραση | Computer Vision | Μηχανική Μάθηση | Machine Learning | Βαθειά Μάθηση | Deep Learning
  10. 3
  11. 1
  12. 39
  13. Στην παρούσα πτυχιακή εργασία ασχοληθήκαμε με την ταξινόμηση εικόνων με βάση το περιεχόμενο τους. H ταξινόμηση των εικόνων επιτυγχάνεται με τη χρήση μηχανικής μάθησης (machine learning) και πιο συγκεκριμένα με την επιτηρούμενη μάθηση (supervised learning). Εξετάσαμε τον τρόπο που πρέπει να γίνει η κωδικοποίηση των εικόνων αλλά και των κατηγοριών της κάθε εικόνας ώστε να είναι εφικτή η εκπαίδευση του Τεχνητού Νευρωνικού Δικτύου. Χρησιμοποιήσαμε συνελικτικά νευρωνικά δίκτυα (convolutional neural networks) τα οποία βελτιώνουν την διαδικασία της κατηγοριοποίησης χρησιμοποιώντας συνελικτικά επίπεδα. Στην εργασία έγινε αξιολόγηση διαφορετικών αρχιτεκτονικών για την μοντελοποίηση του προβλήματος με συνελικτικά νευρωνικά δίκτυα και βαθειά μάθηση (deep learning), διαφορετικών συναρτήσεων ενεργοποίησης, βελτιστοποιητών (optimizers) αλλά και μεθόδων regularization που βοηθούν στην εξάλειψη του προβλήματος της υπέρ-εκπαίδευσης (overfitting). Η μεταφορά γνώσης (Transfer learning) είναι μια μέθοδος που μπορεί να βελτιώσει αλλά και να επιταχύνει την διαδικασία της εκπαίδευσης. Εξετάσαμε αρχιτεκτονικές και προ- εκπαιδευμένα στο ImageNet σύνολο δεδομένων τεχνητά νευρωνικά δίκτυα όπως τα VGG, DenseNet, InceptionResnetV2 και EfficientNet. Εφαρμόσαμε την μέθοδο του Image Augmentation που τροποποιεί ελαφρά τις εικόνες με τυχαίο τρόπο, δημιουργώντας νέα παραδείγματα ελαφρά αλλαγμένα από τα πρωτότυπα, με αποτέλεσμα να βελτιώνει σε πολλές περιπτώσεις την κατηγοριοποίηση των εικόνων.
    • Στην παρούσα πτυχιακή εργασία ασχοληθήκαμε με την ταξινόμηση εικόνων με βάση το περιεχόμενο τους. H ταξινόμηση των εικόνων επιτυγχάνεται με τη χρήση μηχανικής μάθησης (machine learning) και πιο συγκεκριμένα με την επιτηρούμενη μάθηση (supervised learning). Εξετάσαμε τον τρόπο που πρέπει να γίνει η κωδικοποίηση των εικόνων αλλά και των κατηγοριών της κάθε εικόνας ώστε να είναι εφικτή η εκπαίδευση του Τεχνητού Νευρωνικού Δικτύου. Χρησιμοποιήσαμε συνελικτικά νευρωνικά δίκτυα (convolutional neural networks) τα οποία βελτιώνουν την διαδικασία της κατηγοριοποίησης χρησιμοποιώντας συνελικτικά επίπεδα. Στην εργασία έγινε αξιολόγηση διαφορετικών αρχιτεκτονικών για την μοντελοποίηση του προβλήματος με συνελικτικά νευρωνικά δίκτυα και βαθειά μάθηση (deep learning), διαφορετικών συναρτήσεων ενεργοποίησης, βελτιστοποιητών (optimizers) αλλά και μεθόδων regularization που βοηθούν στην εξάλειψη του προβλήματος της υπέρ-εκπαίδευσης (overfitting). Η μεταφορά γνώσης (Transfer learning) είναι μια μέθοδος που μπορεί να βελτιώσει αλλά και να επιταχύνει την διαδικασία της εκπαίδευσης. Εξετάσαμε αρχιτεκτονικές και προ- εκπαιδευμένα στο ImageNet σύνολο δεδομένων τεχνητά νευρωνικά δίκτυα όπως τα VGG, DenseNet, InceptionResnetV2 και EfficientNet. Εφαρμόσαμε την μέθοδο του Image Augmentation που τροποποιεί ελαφρά τις εικόνες με τυχαίο τρόπο, δημιουργώντας νέα παραδείγματα ελαφρά αλλαγμένα από τα πρωτότυπα, με αποτέλεσμα να βελτιώνει σε πολλές περιπτώσεις την κατηγοριοποίηση των εικόνων.
    • In our report we examine the creation of an application that classifies images in 2 or more categories with the help of a mathematical model. We use machine learning for the classification and more concrete supervised learning. We examine the proper image and categories encoding in order for the training to be feasible. Convolutional neural networks improves the process of classification using convolutional layers. We examine several modern convolutional network architectures for modeling the problem using deep learning, different activation functions, optimizers and regularization methods that helps reduce the overfitting problem. Transfer learning is a method that improves and accelerates the training process. We examine pre-trained networks on ImageNet dataset such as EfficientNets, DenseNets, InceptionResnetsV2 and VGG. We also use Image Augmentation witch slightly transforms images in a random way and effectively creates new examples, that sometimes improves image classification.
  14. Hellenic Open University
  15. Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.