- MSc thesis
- Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
- 20 September 2025
- Ελληνικά
- 153
- ΠΕΡΙΚΟΣ ΙΣΙΔΩΡΟΣ
- ΠΕΡΙΚΟΣ ΙΣΙΔΩΡΟΣ | ΓΕΩΡΓΟΠΟΥΛΟΣ ΕΥΣΤΡΑΤΙΟΣ | ΒΕΡΥΚΙΟΣ ΒΑΣΙΛΕΙΟΣ
- ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ | ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ | ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΙΚΗ ΟΡΑΣΗ
- ΠΛΣ60
- 1
- 81
-
-
Η παρούσα εργασία πραγματεύεται την αυτόματη αναγνώριση φύλου και ηλικίας από
εικόνες προσώπων, με τη χρήση τεχνικών βαθιάς μάθησης και, συγκεκριμένα, των
αρχιτεκτονικών Vision Transformers (ViTs). Το πρόβλημα αυτό παρουσιάζει ιδιαίτερο
επιστημονικό και κοινωνικό ενδιαφέρον, καθώς σχετίζεται με τεχνικές προκλήσεις στην
ταξινόμηση εικόνας, αλλά και με ζητήματα ηθικής, αμεροληψίας και διαφάνειας στα
συστήματα τεχνητής νοημοσύνης.
Στο πλαίσιο της μελέτης, υλοποιήθηκε πειραματική διαδικασία τριών σταδίων: αρχικά
πραγματοποιήθηκε εκπαίδευση (training) σε υποσύνολα του dataset UTKFace, ακολούθησε
fine-tuning στα δημογραφικά ισορροπημένα δεδομένα του FairFace, και τέλος
εφαρμόστηκε inference στο εξωτερικό σύνολο Typorch, για την αξιολόγηση της
μεταφερσιμότητας και της γενίκευσης των μοντέλων.
Η απόδοση αξιολογήθηκε με τη χρήση καθιερωμένων μετρικών, όπως Accuracy, F1-score,
Precision, Recall και Confusion Matrix, επιτρέποντας τη σύγκριση παραλλαγών μοντέλων
και υπερπαραμέτρων σε διαφορετικά πεδία δεδομένων. -
This thesis investigates the automatic recognition of gender and age from facial images
through deep learning techniques, emphasizing both technical innovation and ethical
awareness. The task, while fundamentally a classification problem, has profound social and
ethical implications. Accurate demographic inference can enhance user personalization,
biometric authentication, and service accessibility. However, incorrect or biased
classifications risk reinforcing discrimination and violating individual rights. Prior studies
have shown that models trained on imbalanced datasets can perform significantly worse on
underrepresented groups, leading to algorithmic bias.
The study focuses on evaluating Vision Transformers (ViTs), a state-of-the-art architecture
in computer vision. Unlike traditional Convolutional Neural Networks (CNNs), which rely
on local feature extraction, ViTs employ self-attention mechanisms to process images as
sequences of patches. This allows them to capture global contextual information, leading to
more robust feature representations, especially in unconstrained environments with varying
lighting, pose, or background noise.
-
- Hellenic Open University
- Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
Αναγνώριση Φύλου και Ηλικίας από Εικόνες Προσώπων μέσω Τεχνικών Deep Learning
Gender and Age Recognition from Facial Images Using Deep Learning Techniques (english)
Main Files
ΑΓΓΕΛΟΣ ΜΠΑΡΜΠΑΣ Τ-153414 ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ
Description: ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ T-153414.pdf (pdf) Book Reader
Size: 3.0 MB

