Αναγνώριση Φύλου και Ηλικίας από Εικόνες Προσώπων μέσω Τεχνικών Deep Learning

Gender and Age Recognition from Facial Images Using Deep Learning Techniques (Αγγλική)

  1. MSc thesis
  2. ΑΓΓΕΛΟΣ ΜΠΑΡΜΠΑΣ
  3. Μεταπτυχιακή Εξειδίκευση στα Πληροφοριακά Συστήματα (ΠΛΣ)
  4. 20 Σεπτεμβρίου 2025
  5. Ελληνικά
  6. 153
  7. ΠΕΡΙΚΟΣ ΙΣΙΔΩΡΟΣ
  8. ΠΕΡΙΚΟΣ ΙΣΙΔΩΡΟΣ | ΓΕΩΡΓΟΠΟΥΛΟΣ ΕΥΣΤΡΑΤΙΟΣ | ΒΕΡΥΚΙΟΣ ΒΑΣΙΛΕΙΟΣ
  9. ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ | ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ | ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΙΚΗ ΟΡΑΣΗ
  10. ΠΛΣ60
  11. 1
  12. 81
    • Η παρούσα εργασία πραγματεύεται την αυτόματη αναγνώριση φύλου και ηλικίας από
      εικόνες προσώπων, με τη χρήση τεχνικών βαθιάς μάθησης και, συγκεκριμένα, των
      αρχιτεκτονικών Vision Transformers (ViTs). Το πρόβλημα αυτό παρουσιάζει ιδιαίτερο
      επιστημονικό και κοινωνικό ενδιαφέρον, καθώς σχετίζεται με τεχνικές προκλήσεις στην
      ταξινόμηση εικόνας, αλλά και με ζητήματα ηθικής, αμεροληψίας και διαφάνειας στα
      συστήματα τεχνητής νοημοσύνης.
      Στο πλαίσιο της μελέτης, υλοποιήθηκε πειραματική διαδικασία τριών σταδίων: αρχικά
      πραγματοποιήθηκε εκπαίδευση (training) σε υποσύνολα του dataset UTKFace, ακολούθησε
      fine-tuning στα δημογραφικά ισορροπημένα δεδομένα του FairFace, και τέλος
      εφαρμόστηκε inference στο εξωτερικό σύνολο Typorch, για την αξιολόγηση της
      μεταφερσιμότητας και της γενίκευσης των μοντέλων.
      Η απόδοση αξιολογήθηκε με τη χρήση καθιερωμένων μετρικών, όπως Accuracy, F1-score,
      Precision, Recall και Confusion Matrix, επιτρέποντας τη σύγκριση παραλλαγών μοντέλων
      και υπερπαραμέτρων σε διαφορετικά πεδία δεδομένων.

    • This thesis investigates the automatic recognition of gender and age from facial images
      through deep learning techniques, emphasizing both technical innovation and ethical
      awareness. The task, while fundamentally a classification problem, has profound social and
      ethical implications. Accurate demographic inference can enhance user personalization,
      biometric authentication, and service accessibility. However, incorrect or biased
      classifications risk reinforcing discrimination and violating individual rights. Prior studies
      have shown that models trained on imbalanced datasets can perform significantly worse on
      underrepresented groups, leading to algorithmic bias.
      The study focuses on evaluating Vision Transformers (ViTs), a state-of-the-art architecture
      in computer vision. Unlike traditional Convolutional Neural Networks (CNNs), which rely
      on local feature extraction, ViTs employ self-attention mechanisms to process images as
      sequences of patches. This allows them to capture global contextual information, leading to
      more robust feature representations, especially in unconstrained environments with varying
      lighting, pose, or background noise.

  13. Hellenic Open University
  14. Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές