- MSc thesis
- Σχεδιασμός Οπτικών Εφέ και Κινούμενης Εικόνας (ΣΟΚ)
- 26 Ιουλίου 2025
- Ελληνικά
- 69
- Σπυρίδων Σιάκας
- Σπυρίδων Σιάκας | Λαμπρινή Τριβέλλα
- Generative AI, ComfyUI, Stable Diffusion XL (SDXL), LoRA (Low-Rank Adaptation), Flux 1 Kontext, Text-to-Image Synthesis, Image-to-Video Generation, Framepack F1, LTXV, Wan 2.1, Voice Cloning, ElevenLabs, AI-driven Storyboarding, Orthodox Christian Animation, AI Music Generation, TTS (Text-to-Speech), AI Video Production Workflow
- ΣΟΚ2 Προχωρημένες τεχνικές κινούμενης εικόνας
- 22
-
-
Η παρούσα διπλωματική εργασία εξετάζει τη σύλληψη, τον σχεδιασμό και την παραγωγή ενός σύντομου animation με αξιοποίηση τεχνολογιών δημιουργικής τεχνητής νοημοσύνης (generative AI). Το έργο βασίζεται στην παραβολή του Ασώτου Υιού, όπως αυτή παρουσιάζεται σε ομιλία του μακαριστού γέροντα Εφραίμ Φιλοθεΐτη, με θεματικό άξονα την αγάπη και την ευσπλαχνία του Θεού.
Το πρώτο μέρος της εργασίας επικεντρώνεται στη δημιουργική ανάπτυξη του έργου και περιλαμβάνει τη διαμόρφωση της ιδέας, την ανάλυση του είδους, της θεματικής και των χαρακτήρων. Παρουσιάζεται επίσης αναλυτικά το storyboard, το οποίο απαρτίζεται από 12 σκηνές που αποτυπώνουν την αφηγηματική εξέλιξη.
Το δεύτερο μέρος αποτελεί μία επισκόπηση των τεχνολογιών Generative AI που αξιοποιούνται στη δημιουργία οπτικοακουστικού περιεχομένου. Αναλύονται τεχνικές όπως η δημιουργία εικόνων και βίντεο από κείμενο ή εικόνες, η παραγωγή μουσικής και ηχητικών εφέ, καθώς και η συνθετική φωνή. Το μέρος αυτό θέτει τις θεωρητικές βάσεις και τις τεχνολογικές δυνατότητες που ενσωματώνονται στο έργο.
Το τρίτο μέρος περιγράφει την τεχνική υλοποίηση του animation. Παρουσιάζεται το υπολογιστικό περιβάλλον, τα λογισμικά και μοντέλα που χρησιμοποιήθηκαν (ComfyUI, Stable Diffusion XL, LoRA, ElevenLabs, Framepack, κ.ά.), καθώς και η ροή εργασίας από το σενάριο έως την τελική εξαγωγή.
Στα πλαίσια της εργασίας μελετήθηκε στην πράξη η δημιουργία ενός ολοκληρωμένου animation αποκλειστικά με τη χρήση εργαλείων τεχνητής νοημοσύνης. Παράλληλα διερευνήθηκε ο τρόπος με τον οποίο η τεχνητή νοημοσύνη μπορεί να συνεισφέρει στη δημιουργία οπτικοποιημένου υλικού από ομιλίες, κείμενα και άλλες πηγές, με στόχο την αποτελεσματικότερη διάδοσή τους.
-
This thesis explores the conception, design, and production of a short animation utilizing generative artificial intelligence (Generative AI) technologies. The project is based on the Parable of the Prodigal Son, as interpreted in a sermon by the late Elder Ephraim of Philotheou Monastery, focusing on the central themes of divine love and compassion.
The first part of the thesis addresses the creative development of the project, including the formulation of the concept, the analysis of genre, theme, and characters. It also presents in detail the storyboard, which consists of 12 scenes that reflect the narrative progression of the story.
The second part provides an overview of the Generative AI technologies employed in the creation of audiovisual content. It discusses techniques such as image and video generation from text or reference visuals, music and sound effect synthesis, and AI-generated voice. This section establishes the theoretical and technological framework integrated into the project.
The third part details the technical implementation of the animation. It describes the computing environment, software tools, and models used (including ComfyUI, Stable Diffusion XL, LoRA, ElevenLabs, and Framepack), as well as the workflow from script to final video output.
As part of this thesis, the creation of a complete animation exclusively through the use of artificial intelligence tools was practically explored. At the same time, the study investigated how artificial intelligence can contribute to the development of visual material derived from speeches, texts, and other sources, with the aim of enhancing their effective dissemination.
-
- Hellenic Open University
- Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Παραγωγή Short Animation με χρήση Generative AI
Production of a Short Animation Using Generative AI (Αγγλική)
Κύρια Αρχεία Διατριβής
- Κύριο μέρος της Διπλωματικής
Περιγραφή: Διπλωματική_εργασία_Σφαλαγκιάρης_Χρήστος_Εμμανουήλ.pdf (pdf) Book Reader
Μέγεθος: 3.1 MB