Zahra, Bunga Anisatul (2026) EVALUASI KUALITAS DAN EFISIENSI MODEL GENERATIF TEXT TO-IMAGE DALAM SINTESIS WAJAH BERDASARKAN VARIASI PROMPT. Other thesis, Universitas Siliwangi.
01_Bagian Awal.pdf
Download (285kB)
02_BAB 1.pdf
Download (93kB)
03_BAB 2.pdf
Download (310kB)
04_BAB 3.pdf
Download (374kB)
05_BAB 4.pdf
Restricted to Repository staff only
Download (2MB)
06_BAB 5.pdf
Restricted to Repository staff only
Download (16kB)
07_Daftar Pustaka.pdf
Download (149kB)
08_Lampiran.pdf
Restricted to Repository staff only
Download (957kB)
Abstract
Model generatif text-to-image berbasis difusi, khususnya Stable Diffusion, menunjukkan kemampuan signifikan dalam menghasilkan gambar berkualitas tinggi dari prompt tekstual. Dalam konteks sintesis wajah, kompleksitas prompt berpotensi memengaruhi kualitas gambar dan efisiensi komputasi. Namun, kajian empiris mengenai hubungan tersebut masih terbatas, terutama pada perbandingan lintas versi model serta implikasinya pada lingkungan dengan keterbatasan sumber daya komputasi. Penelitian ini bertujuan menganalisis dampak kompleksitas prompt terhadap kualitas gambar dan efisiensi komputasi, mengidentifikasi pola hubungan kualitas-efisiensi, serta membandingkan respons model pada Stable Diffusion v1.4 dan v1.5. Evaluasi kuantitatif dilakukan menggunakan dataset CelebA sebagai ground truth dengan metrik Face-FID, Inception Score (IS), SSIM, CLIP score, waktu inferensi, serta penggunaan CPU, GPU, dan RAM. Hasil menunjukkan bahwa kompleksitas prompt berpengaruh signifikan namun bersifat non-linear terhadap kualitas gambar, dengan indikasi titik jenuh pada kompleksitas menengah (Prompt ID 3-5). Sebaliknya, efisiensi komputasi cenderung stabil dan tidak terpengaruh secara sistematis oleh kompleksitas prompt. Analisis hubungan kualitas dan efisiensi tidak menemukan pola trade-off, karena peningkatan kualitas tidak diikuti oleh kenaikan biaya komputasi yang konsisten. Secara komparatif, Stable Diffusion v1.5 unggul dalam keselarasan semantik dan efisiensi waktu inferensi (CLIP score +0.63%; waktu inferensi -5.42%) serta penggunaan RAM yang lebih rendah (-6.47%). Namun, v1.4 menunjukkan performa lebih baik dalam kemiripan distribusi fitur wajah dan stabilitas struktur visual (Face-FID -5.49%; SSIM +1.07%). Analisis respons model menunjukkan v1.5 lebih adaptif namun lebih sensitif terhadap prompt tertentu, sedangkan v1.4 lebih konsisten secara struktural.
Kata Kunci: Efisiensi Komputasi, Generasi Teks ke Gambar, Kompleksitas Prompt, Sintesis Wajah, Stable Diffusion.
| Item Type: | Thesis (Other) |
|---|---|
| Subjects: | T Technology > T Technology (General) |
| Divisions: | Fakultas Teknik > Teknik Informatika |
| Depositing User: | user1 user1 user1 |
| Date Deposited: | 13 Apr 2026 01:38 |
| Last Modified: | 13 Apr 2026 01:38 |
| URI: | https://repositori.unsil.ac.id/id/eprint/6429 |
