EVALUASI KUALITAS DAN EFISIENSI MODEL GENERATIF TEXT TO-IMAGE DALAM SINTESIS WAJAH BERDASARKAN VARIASI PROMPT

Zahra, Bunga Anisatul (2026) EVALUASI KUALITAS DAN EFISIENSI MODEL GENERATIF TEXT TO-IMAGE DALAM SINTESIS WAJAH BERDASARKAN VARIASI PROMPT. Other thesis, Universitas Siliwangi.

[thumbnail of 01_Bagian Awal.pdf] Text
01_Bagian Awal.pdf

Download (285kB)
[thumbnail of 02_BAB 1.pdf] Text
02_BAB 1.pdf

Download (93kB)
[thumbnail of 03_BAB 2.pdf] Text
03_BAB 2.pdf

Download (310kB)
[thumbnail of 04_BAB 3.pdf] Text
04_BAB 3.pdf

Download (374kB)
[thumbnail of 05_BAB 4.pdf] Text
05_BAB 4.pdf
Restricted to Repository staff only

Download (2MB)
[thumbnail of 06_BAB 5.pdf] Text
06_BAB 5.pdf
Restricted to Repository staff only

Download (16kB)
[thumbnail of 07_Daftar Pustaka.pdf] Text
07_Daftar Pustaka.pdf

Download (149kB)
[thumbnail of 08_Lampiran.pdf] Text
08_Lampiran.pdf
Restricted to Repository staff only

Download (957kB)

Abstract

Model generatif text-to-image berbasis difusi, khususnya Stable Diffusion, menunjukkan kemampuan signifikan dalam menghasilkan gambar berkualitas tinggi dari prompt tekstual. Dalam konteks sintesis wajah, kompleksitas prompt berpotensi memengaruhi kualitas gambar dan efisiensi komputasi. Namun, kajian empiris mengenai hubungan tersebut masih terbatas, terutama pada perbandingan lintas versi model serta implikasinya pada lingkungan dengan keterbatasan sumber daya komputasi. Penelitian ini bertujuan menganalisis dampak kompleksitas prompt terhadap kualitas gambar dan efisiensi komputasi, mengidentifikasi pola hubungan kualitas-efisiensi, serta membandingkan respons model pada Stable Diffusion v1.4 dan v1.5. Evaluasi kuantitatif dilakukan menggunakan dataset CelebA sebagai ground truth dengan metrik Face-FID, Inception Score (IS), SSIM, CLIP score, waktu inferensi, serta penggunaan CPU, GPU, dan RAM. Hasil menunjukkan bahwa kompleksitas prompt berpengaruh signifikan namun bersifat non-linear terhadap kualitas gambar, dengan indikasi titik jenuh pada kompleksitas menengah (Prompt ID 3-5). Sebaliknya, efisiensi komputasi cenderung stabil dan tidak terpengaruh secara sistematis oleh kompleksitas prompt. Analisis hubungan kualitas dan efisiensi tidak menemukan pola trade-off, karena peningkatan kualitas tidak diikuti oleh kenaikan biaya komputasi yang konsisten. Secara komparatif, Stable Diffusion v1.5 unggul dalam keselarasan semantik dan efisiensi waktu inferensi (CLIP score +0.63%; waktu inferensi -5.42%) serta penggunaan RAM yang lebih rendah (-6.47%). Namun, v1.4 menunjukkan performa lebih baik dalam kemiripan distribusi fitur wajah dan stabilitas struktur visual (Face-FID -5.49%; SSIM +1.07%). Analisis respons model menunjukkan v1.5 lebih adaptif namun lebih sensitif terhadap prompt tertentu, sedangkan v1.4 lebih konsisten secara struktural.

Kata Kunci: Efisiensi Komputasi, Generasi Teks ke Gambar, Kompleksitas Prompt, Sintesis Wajah, Stable Diffusion.

Item Type: Thesis (Other)
Subjects: T Technology > T Technology (General)
Divisions: Fakultas Teknik > Teknik Informatika
Depositing User: user1 user1 user1
Date Deposited: 13 Apr 2026 01:38
Last Modified: 13 Apr 2026 01:38
URI: https://repositori.unsil.ac.id/id/eprint/6429

Actions (login required)

View Item
View Item