Hasari, Yasmin Indah (2025) EKSPLORASI HYPERPARAMETER DALAM PEMODELAN CROSS-LINGUAL LANGUAGE MODEL ROBUSTLY OPTIMIZED BERT PRETRAINING APPROACH (XLM-ROBERTA) UNTUK KLASIFIKASI EMOSI PADA TEKS BILINGUAL. Other thesis, Universitas siliwangi.
1. COVER.pdf
Download (138kB)
2. LEMBAR PENGESAHAN.pdf
Download (121kB)
3. LEMBAR PENGESAHAN PENGUJI.pdf
Download (121kB)
4. PERNYATAAN KEASLIAN.pdf
Download (120kB)
5. ABSTRAK.pdf
Download (205kB)
6. MOTTO & PERSEMBAHAN.pdf
Download (203kB)
7. KATA PENGANTAR.pdf
Download (160kB)
8. DAFTAR ISI.pdf
Download (220kB)
9 DAFTAR TABEL.pdf
Download (212kB)
10 DAFTAR GAMBAR.pdf
Download (208kB)
11 DAFTAR PERSAMAAN.pdf
Download (200kB)
12 DAFTAR LAMPIRAN.pdf
Download (139kB)
13. BAB I.pdf
Download (251kB)
14. BAB II.pdf
Download (618kB)
15. BAB III.pdf
Download (488kB)
16. BAB IV.pdf
Restricted to Repository staff only
Download (1MB)
17. BAB V.pdf
Restricted to Repository staff only
Download (222kB)
18. DAFTAR PUSTAKA.pdf
Download (224kB)
19. LAMPIRAN.pdf
Restricted to Repository staff only
Download (3MB)
Abstract
Penelitian ini bertujuan mengeksplorasi penerapan model XLM-RoBERTa dalam klasifikasi emosi berbasis teks bilingual, khususnya Bahasa Indonesia dan Bahasa Inggris. Fokus utama terletak pada analisis pengaruh representasi emoji dalam teks serta konfigurasi jumlah epoch sebagai bagian dari eksplorasi hyperparameter. Sebelum pelatihan, teks dibersihkan dari karakter noise seperti simbol khusus. Penelitian dilakukan melalui dua skenario pelatihan, yaitu mengonversi emoji menjadi teks deskriptif, dan menghapusnya, dengan tiga konfigurasi epoch: 3, 5, dan 10. Teknik early stopping digunakan untuk mencegah overfitting. Evaluasi dilakukan menggunakan akurasi dan confusion matrix pada masing-masing skenario. Hasil menunjukkan bahwa keberadaan emoji berkontribusi positif terhadap akurasi model, dengan akurasi tertinggi sebesar 96.33% pada data Bahasa Indonesia dan 93.45% pada data Bahasa Inggris. Selain itu, konfigurasi epoch optimal tidak selalu sama pada tiap skenario. Data Bahasa Inggris menunjukkan perbedaan hasil tergantung keberadaan emoji, sedangkan data Bahasa Indonesia cenderung konsisten pada satu konfigurasi. Hal ini mengindikasikan bahwa kompleksitas serta karakteristik data memengaruhi proses pelatihan model. Penelitian ini berkontribusi pada pengembangan model klasifikasi emosi pada teks bilingual dengan mempertimbangkan unsur nonverbal seperti emoji.
Kata Kunci — Eksplorasi Hyperparameter, Emoji, Noise Character, Teks Bilingual, XLM-RoBERTa
| Item Type: | Thesis (Other) |
|---|---|
| Subjects: | T Technology > T Technology (General) |
| Divisions: | Fakultas Teknik > Teknik Informatika |
| Depositing User: | user2 user2 user2 |
| Date Deposited: | 18 Feb 2026 02:25 |
| Last Modified: | 18 Feb 2026 02:25 |
| URI: | https://repositori.unsil.ac.id/id/eprint/5974 |
