Skripsi/Tugas Akhir
Klasterisasi Ujaran Kebencian pada Platform X Menggunakan Metode BERTopic
ABSTRAK
Twitter, yang sekarang dikenal Platform X, menghadapi masalah ujaran kebencian yang dapat memicu konflik sosial. Tantangan utama dalam menganalisis ujaran kebencian adalah keberagaman bahasa, dari yang eksplisit hingga halus, yang sering kali bergantung pada konteks. Penelitian ini mengkaji penggunaan metode BERTopic untuk mengelompokkan komentar terkait ujaran kebencian di Platform X (Twitter). Dengan menganalisis 2.452 komentar ujaran kebencian dari 6.273 komentar yang dikumpulkan, hasil menunjukkan bahwa BERTopic dapat mengidentifikasi 55 kluster topik berbeda. Pengukuran kualitas pengelompokan menggunakan Silhouette Score -0,01 dan Coherence Score 0,41 menunjukkan adanya tantangan dalam klasterisasi namun tetap menghasilkan topik yang koheren. Selain itu, model Logistic Regression digunakan untuk mengklasifikasikan ujaran kebencian berhasil mengklasifikasikan tiap topik dengan akurasi 82%, precision 79%, recall 76%, dan F1-score 77%. Penelitian ini menunjukkan potensi BERTopic dalam analisis ujaran kebencian, meskipun membutuhkan optimasi dalam preprocessing data untuk meningkatkan hasil yang akurat.
Kata kunci: BERT, BERTopic, Ujaran Kebencian, Twitter, X, Klastersisasi Komentar, Logistic Regression
ABSTACT Twitter, now known as Platform X, faces the problem of hate speech that can trigger social conflict. The main challenge in analyzing hate speech is the diversity of language, from explicit to subtle, which is often context-dependent. This research examines the use of the BERTopic method to categorize comments related to hate speech on Platform X (Twitter). By analyzing 2,452 hate speech comments out of 6,273 comments collected, the results show that BERTopic can identify 55 different topic clusters. Measuring the quality of clustering using Silhouette Score -0.01 and Coherence Score 0.41 shows challenges in clustering while still producing coherent topics. In addition, the Logistic Regression model used to classify hate speech successfully classified each topic with 82% accuracy, 79% precision, 76% recall, and 77% F1-score. This research shows the potential of BERTopic in hate speech analysis, although it requires optimization in data preprocessing to improve accurate results.
Keywords: BERT, BERTopic, Hate Speech, Twitter, X, Comment Clustering, Logistic Regression
SKR 25-51 0905TI | SKR 25-51 WIJ k - 0905TI | Perpustakan UNDIPA (Rak Skripsi/Tugas Akhir) | Tidak Dipinjamkan-No Loan |
Universitas DIPA Makassar
NPP 7371142D1000002
Jln. Perintis Kemerdekaan KM.9
Telp. (0411)587194
Hotline: +6281228221994
WhatsApp Admin: +6281342092072
e-Mail: perpustakaan@undipa.ac.id
© 2025 — Perpustakaan UNDIPA Makassar - SLiMS