Klasifikasi Berita Palsu Menggunakan Model Bidirectional Encoder Representations From Transformers (BERT)

Enjeli Cistia Sukmawati; Lintang Suryaningrum; Diva Angelica; Nur Ghaniaviyanto Ramadhan

doi:10.37278/sisinfo.v6i2.934

Authors

Enjeli Cistia Sukmawati Program Studi Rekayasa Perangkat Lunak, Fakultas Informatika, Institut Teknologi Telkom Purwokerto
Lintang Suryaningrum Program Studi Rekayasa Perangkat Lunak, Fakultas Informatika, Institut Teknologi Telkom Purwokerto
Diva Angelica Program Studi Rekayasa Perangkat Lunak, Fakultas Informatika, Institut Teknologi Telkom Purwokerto
Nur Ghaniaviyanto Ramadhan Program Studi Rekayasa Perangkat Lunak, Fakultas Informatika, Institut Teknologi Telkom Purwokerto

DOI:

https://doi.org/10.37278/sisinfo.v6i2.934

Keywords:

BERT, berita palsu, klasifikasi, NLP

Abstract

Penyebaran informasi palsu menjadi tantangan serius dalam era digital yang terus berkembang, terutama melalui internet dan platform sosial media. Akses mudah terhadap informasi tidak terverifikasi menciptakan tantangan membedakan antara fakta dan hoaks. Salah satu aspek utama yang perlu diatasi adalah mengklasifikasikan berita palsu dengan tingkat akurasi yang tinggi. Berita sebagai sumber informasi aktual memerlukan pengelompokan untuk memfasilitasi akses, namun tidak semua berita dari berbagai sumber memiliki kredibilitas tinggi, terutama dengan adanya fake news. Fake news dapat merugikan individu dan berpotensi memanipulasi persepsi masyarakat, terutama melalui media sosial. Mengidentifikasi informasi palsu menjadi tantangan dalam Natural Language Processing (NLP) dengan pertumbuhan pesat platform media sosial. Meskipun ada beberapa metode untuk mendeteksi berita palsu, belum ada platform yang secara luas dikenal menerapkan algoritma terfokus pada sumber berita spesifik. Oleh karena itu, penelitian ini bertujuan untuk mengatasi masalah penyebaran informasi palsu dengan mengelompokkan berita palsu berdasarkan ciri-ciri bahasa, mengadopsi metode klasifikasi menggunakan teknologi Bidirectional Encoder Representations from Transformers (BERT). BERT, sebagai model bahasa yang dilatih mendalam, memahami konteks kata dalam teks dengan baik. Kami mengadopsi teknologi BERT untuk meningkatkan akurasi deteksi berita palsu. Meskipun BERT memiliki kompleksitas, sumber model yang sudah dilatih oleh Google memudahkan penggunaan tanpa perlu membuat model dari awal. Dengan langkah pretraining dan fine tuning, BERT dianggap lebih akurat dalam mendeteksi berita palsu dibandingkan metode lainnya. Penelitian ini memberikan kontribusi dalam menghadapi tantangan penyebaran informasi palsu dengan memanfaatkan keunggulan teknologi BERT dalam mengklasifikasikan berita.

References

Sholikhah, I. I., Harjanta, A. T. J., & Latifah, K. (2023). Machine Learning Untuk Deteksi Berita Hoax Menggunakan BERT. Prosiding Seminar Nasional Informatika, 1(1), 524–531.

Kasanah, A. N., Muladi, M., & Pujianto, U. (2019). Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 3(2), 196–201. https://doi.org/10.29207/resti.v3i2.945.

Pramudita, Y. D., Putro, S. S., & Makhmud, N. (2018). Klasifikasi Berita Olahraga Menggunakan Metode Naïve Bayes dengan Enhanced Confix Stripping Stemmer. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(3), 269–276. https://doi.org/10.25126/jtiik.201853810.

Tandijaya, J. H., Liliana, & Sugiarto, I. (2021). Klasifikasi dalam Pembuatan Portal Berita Online dengan Menggunakan Metode BERT. Jurnal Infra, 09(02), 320–325.

Ramadhan, Nur Ghaniaviyanto, et al. (2022). Deteksi Berita Palsu Menggunakan Metode Random Forest dan Logistic Regression. JURIKOM (Jurnal Riset Komputer), 9(2), 251-256.

Rahadi, D. R. (2017). Perilaku Pengguna Dan Informasi Hoax Di Media Sosial. Jurnal Manajemen Dan Kewirausahaan, 5(1), 58–70. https://doi.org/10.26905/jmdk.v5i1.1342.

Oshikawa, R., Qian, J., & Wang, W. Y. (2020). A survey on natural language processing for fake news detection. LREC 2020 - 12th International Conference on Language Resources and Evaluation, Conference Proceedings, 6086–6093.

Muzakir, A., & Suriani, U. (2023). Model Deteksi Berita Palsu Menggunakan Pendekatan Bidirectional Long Short-Term Memory (Bilstm). Journal of Computer and Information Systems Ampera, 4(2), 93–105.

Yunanto, R., Purfini, A. P., & Prabuwisesa, A. (2021). Survei Literatur: Deteksi Berita Palsu Menggunakan Pendekatan Deep Learning. Jurnal Manajemen Informatika (JAMIKA), 11(2), 118–130. https://doi.org/10.34010/jamika.v11i2.5362.

Sains, F., Teknologi, D., Islam, U., & Sunan, N. (2023). PEMODELAN TOPIK DALAM AL-QUR ’ AN MENGGUNAKAN LIBRARY. 14(2), 319–327.

Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. NAACL HLT 2019 - 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies - Proceedings of the Conference, 1(Mlm), 4171–4186.

Halim, F., Liliana, & Gunadi, K. (2022). Ringkasan Ekstraktif Otomatis pada Berita Berbahasa Indonesia Menggunakan Metode BERT. Jurnal Infra, 10(1), 162–168.

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 2017-Decem(Nips), 5999–6009.

Mas, R., Panca, R. W., Atmaja1, K., & Yustanti2, W. (2021). Analisis Sentimen Customer Review Aplikasi Ruang Guru dengan Metode BERT (Bidirectional Encoder Representations from Transformers). Jeisbi, 02(3), 55–62.

Ardiansyah, Adika Sri Widagdo, Krisna Nuresa Qodri, Saputro, F. E. N., & Nisrina Akbar Rizky P. (2023). Analisis sentimen terhadap pelayanan Kesehatan berdasarkan ulasan Google Maps menggunakan BERT. Jurnal Fasilkom, 13(02), 326–333. https://doi.org/10.37859/jf.v13i02.5170.

Liu, Y., & Lapata, M. (2019). Text summarization with pretrained encoders. EMNLP-IJCNLP 2019 - 2019 Conference on Empirical Methods in Natural Language Processing and 9th International Joint Conference on Natural Language Processing, Proceedings of the Conference, 3730–3740. https://doi.org/10.18653/v1/d19-1387.

Kusnadi, R., Yusuf, Y., Andriantony, A., Ardian Yaputra, R., & Caintan, M. (2021). Analisis Sentimen Terhadap Game Genshin Impact Menggunakan Bert. Rabit : Jurnal Teknologi Dan Sistem Informasi Univrab, 6(2), 122–129. https://doi.org/10.36341/rabit.v6i2.1765.

Fajri, F., Tutuko, B., & Sukemi, S. (2022). Membandingkan Nilai Akurasi BERT dan DistilBERT pada Dataset Twitter. JUSIFO (Jurnal Sistem Informasi), 8(2), 71–80. https://doi.org/10.19109/jusifo.v8i2.13885.

Muhammad Adrinta Abdurrazzaq, E. L. T. (2022). Analisis Sentimen KUHP Baru Pada Data Twitter Menggunakan Model BERT. Jurnal Komunikasi, Sains Dan Teknologi, 1(2), 38–43.

Putu, N., Saraswati, V. D., Yudistira, N., & Adikara, P. P. (2023). Analisis Sentimen terhadap Perundungan Siber pada Twitter menggunakan Algoritma Bidirectional Encoder Representations from Transformer (BERT). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 7(2), 909–916.

Ramadhan, Nur Ghaniaviyanto. (2021). Indonesian online news topics classification using Word2Vec and K-nearest neighbor. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(6), 1083-1089.

Saputra, R. (2022). Implementasi Bidirectional Encoder Representations From Transformers (BERT) Untuk Mendeteksi Hatespeech Dan Abusive Language Pada Twitter Bahasa Indonesia. Uin Suska Riau

Klasifikasi Berita Palsu Menggunakan Model Bidirectional Encoder Representations From Transformers (BERT)

Authors

DOI:

Keywords:

Abstract

References

Downloads

Published

How to Cite

Issue

Section

License