Penerapan Long Short-Term Memory untuk Klasifikasi Multi-Label Terjemahan Al-Qur’an dalam Bahasa Indonesia
DOI:
https://doi.org/10.31328/jointecs.v8i1.5291Keywords:
al-qur'an, klasifikasi ayat, lstm, word embedding, terjemahanAbstract
Mempelajari Al-Qur'an adalah salah satu ibadah yang sangat dianjurkan dalam Islam, dan memahami cara mengklasifikasikan ayat-ayatnya sangat penting. Pengelompokan ayat-ayat ini mempermudah pencarian dan mempelajari ayat-ayat terkait, karena setiap ayat dapat termasuk dalam satu atau lebih kategori yang berbeda. Penelitian ini bertujuan untuk mengembangkan model klasifikasi multi-label untuk teks terjemahan Al-Qur’an dalam bahasa Indonesia menggunakan Bi-Directional Long Short-Term Memory (Bi-LSTM) dan teknik word embedding Word2Vec dengan arsitektur Continuous Bag of Words (CBOW). Data yang digunakan berasal dari terjemahan resmi Kementerian Agama Republik Indonesia, khususnya dari Surah An-Nisa', Surah Al-Maidah, dan Surah Al-An'am, dengan total 461 ayat. Proses klasifikasi mempertimbangkan empat kategori utama: Tauhid, Ibadah, Akhlaq, dan Sejarah (Tarikh). Model diuji dengan berbagai skenario pembagian data dan dievaluasi menggunakan metrik akurasi, precision, recall, dan Hamming Loss. Hasil menunjukkan bahwa model Bi-LSTM dengan Word2Vec mencapai akurasi 70,21%, precision 64,31%, recall 61,13%, dan Hamming Loss 36,52%. Meskipun menunjukkan peningkatan signifikan, model ini masih menghadapi tantangan dalam mencapai akurasi yang lebih tinggi karena kompleksitas bahasa Al-Qur’an. Penelitian ini menyarankan penggunaan data yang lebih representatif, teknik embedding lain, dan arsitektur model yang lebih canggih untuk perbaikan lebih lanjut. Model ini diharapkan dapat mempermudah pembelajaran dan pemahaman Al-Qur’an secara lebih akurat dan efisien.References
M. Oktarina, “Faedah Mempelajari Dan Membaca Al-Quran Dengan Tajwid,†Serambi Tarbawi, vol. 8, no. 2, pp. 147–162, 2020, doi: 10.32672/tarbawi.v8i2.5072.
S. Qutub, “Sumber-Sumber Ilmu Pengetahuan Dalam Al Qur’an Dan Hadits,†Humaniora, vol. 2, no. 2, p. 1339, Oct. 2011, doi: 10.21512/humaniora.v2i2.3198.
M. Robani and A. Widodo, “Algoritma K-Means Clustering Untuk Pengelompokan Ayat Al Quran Pada Terjemahan Bahasa Indonesia,†Jurnal Sistem Informasi Bisnis, vol. 6, no. 2, p. 164, 2016, doi: 10.21456/vol6iss2pp164-176.
M. Fauzan, H. Junaedi, and E. Setyati, “Klasifikasi Al – Qur’an Terjemahan Bahasa Indonesia Dengan Menggunakan Algoritma Support Vector Machine (SVM),†KONVERGENSI, vol. 18, no. 2, pp. 42–49, Dec. 2022, doi: 10.30996/konv.v18i1.6912.
M. Irfan, W. Uriawan, N. Lukman, O. Kurahman, and W. Darmalaksana, “The Qur’anic Classification Uses Algorithm C4.5,†2020, doi: 10.4108/eai.2-10-2018.2295558.
A. Hanafi, A. Adiwijaya, and W. Astuti, “Klasifikasi Multi Label Pada Hadis Bukhari Terjemahan Bahasa Indonesia Menggunakan Mutual Information Dan K-Nearest Neighbor,†Jurnal Sisfokom (Sistem Informasi dan Komputer), vol. 9, no. 3, pp. 357–364, 2020, doi: 10.32736/sisfokom.v9i3.980.
T. H. Putrisanni, A. Adiwijaya, and S. Al Faraby, “Klasifikasi Ayat Al - Quran Terjemahan Bahasa Inggris Menggunakan K-Nearest Neighbor Dan Information Gain,†KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer), vol. 3, no. 1, pp. 362–369, 2019, doi: 10.30865/komik.v3i1.1614.
A. Abdullahi, N. A. Samsudin, M. H. A. Rahim, S. K. A. Khalid, and R. Efendi, “Multi-Label Classification Approach For Quranic Verses Labeling,†Indonesian Journal of Electrical Engineering and Computer Science, vol. 24, no. 1, pp. 484–490, 2021, doi: 10.11591/ijeecs.v24.i1.pp484-490.
B. A. H. Kholifatullah and A. Prihanto, “Penerapan Metode Long Short Term Memory Untuk Klasifikasi Pada Hate Speech,†Journal of Informatics and Computer Science (JINACS), vol. 04, pp. 292–297, Jan. 2023, doi: 10.26740/jinacs.v4n03.p292-297.
D. I. Af’idah, D. Dairoh, S. F. Handayani, and R. W. Pratiwi, “Pengaruh Parameter Word2Vec Terhadap Performa Deep Learning Pada Klasifikasi Sentimen,†Jurnal Informatika: Jurnal Pengembangan IT, vol. 6, no. 3, pp. 156–161, 2021, doi: 10.30591/jpit.v6i3.3016.
A. Sepas-Moghaddam, A. Etemad, F. Pereira, and P. L. Correia, “Long Short-Term Memory With Gate And State Level Fusion For Light Field-Based Face Recognition,†IEEE Transactions on Information Forensics and Security, vol. 16, pp. 1365–1379, 2021, doi: 10.1109/TIFS.2020.3036242.
B. Jang, M. Kim, G. Harerimana, S. U. Kang, and J. W. Kim, “Bi-LSTM Model To Increase Accuracy In Text Classification: Combining Word2vec CNN And Attention Mechanism,†Applied Sciences (Switzerland), vol. 10, no. 17, Sep. 2020, doi: 10.3390/app10175841.
R. A. Rajagede and R. P. Hastuti, “Al-Quran Recitation Verification For Memorization Test Using Siamese LSTM Network,†Communications in Science and Technology, vol. 6, no. 1, pp. 35–40, 2021, doi: 10.21924/CST.6.1.2021.344.
W. K. Sari, D. P. Rini, and R. F. Malik, “Text Classification Using Long Short-Term Memory With GloVe Features,†Jurnal Ilmiah Teknik Elektro Komputer dan Informatika, vol. 5, no. 2, p. 85, 2020, doi: 10.26555/jiteki.v5i2.15021.
W. Chen, X. Liu, D. Guo, and M. Lu, “Multi-label Text Classification Based On Sequence Model,†in Communications in Computer and Information Science, Springer Verlag, 2019, pp. 201–210. doi: 10.1007/978-981-32-9563-6_21.
R. B. Afrianto and L. Y. Kurniawati, “Kategorisasi Dokumen Teks Secara Multi Label Menggunakan Fuzzy C-Means Dan K-Nearest Neighbors Pada Artikel Berbahasa Indonesia,†JUTI: Jurnal Ilmiah Teknologi Informasi, vol. 11, no. 1, p. 23, 2013, doi: 10.12962/j24068535.v11i1.a17.
S. Sayyida, “Ayat-Ayat Tauhid Terhadap Budaya Pemeliharaan Keris Di Jawa (Studi Kasus Buku Mt Arifin),†Journal of Qur’an and Hadith Studies, vol. 6, no. 1, pp. 24–52, 2019, doi: 10.15408/quhas.v6i1.13403.
S. Hadi and L. M. Mujahid Imaduddin, “Tawhid sebagai Prinsip Primordial Peradaban Islam: Studi Pemikiran Isma’il Raji al-Faruqi,†Tsaqafah - Jurnal Peradaban Islam, vol. 15, no. 2, pp. 265–290, 2019, [Online]. Available: www.irf.net
A. Kallang, “Konteks Ibadah Menurut Al-Quran,†Al-Din: Jurnal Dakwah dan Sosial Keagamaan, vol. 4, no. 2, pp. 1–13, 2018, doi: 10.35673/ajdsk.v4i2.630.
R. Abdul Hadi and Y. Suharyat, “Dakwah Dalam Perspektif Al Qur’an Dan Al Hadits,†Jurnal Agama, Sosial dan Budaya (Religion), vol. 1, no. 5, 2022.
M. Murharyana, I. I. Al Ayyubi, and R. Rohmatulloh, “Pendidikan Akhlak Anak Kepada Orang Tua Dalam Perspektif Al-Quran,†Piwulang: Jurnal Pendidikan Agama Islam, vol. 5, no. 2, pp. 175–191, 2023, doi: http://dx.doi.org/10.32478/piwulang.v5i2.1515.
M. Astuti, R. Febriani, and N. Oktarina, “Pentingnya Pendidikan Islam Dalam Membentuk Karakter Generasi Muda,†Jurnal Faidatuna, vol. 4, no. 3, pp. 140–149, 2023, doi: 10.53958/ft.v4i3.302.
J. Mirdad and S. Rahmat, “Sejarah Dalam Perspektif Islam,†El -Hekam, vol. 6, no. 1, p. 9, 2021, doi: 10.31958/jeh.v6i1.3303.
A. S. Mainiyo and M. M. Sule, “Impact Of Qur’anic Moral Excellence On The Lives Of Muslim Society: An Exposition,†Jurnal Ilmu-Ilmu Sosial (Spectra), vol. 6, no. 1, 2024, doi: 10.34005/spektra.v6i1.3637.
L. Hickman, S. Thapa, L. Tay, M. Cao, and P. Srinivasan, “Text Preprocessing For Text Mining In Organizational Research: Review And Recommendations,†Organ Res Methods, vol. 25, no. 1, pp. 114–146, Jan. 2022, doi: 10.1177/1094428120971683.
M. Nesca, A. Katz, C. K. Leung, and L. M. Lix, “A Scoping Review Of Preprocessing Methods For Unstructured Text Data To Assess Data Quality,†International Journal of Population Data Science Journal Website: www.ijpds.org, vol. 7, no. 1, 2022, doi: 10.23889/ijpds.v6i1.1757.
S. Bessou and R. Aberkane, “Subjective Sentiment Analysis For Arabic Newswire Comments,†Journal of Digital Information Management, vol. 17, no. 5, p. 289, 2019, doi: 10.6025/jdim/2019/17/5/289-295.
A. A. Firdaus, A. Yudhana, and I. Riadi, “Public Opinion Analysis Of Presidential Candidate Using Naïve Bayes Method,†Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control, vol. 4, no. 2, 2023, doi: 10.22219/kinetik.v8i2.1686.
E. Y. Sari, A. D. Wierfi, and A. Setyanto, “Sentiment Analysis Of Customer Satisfaction On Transportation Network Company Using Naive Bayes Classifier,†2019 International Conference on Computer Engineering, Network, and Intelligent Multimedia, CENIM 2019 - Proceeding, vol. 2019-Novem, 2019, doi: 10.1109/CENIM48368.2019.8973262.
E. H. Mohamed and W. H. El-Behaidy, “An Ensemble Multi-label Themes-Based Classification For Holy Qur’an Verses Using Word2Vec Embedding,†Arab J Sci Eng, vol. 46, no. 4, pp. 3519–3529, 2021, doi: 10.1007/s13369-020-05184-0.
J. Hermanto, “Klasifikasi Teks Humor Bahasa Indonesia Memanfaatkan SVM,†Journal of Information System,Graphics, Hospitality and Technology, vol. 3, no. 01, pp. 39–48, 2021, doi: 10.37823/insight.v3i01.118.
L. Xiao, G. Wang, and Y. Zuo, “Research On Patent Text Classification Based On Word2Vec And LSTM,†Proceedings - 2018 11th International Symposium on Computational Intelligence and Design, ISCID 2018, vol. 1, pp. 71–74, 2018, doi: 10.1109/ISCID.2018.00023.
A. Saifudin, “Metode Data Mining Untuk Seleksi Calon Mahasiswa,†vol. 10, no. 1, pp. 25–36, 2018, doi: https://dx.doi.org/10.24853/jurtek.10.1.25-36.
C. An, Y. W. Park, S. S. Ahn, K. Han, H. Kim, and S. K. Lee, “Radiomics Machine Learning Study With A Small Sample Size: Single Random Training-Test Set Split May Lead To Unreliable Results,†PLoS One, vol. 16, no. 8 August, Aug. 2021, doi: 10.1371/journal.pone.0256152.
A. M. Ertugrul and P. Karagoz, “Movie Genre Classification From Plot Summaries Using Bidirectional LSTM,†Proceedings - 12th IEEE International Conference on Semantic Computing, ICSC 2018, vol. 2018-Janua, pp. 248–251, 2018, doi: 10.1109/ICSC.2018.00043.
A. R. Isnain, A. Sihabuddin, and Y. Suyanto, “Bidirectional Long Short Term Memory Method And Word2vec Extraction Approach For Hate Speech Detection,†IJCCS (Indonesian Journal of Computing and Cybernetics Systems), vol. 14, no. 2, p. 169, 2020, doi: 10.22146/ijccs.51743.
Downloads
Published
Issue
Section
License
Copyright (c) 2024 JOINTECS (Journal of Information Technology and Computer Science)

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Pernyataan Hak Cipta dan Lisensi
Hak Cipta :
Penulis yang mempublikasikan naskahnya pada Jurnal ini menyetujui ketentuan berikut:
Hak cipta pada setiap artikel adalah milik penulis.
- Penulis mengakui bahwa JOINTECS (JOURNAL OF INFORMATION TECHNOLOGY AND COMPUTER SCIENCE) berhak sebagai yang mempublikasikan pertama kali dengan lisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0).
- Penulis dapat memasukan tulisan secara terpisah, mengatur distribusi non-ekskulif  dari naskah yang telah terbit di jurnal ini kedalam versi yang lain (misal: dikirim ke respository institusi penulis, publikasi kedalam buku, dll), dengan mengakui bahwa naskah telah terbit pertama kali pada JOINTECS (JOURNAL OF INFORMATION TECHNOLOGY AND COMPUTER SCIENCE);
Lisensi :
JOINTECS diterbitkan berdasarkan ketentuan Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0). Lisensi ini mengizinkan setiap orang untuk menyalin dan menyebarluaskan kembali materi ini dalam bentuk atau format apapun, menggubah, mengubah, dan membuat turunan dari materi ini untuk kepentingan apapun, termasuk kepentingan komersial, selama mereka mencantumkan kredit kepada Penulis atas ciptaan asli.
This work is Under licensed
Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)