MAXIMUM MARGINAL RELEVANCE BERBASIS BOOLEAN MODEL PADA PERINGKASAN ARTIKEL BERITA PENDEK

Authors

  • Arie Atwa Magriyanti Universitas Sains dan Teknologi Komputer Semarang

DOI:

https://doi.org/10.55606/juitik.v1i3.132

Keywords:

text summarization, VSM, TF-IDF-DF, boolean model, jaccard, dice, cosine coefficient, MMR

Abstract

Portal berita online merupakan situs yang memuat segala berita dan artikel untuk dibaca pengunjung, berisi opini dan komentar-komentar seputar politik, teknologi dan lain-lain. Ada berbagai portal berita online yang bisa kita akses, antara lain antaranews.com dan tribunnews.com. Meningkatnya jumlah portal berita online, mengakibatkan tingginya jumlah berita yang bisa dibaca masyarakat. Oleh sebab itu, kebutuhan peringkasan teks (text summarization) semakin diperlukan masyarakat untuk kemudahan dan penghematan waktu. Sistem peringkasan teks otomatis yang digunakan pada penelitian sebelumnya, menggunakan metode Maximum Marginal Relevance (MMR) berbasis Vector Space Model (VSM) dengan representasi algoritma pembobotan kata menggunakan TF-IDF-DF (Term Frequency-Inverse Document Frequency-Document Frequency). Pada algoritma ini, kata yang sering muncul memiliki jumlah yang tinggi, sehingga bobot hubungan antara sebuah kata dan kalimat rendah, sehingga metode ini cocok untuk artikel panjang yang memiliki banyak jumlah kalimat. Oleh karena itu, perlu diusulkan metode lain untuk menghitung kesamaan kata dengan menggunakan boolean model dengan representasi jaccard, dice dan cosine coefficient. Ketiga metode ini digunakan untuk mengetahui document yang paling relevan untuk kumpulan kata kunci (query) yang diberikan. Setelah proses boolean, perlu dilakukan metode ekstraksi teks yang diterapkan yaitu MMR (Maximum Marginal Relevance) untuk meringkas document tunggal dengan cara melakukan rangking, membandingkan similarity query dan document, dan similarity antar document. Dari hasil penelitian, boolean model memiliki nilai akurasi yang lebih tinggi daripada VSM, dan  di antara ketiga metode boolean model, metode cosine coefficient lebih unggul dengan akurasi 59.3 %.

References

W. Yulita and F. S. Pribadi, “The Implementation of Maximum Marginal Relevance Method on Online National and Local News Portal,” vol. 7, pp. 21–25, 2015.

V. Thada and V. Jaglan, “Comparison of Jaccard, Dice, Cosine Similarity Coefficient To Find Best Fitness Value for Web Retrieved Documents Using Genetic Algorithm,” Int. J. Innov. Eng. Technol., vol. 2, no. 4, pp. 202–205, 2013.

J. Ramos, J. Eden, and R. Edu, “Using TF-IDF to Determine Word Relevance in Document Queries,” Processing, 2003.

S. Niwattanakul, J. Singthongchai, E. Naenudorn, and S. Wanapu, “Using of Jaccard Coefficient for Keywords Similarity,” Int. MultiConference Eng. Comput. Sci., vol. I, pp. 380–384, 2013.

N. Anuar and A. B. Sultan, “Validate Conference Paper Using Dice Coefficient,” vol. 3, no. 3, pp. 139–145, 2010.

N. Agarwal, M. Rawat, and M. Vijay, “Comparative Analysis Of Jaccard Coefficient and Cosine Similarity for Web Document Similarity Measure,” Int. J. Adv. Res. Eng. Technol., vol. 2, no. 5, pp. 18–21, 2014.

Sugiyamto, B. Surarso, dan A. Sugiharto, “Analisa performa metode cosine dan jacard pada pengujian kesamaan document,” J. Masy. Inform., vol. 5, pp. 1–8, 2014.

S. Xie and Y. Liu, “Using corpus and knowledge-based similarity measure in Maximum Marginal Relevance for meeting summarization,” ICASSP, IEEE Int. Conf. Acoust. Speech Signal Process. - Proc., no. 2, pp. 4985–4988, 2008.

Luhn, H.P., "The Automatic Creation of Literature Abstracts,"IBM JOURNAL, 159-165, 1958.

Carbonell, J.G. dan J. Goldstein, "The Use of MMR and Diversity-Based Reranking in Document Reranking and Summarization," ACM SIGIR conference on Research and development in information retrieval, 12:335-336, 1998.

Mulyana, I., S. Ramadhona, dan Herfina, "Penerapan Terms Frequency-Inverse Document Frequency Sistem Peringkasan Teks Otomatis Document Tunggal Berbahasa Indonesia," KNASTIK, 1-8, 2012.

Yusintan, B. P., Y. Firdaus, dan W. Maharani,"Perangkingan Ulang Document Teks dengan Metode Maximal Marginal Relevance untuk Menghasilkan Ringkasan Teks dengan Redundansi Minimum,"Tel-U Collection, 1-2, 2010.

Nazief, B. A. A. and M. Adriani,“Confix-Stripping : Approach to Stemming Algorithm for Bahasa Indonesia,”International Conference on Informationand Knowledge Management, 560-563, 1996.

Pramono, L.H., A.S. Rohman, and H. Hindersah,“Modified WeightingMethod in TF*IDF Algorithm for Extracting User Topic Based on Email and Social Media in Integrated Digital Assistant,”Rural Information & Communication Technology and Electric-Vehicle Technology, 1-6, 2013.

YAN ILMAS PUIMERA and Danang Danang, “RANCANG BANGUN ALAT PENYORTIRAN BARANG OTOMATIS BERBASIS ARDUINO PADA PT WAHANA PRESTASI LOGISTIK SEMARANG”, ELKOM, vol. 11, no. 1, pp. 38-44, Jul. 2018.

Rasminto, Hendri, & Danang, D. (2018). IMPLEMENTASI WEBSITE SEBAGAI MEDIA PROMOSI DAN INFORMASI PADA MAX Team OUTBOUND TRAINING UNTUK MEMUDAHKAN DAN MENINGKATKAN DAYA TARIK PELANGGAN . JURNAL TEKNOLOGI INFORMASI DAN KOMUNIKASI, 9(2), 25-36. https://doi.org/10.51903/jtikp.v9i2.155

G. Gufron and D. Danang, “SISTEM PAKAR PENANGANAN KERUSAKAN KOMPUTER DAN PERIPHERALNYA”, ELKOM, vol. 11, no. 2, pp. 29-42, Dec. 2018.

Eni Dwifitri Astutiningtias, & Danang Danang. (2018). DESAIN WEB SEBAGAI MEDIA PROMOSI DAN INFORMASI PADA RAFI STAMP SEMARANG . Pixel :Jurnal Ilmiah Komputer Grafis, 11(2), 13-22. Retrieved from https://journal.stekom.ac.id/index.php/pixel/article/view/64

Danang Danang, & Fatimah Indrawati. (2018). PENGEMBANGAN SISTEM PERSEDIAAN BARANG BERBASIS MULTIUSER DI PT. SAI APPAREL INDUSTRIES SEMARANG. Kompak :Jurnal Ilmiah Komputerisasi Akuntansi , 11(2), 45-52. https://doi.org/10.51903/kompak.v11i2.47

Andik Susdiyanto, & Danang Danang. (2018). SISTEM INFORMASI PENJUALAN SECARA ONLINE (Studi Kasus Pada CV. Java Mini Semarang). Kompak :Jurnal Ilmiah Komputerisasi Akuntansi , 11(2), 21-32. https://doi.org/10.51903/kompak.v11i2.45

Danang Danang and Siswanto Siswanto, “KONSEP PENGENDALI LAMPU PENERANGAN RUMAH DARI JARAK JAUH MENGGUNAKAN GELOMBANG FREKUENSI”, ELKOM, vol. 12, no. 2, pp. 34-49, Dec. 2019.

Suwardi Suwardi, & Danang, D. (2019). Sistem Informasi Persediaan Oli Dengan Metode ROP di CV. Sumber Lumas Semarang. JURNAL TEKNOLOGI INFORMASI DAN KOMUNIKASI, 10(2), 1-8. https://doi.org/10.51903/jtikp.v10i2.129

D. Danang, S. Suwardi, and I. A. Hidayat, "Flood Disaster Mitigation Using a Disaster Early Warning and Monitoring Information System with an IoT-Based Arduino Microcontroller," TEKNIK, vol. 40, no. 1, pp. 55-62, May. 2019. https://doi.org/10.14710/teknik.v40i1.23342

D. Sasmoko, Danang Danang, Padjar Setyo Budi, and Muhammad Agus Kurniawan, “Penggunaan Sensor TCS3200 dan NodeMCU untuk Mendeteksi Warna Daun Padi dalam Menentukan Jumlah Pupuk Urea Bebasis IoT”, ELKOM, vol. 13, no. 1, pp. 87-102, Aug. 2020.

Kasih Purwantini, Danang Danang, & Siti Nasekah. (2020). SISTEM INFORMASI AKUNTANSI PENERIMAAN DAN PENGELUARAN KAS BERBASIS MULTIUSER DI SMK PATI UNUS KARANGAWEN DEMAK. Kompak :Jurnal Ilmiah Komputerisasi Akuntansi , 13(1), 24-36. https://doi.org/10.51903/kompak.v13i1.157

Gunawan Wibisono, Vivi Kumalasari Subroto, & Danang Danang. (2020). ANALISA DAN PERANCANGAN SISTEM APLIKASI PEMBAYARAN ADMINISTRASI MENGGUNAKAN RFID BERBASIS CLIENT SERVER. Kompak :Jurnal Ilmiah Komputerisasi Akuntansi , 13(1), 111-120. https://doi.org/10.51903/kompak.v13i1.201

Budi Raharjo, & Danang Danang. (2020). RANCANG BANGUN PENGELOLAAN SISTEM INFORMASI PERSEDIAAN BAHAN BAKU BERBASIS CLIENT SERVER. JURNAL TEKNOLOGI INFORMASI DAN KOMUNIKASI, 11(1), 78-85. https://doi.org/10.51903/jtikp.v11i1.282

Danang Danang, & Kenny Setiawan. (2021). PENGATURAN BILLING HOTSPOT PADA SISTEM JARINGAN RT/RW NET DENGAN MIKROTIK ROUTER OS. Jurnal Publikasi Teknik Informatika, 1(1), 12-22. https://doi.org/10.55606/jupti.v1i1.94

Eka Satria Wibawa, & Danang Danang. (2021). Pembuatan Video Pembelajaran Daring Di SMK Swadaya Semarang. Jurnal Pengabdian Kepada Masyarakat Indonesia (JPKMI), 1(3), 22–25. https://doi.org/10.55606/jpkmi.v1i3.41

Danang Danang, & Mat Toyib. (2021). ANALISA TROUBLE SHOOTING AIR CONDITIONER NIPPON DENSO PADA UNIT SCANIA P380 MENGGUNAKAN MICROCONTROLER. Jurnal Publikasi Teknik Informatika, 1(1), 34-44. https://doi.org/10.55606/jupti.v1i1.93

Budi Hartono, & Danang Danang. (2021). Sistem Pemesanan dan Pembayaran Menggunakan Teknologi Quick Response Code (QR Code) Berbasis Web pada Kedai Cangkir Gubug . Jurnal Manajemen Informatika & Teknologi, 1(2), 71-91. Retrieved from http://journal.stiestekom.ac.id/index.php/mifortekh/article/view/34

Hartono, B., Danang Danang, & Muh Tofik. (2021). SISTEM INFORMASI ARSIP DIGITAL KARTU CATATAN SISWA BERBASIS WEB. JURNAL TEKNOLOGI INFORMASI DAN KOMUNIKASI, 12(2), 1-11. https://doi.org/10.51903/jtikp.v12i2.281

Nedunchelian, R., R. Muthucumarasamy, and E. Saranathan, “Comparison of Multi Document Summarization Techniques,” International Journal of Computer Applications, 11(3) : 155-160, 2011.

Aditya, CSK.,“Vector Space Model (VSM) dan Pengukuran Jarak pada Information Retrieval (IR)”, [Online] Available at: https://informatikalogi.com/vector-space-model-pengukuran-jarak/ 2016, [Accessed 22 Juni 2017].

Romli, Asep Syamsul M., “Teknik Menulis di Media Online - Jurnalistik Online”, [Online] Available at: http://www.romelteamedia.com/2014/06/teknik-menulis-di-media-online.html, [Accessed 22 Juni 2017].

Downloads

Published

2021-11-01

How to Cite

Arie Atwa Magriyanti. (2021). MAXIMUM MARGINAL RELEVANCE BERBASIS BOOLEAN MODEL PADA PERINGKASAN ARTIKEL BERITA PENDEK. Jurnal Ilmiah Teknik Informatika Dan Komunikasi, 1(3), 77–88. https://doi.org/10.55606/juitik.v1i3.132