TUGAS DATA MINING: JOURNAL REVIEW (2)

Haii sobat Rizal Design, senang bisa menyapa teman-teman semua yang dengan setia menunggu postingan terbaru pada blog saya ini hehe. Pada postingan ini saya akan kembali mereview sebuah jurnal sebagai salah satu tugas untuk Mata Kuliah Data Mining 7G.

Kali ini saya akan mereview sebuah jurnal dengan judul "Text Classification on Islamic Jurisprudence using Machine Learning Techniques". Jurnal ini merupakan hasil penelitian dari K Jamal, R Kurniawan, A S Batubara, M Z A Nazri, F Lestari dan P Papilo.

Pada jurnal ini, penelitian dilakukan dengan menggunakan metode-metode dari machine learning. Dimana machine learning ini adalah bagian dari Kecerdasan Buatan yang dapat dimanfaatkan untuk membantu manusia dalam membuat sebuah keputusan. Pada machine learning juga dikenal sebuah istilah yaitu klasifikasi. Klasifikasi pada machine learning ini dapat berpikir lebih cepat daripada manusia dan dapat melakukan banyak tugas dalam waktu bersamaan atau biasa disebut multi-task. Secara spesifik, pada penelitian ini dilakukan sebuah klasifikasi teks meggunakan algoritma Bayesian Network dan Naïve Bayes, dimana algoritma ini memiliki kelebihan lebih akurat, cepat dan kuat.

Untuk tahapan atau metode dari klasifikasi teks itu sendiri terbagi menjadi 3:

  1. Text Pre-Processing, pada tahapan ini data-data yang ada di filter atau dibersihkan salah satunya seperti mengkonversi atribut data tersebut sesuai dengan yang dibutuhkan.
  2. Classification Model, pada tahapan ini algoritma atau model yang digunakan adalah Bayesian Network dan Naïve Bayes.
  3. Testing and Evaluation, parameter yang digunakan untuk menguji outputnya adalah akurasi,RMSE, waktu yang digunakan serta matriksnya.
Setelah pengujian dengan dua algoritma yang digunakan tadi selesai dilakukan, maka dapat diambil kesimpulan bahwa masing-masing algoritma memiliki kelebihannya sendiri. Naïve Bayes memiliki akurasi yang lebih tinggi dibandingkan dengan Bayesian Network. Sedangkan Bayesian Network lebih unggu dari waktu yang digunakan, algoritma ini lebih cepat untuk digunakan dalam klasifikasi. Sehingga kedepannya, penelitian ini akan dikembangkan lagi menggunakan beberapa metode lainnya seperti Naïve Bayes Multinomial, Naïve Bayes Multinomial Text, Artificial Neural Network, SVM, dan stemming.

Nah, itulah sedikit ulasan saya untuk Tugas Data Mining: Journal Review (2). Semoga ulasan saya ini bermanfaat untuk teman-teman pembaca semua. Terimakasih dan sampai jumpa di postingan saya berikutnya.



 

Related Posts:

Tugas Data Mining: Journal Review

Haii sobat Rizal Design, setelah sekian lama tidak pernah menulis di blog ini, saya kembali lagi yeay hehe. Pada postingan ini saya akan mereview sebuah jurnal sebagai salah satu tugas untuk Mata Kuliah Data Mining 7G. 


Kali ini saya akan mereview sebuah jurnal dengan judul "Automatic Rule Generator via FP-Growth for Eye Diseases Diagnosis". Jurnal ini dapat teman-teman download dengan mengklik link ini pdf file.

Pada penelitian algoritma yang digunakan adalah algoritma FP-Growth (Frequent Pattern Growth). Algoritma FP-Growth merupakan algortima yang dapat digunakan untuk memperbaiki kekurangan yang terdapat pada algoritma apriori. Pada algoritma FP-Growth untuk mendapatkan frequent itemsets nya menggunakan konsep pembangunan tree, tidak seperti pada algoritma Apriori yang memerlukan generate candidate. Dengan kata lain, fitur utama dari algoritma FP-Growth adalah FP-Tree yang digunakan sebagai stuktur datanya. Data yang digunakan dalam penelitian ini merupakan data yang di ambil dari Rumah Sakit Sumatera Eye Center (SMEC) di Pekanbaru, Riau, Indonesia.

Didalam algoritma FP-Growth, terdapat 4 langkah utama yang digunakan untuk merancang algoritma ini.

  1. Selection, pada tahapan ini dilakukan sebuah pemilihan atribut dan menghapus atribut yang tidak diperlukan.
  2. Pre-processing, pada tahapan ini dilakukan penghapusan terhadap data-data yang duplicate atau ganda dan tidak lengkap. Pada penelitian ini teknik yang digunakan disebut Missing Completely at Random (MCAR).
  3. Data Transformation, pada tahapan ini data yang ada dilakukan modifikasi. Modifikasi yang dimaksud disini adalah seperti melakukan sebuah konversi terhadap tipe data yang numerik menjadi tipe data binominal.
  4. Experiment to get rules based on the FP-Growth algorithm, pada tahapan terakhir ini akan dilakukan penerapan algoritma FP-Growth.
Setelah dilakukannya penerapan algoritma FP-Growth, dapat kita lihat hasil yang didapat pada tabel dibawah ini:

Dari tabel diatas dapat kita lihat bahwa penelitian ini menggunakan minimum support 3%, 10%, dan 20%. Sementara itu minimum confidence yang digunakan adalah 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, dan 100%. Ketika minimum support yang digunakan semakin tinggi, maka pola yang didapat maka akan semakin rendah.

Dari hasil tes yang dilakukan, dari 9 jenis penyakit mata yang terdapat pada data, hanya 2 penyakit mata yang memenuhi persyaratan yaitu penyakit Presbyopia dengan 225 kasus dan Conjunctivitis 167 kasus, dengan rata-rata umur penderitanya antara 31-59 tahun. Terakhir, pada penlitian ini penggunaan algoritma FP-Growth dikategorikan baik, karena berhasil mendapat akurasi sebesar 88%. 


Nah, itulah sedikit ulasan saya untuk Tugas Data Mining: Journal Review. Semoga ulasan saya ini bermanfaat untuk teman-teman pembaca semua. Terimakasih dan sampai jumpa di postingan saya berikutnya.

 

        

Related Posts: