Minggu, 29 Maret 2015

Sebelum masuk ke review jurnal tentang data mining, kita harus tahu apa itu data mining. 

Data mining adalah suatu proses yang menggunakan matematika, statistic, dan kecerdasan buatan untuk mendapatkan informasi yang bermanfaat dari sebuah database. Atau datamining dapat diebut juga proses penggalian data yang bersar untuk mendapatkan informasi yang bermanfaat.

Teknik-teknik pada data mining:
1. Klasifikasi
2. Clustering
3. Asosiation
Tahap-tahap data mining
1. Data cleaning
2. Data integration
3. Data selection
4. Data transformation
5. Mining
6. Pattern evaluation
7. Knowledgment information
Secara singkat itulah pengertian dan apa saja yang ada di dalam data mining.

5 Jurnal yang dipilih:
- Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes. Oleh: Mujib Ridwan, Hadi Suryono, dan M Sarosa.
- Perbandingan Partition Around Medoids (PAM) dan K-Means Clustering Untuk Tweets. Oleh: Yudi Wibisono.
- Analisis Kepuasan Konsumen Terhadap Restoran Cepat Saji Melalui Pendekatan Data Mining : Studi Kasus XYZ. Oleh : Vina Mandasari dan Bayu Adhi Tama.
- A Mining Public Health Topics From Twitter. Oleh : Michael J.Paul dan  Mark Dredze.
- Data Mining Techniques For Identifying Student at Risk of Failing A Computer Profiency Test Required For Graduation. 

Jurnal yang direview:
Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes. 
Oleh: Mujib Ridwan, Hadi Suryono, dan M Sarosa.

Pada jurnal ini penulis meneliti kinerja akademik mahasiswa pada tahun kedua, yang tujuannya untuk menentukan mahasiswa lulus tepat waktu atau tidak. Dari penelitian ini juga dapat dibuat sebuah system untuk memandu Mahasiswa tersebut untuk lulus dalam waktu yang tepat dengan nilai yang sudah ada. Yang digunakan dalam penelitian ini adalah data akademik mahasiswa, mahasiswa lama atau yang sudah lulus dapat menjadi data training dan mahasiswa baru atau yang baru semester 4 akan menjadi data target. Yang menjadi class dalam penelitian ini adalah IP, IPK, dan jenis kelamin mahasiswa. Penelitian ini dapat menjadi evaluasi bagi civitas atau pengelola perguruan tinggi. 
Algortima yang digunakan : Naïve bayes Classifier(NBC) 
Naïve Bayes Classifier adalah salah satu algortima pada teknik data mining yang menerapkan teknik bayes dalam klasisfikasi. Teorema Bayes ini menggunakan pendekatan statistic dan probabilistic  dalam pengenalan pola (pattern recognition)

Metode Penelitian:
1. Data
- Data
Data yang akan digunakan sebagai proses mining. Yaitu data berupa data training dan data target. Data training berupa sampel dari data akademik mahasiswa angaktan 2005-2009 yang sudah lulus. Data inimemiliki atribut NIM, jenis kelamin, asal sekolah, jalur masuk, nilai ujian nasilnal, gaji orang tua, IP semester 1 – 4, IPK semester 1 – 4, dan keterangan lulus.
- Data target
Data target yang diambil dari data akademik mahasiswa tahun 2010-2011 yang belum lulus yang memiliki atribut yang sama dengan data training. Setelah proses mining, data ini akan mejadi class berdasarkan table probabistas yang diperoleh dari data training.
- Data riwayat matakuliah
Digunakan untuk evaluasi data target ketika diklasifikasikan lulus tidak tepat waktu. Data ini dianalisis untuk memeberikan rekomendasi dalam proses perkuliahan berikutnya. Data ini memilik atribut NIM, kode matakuliah, dan nilai.

2. Tahap penelitian

Penelitian
- Pengumpulan data
- Pengolahan data
- Implementasi Naïve Baues Classification
- Pengujian dan
- Analisis hasil

Tahapan pada data mining
- Data cleaning
- Integritas data
- Seleksi data
- Transformasi data
- Pembentukan dataset (digunakan untuk data training dan data testing)
Yang selanjutnya adalah desain sistem yang meliputi arsitektur system dan desain basis data.

Pengujian:
Persiapan data, data training dengan dat mahsiswa angkatan 2005 – 2009 yang sudah lulus, dengan jumlah data 100 dengan kelas “Tepat” dan “Tidak”.  Degan algoritma NBC data latih digunakan untuk table probabilitas, dan data target digunakan untuk menguju table probabilitas yang sudah dibentuk.
Percobaan 1 menggunakan data sebanyak 20 dengan presisi 66.66 % dan akurasi 55%
Percobaan 2 menggunakan data sebanyak 40 dengan presisi 55.55 % dan akurasi 55%
Percobaan 3 menggunakan data sebanyak 60 dengan presisi 55.55 % dan akurasi 55%
Percobaan 4 menggunakan data sebanyak 80 dengan presisi 71.42 % dan akurasi 65%
Percobaan 5 menggunakan data sebanyak 100 dengan presisi 83.33 % dan akurasi 70 %

Dari hasil diatas kesimpulannya adalah dengan menggunakan NBC pengujian data training akurasi sebesar 70% dan presisi sebesar 83.33%, data training dapat mempengaruhi hasil pengujian dan hasil mining dapat digunakan untuk mengklasifikasikan kinerja akdemik mahasiswa tingkat 2 





0 komentar :

Posting Komentar