5 ARTIKEL (JURNAL ATAU PROCEEDING) YANG MEMBAHAS HASIL YANG DIPEROLEH DARI MELAKUKAN DATA MINING

Nama-nama kelompok :
1. Adam Damiri (10119091)
2. Marcellino Danis Putra P (13119534)
3. Yolan Maulana (16119708)
4. Cinka Meliana (11119494)
5. Febby Dewi Oktari (12119358)


Pengembangan Web Service Algoritma Data Mining Menggunakan Metode Rest API




 Type data yang digunakan pada data mining diatas adalah type data nominal tipe data distrik yang tidak mengenal urutan

Atribut
Pada table diatas terdiri dari class,sepal length,sepal width,petal length,dan petal width.

Type atribut
Class yaitu atribut nominal
Sepal length,sepal width,petal length,dan petal width yaitu atribut ordinal


Tabel diatas memiliki 4 dimensi

Preprocessing :
Teknik pengumpulan data yang digunakan dalam penelitian ini yaitu studi literatur dan data sekunder berdasarkan penelitian sebelumnya. Teknik pengumpulan data yang dilakukan untuk menentukan kriteria dengan menggunakan jurnal dan literatur relevan lainnya. Selain itu dalam penelitian ini juga membutuhkan data pendukung yang bersumber dari buku, jurnal, dan literatur lainnya yang relevan dengan penelitian ini. Teknik analisis data yang digunakan dalam penelitian ini adalah analisis kuantitatif. kuantitatif merupakan metode penelitian yang dilandasi pada aliran filsafat positivisme, digunakan untuk meneliti pada populasi atau sampel tertentu, teknik pengambilan sampel data dilakukan secara acak dan menggunakan instrumen penelitian, analisis data bersifat kuantitatif/statistik dengan tujuan untuk menguji hipotesis yang telah ditetapkan.

Task Mining

Berdasarkan tabel di atas dapat diketahui persentase untuk Correctly Classified Instance adalah sebesar 86% sementara persentase untuk Incorrectly Classified Instance adalah sebesar 14%. Di mana dari 150 data bunga Iris, ada sebanyak 129 data bunga iris berhasil diklasifikasikan dengan benar dan sebanyak 21 data penggunaan listrik rumah tangga tidak berhasil diklasifikasikan dengan benar. Task mining yang digunakan pada table di atas adalah classification.


Hasil yang diperoleh
Berdasarkan hasil pengujian dan analisis penelitian tentang web service data mining ini, dapat diambil kesimpulan bahwa sistem web service yang dikembangkan dengan metode Rest API menggunakan algoritma Naive Bayes dalam mengelola data, dimana algoritma Naive Bayes memanfaatkan data latih untuk menghasilkan probabilitas setiap kriteria untuk class yang berbeda, sehingga nilai-nilai probabilitas dari kriteria tersebut dapat dioptimalkan untuk memprediksi data uji berdasarkan proses klasifikasi yang dilakukan oleh metode Naive Bayes itu sendiri. Berdasarkan data bunga Iris yang dijadikan data latih, algoritma Naive Bayes berhasil mengklasifikasikan 129 data dengan akurat dari 150 data yang diuji. Sehingga metode Naive Bayes berhasil memprediksi jenis bunga Iris dengan persentase keakuratan sebesar 86%.

Tools
Untuk memastikan Rest API yang telah dibuat berfungsi dengan baik dan dapat digunakan oleh aplikasi klien, peneliti membuat sebuah aplikasi klien berbasis web yang terhubung dengan Rest API yang telah dibuat sebelumnya untuk memproses sebuah dataset.

Ringkasan :
Pada isi jurnal diatas menggunakan type data nominal yang terdiri dari atribut-atribut yaitu class,sepal length,sepal width,petal length,dan petal width. Tabel diatas memiliki 4 dimensi. Teknik pengumpulan data yang digunakan dalam penelitian ini yaitu studi literatur dan data sekunder berdasarkan penelitian sebelumnya. Dalam penelitian ini juga membutuhkan data pendukung yang bersumber dari buku, jurnal, dan literatur lainnya yang relevan dengan penelitian ini. Teknik analisis data yang digunakan dalam penelitian ini adalah analisis kuantitatif. Task mining yang digunakan pada table di atas adalah classification. hasil pengujian dan analisis penelitian tentang web service data mining ini, dapat diambil kesimpulan bahwa sistem web service yang dikembangkan dengan metode Rest API menggunakan algoritma Naive Bayes dalam mengelola data, dimana algoritma Naive Bayes memanfaatkan data latih untuk menghasilkan probabilitas setiap kriteria untuk class yang berbeda, sehingga nilai-nilai probabilitas dari kriteria tersebut dapat dioptimalkan untuk memprediksi data uji berdasarkan proses klasifikasi yang dilakukan oleh metode Naive Bayes itu sendiri. Untuk memastikan Rest API yang telah dibuat berfungsi dengan baik dan dapat digunakan oleh aplikasi klien, peneliti membuat sebuah aplikasi klien berbasis web yang terhubung dengan Rest API yang telah dibuat sebelumnya untuk memproses sebuah dataset.

https://prosiding.konik.id/index.php/konik/article/view/83


Klasifikasi Menggunakan Algoritma C4.5



 

Tipe data diatas memiliki data berbentuk ordinal, kategoerinya disusun secara tingkatannya 

Memiliki

 

Atribut nya terdiri dari pelanggan , simpanan , asset , pendapatan, resiko kredit

 

Type atribut simpanan,asset,resiko kredit termasuk type nominal

Dan pendapatan termasuk ke dalam type ordinal

 

Dimensi :

Table diatas memiliki 4 dimensi

 

 

 

 

Preprocessing :

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus Knowledge Discovery in Database (KDD). Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak. Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk Knowledge Discovery in Database (KDD), seperti data atau informasi eksternal lainnya yang diperlukan.

 

 

Task mining :

algoritma yang dapat digunakan untuk membuat pohon keputusan (decission tree) adalah algoritma C4.5. Algoritma C4.5 merupakan algoritma yang sangat populer yang digunakan oleh banyak peneliti di dunia, hal ini dijelaskan oleh Xindong Wu dan Vipin Kumar dalam bukunya yang berjudul The Top Ten Algorithms in Data Mining. Algoritma C4.5 merupakan pengembangan dari algoritma ID3 yang di ciptakan oleh J. Rose Quinlan.

 

Hasil

proses data mining hingga menghasilkan sebuah pohon keputusan adalah sebagai berikut : 1. Sumber data, merupakan database yang didalamnya terdapat informasi yang bisa diambil dan dimanfaatkan untuk kepentingan bisnis dan penelitian 2. Proses KDD, merupakan proses yang dilakukan untuk mengambil informasi yang terdapat dalam database, di antara proses tersebut terdapat proses data mining 3. Data mining, data mining merupakan bagian dari proses kdd, apa yang dapat dilakukan dengan data mining

 

tools yang dapat digunakan untuk melakukan klasifikasi dan dalam pembahasan ini kita menggunakan model pohon keputusan  Algoritma yang dapat dilakukan untuk membuat pohon keutusan salah satunya dalah algoritma C4.5


Ringkasan

Secara keseluruhan, proses data mining hingga menghasilkan sebuah pohon keputusan yang dapat memberikan informasi yang diperlukan


http://ejournal.stkip-pgri-sumbar.ac.id/index.php/eDikInformatika/article/view/1465/789

 

DATA MINING DENGAN METODE K-MEANS UNTUK PENGELOMPOKAN MAHASISWA YANG MENGUNJUNGI PERPUSTAKAAN BERDASARKAN DATA KUNJUNGAN DAN IPK



Tipe data tersebut berbentuk ordinal karna data yang di inputkan sesuai dengan tingkatan nilai

 

Atribut

Atribut yang dimiliki  mahasiswa ke, kunjungan, dan ipk

 

Tipe atribut

semuanya ke dalam tipe data int

dimensi

table diatas memiliki 3 dimensi

 

preprocessing

metode K-Means merupakan saalah satu metode data clustering non hierarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster atau kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lainnya (Benri MM dan Herlina LS, 2015).

 

 

 

task mining :

Penelitian ini diharapkan dapat membantu IAIN Bukitinggi khususnya bagian perpustakaan untuk mengambil keputusan dari hasil pengelompokan mahasiswa, sehingga kedepannya ada peningkatan yang diperoleh. Memperoleh informasi tentang hubungan prestasi seorang mahasiswa dengan intensitasnya mengunjungi perpustakaan. Dapat dijadikan referensi untuk penelitian selanjutnya.

 

Hasil

K-Means merupakan saalah satu metode data clustering non hierarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster atau kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lainnya (Benri MM dan Herlina LS, 2015).

 

Tools

Metode yang digunakan adalah metode K-Means, dan untuk uji coba serta penampilan hasil dari penelitian ini, maka penulis akan menggunakan Rapid Miner.

 

 

Ringkasan

Tahap menarik kesimpulan merupakan tahapan terakhir dalam penelitian. Pada tahap ini hasil akhir dari penelitian sudah terbentuk berupa informasi yang dapat digunakan, dari informasi yang didapatkan ini, maka ditarik kesimpulan yang dapat membantu peneliti untuk mengambil keputusan.


http://repository.upiyptk.ac.id/4/1/Jurnal.pdf

Implementasi Data Mining Pada Hasil Penjualan Barang Menggunakan Metode K-Means Clustering



Type data yang digunakan pada data mining pada hasil penjualan barang adalah type data numerik.

Atribut pada tabel diatas adalah stock awal, terjual, stock akhir, C1, C2, dan C3.

Type atribut yag digunakan adalah numerik karena pada data tersebut yang diambil adalah hasil penjualan barang.

Memiliki 6 dimensi.

Preprocessing
Pengumpulan data dilakukan dengan dua cara yaitu wawancara dan observasi. mengambil data sampel penjualan barang dan mengelompokkan kategori barangnya. Penelitian ini ialah penelitian kualitatif dimana penelitian ini diambil berdasarkan data yang sudah ada (data sekunder) berdasarkan observasi

Task data mining yang digunakan adalah segmentation karena ada clustering menggunakan metode unsupervised karena tidak ada satu atributpun yang digunakan untuk memandu proses pembelajaran sehingga data yang dianalisis secara otomatis dengan pengelompokkan data dari data-data yang sudah pernah digunakan.

Hasil dari data penjualan barang yang menggunakan metode K-Means Clustering dan data akan dikelompokkan sesuai dengan nama barang dan cluster tersebut.

Tools yang digunakan adalah Rattle karena sudah ada fitur clustering, opsi pengelompokkan yang tersedia K-Means, Clara, Hierarchical, dan BiCluster.

 

Ringkasan
Pengumpulan data dilakukan dengan dua cara yaitu wawancara dan observasi.
Type data yang digunakan pada data mining pada hasil penjualan barang adalah type data numerik. Atribut yang dimiliki pada data yang digambar tersebut adalah stock awal, terjual, stock akhir, C1, C2, dan C3. Hasil dari data penjualan barang yang menggunakan metode K-Means Clustering dan data akan dikelompokkan sesuai dengan nama barang dan cluster tersebut.

https://proceeding.unpkediri.ac.id/index.php/inotek/article/view/121


Penerapan Data Mining Untuk Memprediksi Prestasi Akademik Mahasiswa Berdasarkan Dosen, Motivasi, Kedisiplinan, Ekonomi, dan Hasil Belajar


Type data yang digunakan kategorial.

Atribut terdapat pada status ekonomi mahasiswa (X1) , disiplin (X2), motivasi (X3), peran dosen (X4) dan hasil belajar masa lalu dan 1 atribut sebagai target atribut (label) yaitu Prestasi Akademik
 
Type atribut pada table diatas adalah ordinal.

Memiliki 2 dimensi.

Preprocessing
Penelitian ini dilaksanakan di STMIK Hang Tuah Pekanbaru. Waktu penelitiandilaksanakan pada mulai bulan Januari 2016.Target penelitian ini adalah mahasiswa STMIK Hang tuah Pekanbaru. Pada penelitian inimenggunakan 2 metode/pendekatan yaitu (1)Metode Pengumpulan Data dan (2) MetodeCRISP-DM (Cross Industry Standard Process for Data Mining) untuk proses dalam Data Mining nya. Untuk mendapatkan data, seorang peneliti dapat melakukan berbagai metode. Data dapat diperoleh melalui kuesioner, wawancara dan dokumentasi. Selain dengan cara diatas juga digunakan metodelain untuk mendukung penelitian yang dilakukan yaitu dengan menggunakan data sekunder.

Task data mining

prediksi prestasi akademik mahasiswa menggunakan metode Data Mining. Oleh karena itu penelitian ini akan menggali data tersebut dengan menggunakan metode Klasifikasi dengan Algoritma C4.5

Tools

CRISP-DM (Cross Industry Standard Process for Data Mining) untuk proses dalam Data Mining nya.

Ringkasan
Type data yang digunakan kategorial. Atribut terdapat pada status ekonomi mahasiswa (X1) , disiplin (X2), motivasi (X3), peran dosen (X4) dan hasil belajar masa lalu dan 1 atribut sebagai target atribut (label) yaitu Prestasi Akademik. Data dapat diperoleh melalui kuesioner, wawancara dan dokumentasi. Selain dengan cara diatas juga digunakan metodelain untuk mendukung penelitian yang dilakukan yaitu dengan menggunakan data sekunder.

http://ejournal.uin-suska.ac.id/index.php/coreit/article/view/2392/pdf




Komentar

Postingan populer dari blog ini

Manusia dan Keadilan

Pengertian Urbanisasi dan Faktor Pendorong Urbanisasi

Manusia dan Penderitaan