Minggu, 11 Oktober 2020

Soal Data Mining Teknik Penambangan Data

  1. Cari informasi mengenai suatu penerapan data mining ya ng telah dikemas menjadi produk perangkat lunak.Uraikan penjelasan mengenai data mining task dari produk tersebut.
  2. Cari informasi mengenai perangkat lunak ya ng merupakan tools untuk melakukan data mining. Uraikan penjelasa n mengena i data mining task yang didukung oleh tools tersebut !

Jawaban :

  1. Bagian DC Indomarco akan melakukan rekap data penjualan, langkah pertama yang dilakukan yaitu bagian DC akan mendata indomaret yang tersebar di wilayah sumatera selatan, bagian DC akan memasukkan data penjualan yang dijual ke indomaret tujuan yang telah ditentukan sesuai dengan pesanan mereka masing-masing. Selanjutnya data tersebut akan diolah menggunakan simulasi data mining dengan menggunakan program PHP, hasil akhir yang didapatkan adalah pola penjualan yang terjadi, jenis kategori makan atau minuman manakah yang paling banyak berdasarkan jumlah indomaret yang ada. Penerapan Data Mining dengan menggunakan aplikasi yang dibangun dapat membantu PT. Indomarco sebagai gambaran bagi pengambilan keputusan perusahaan dalam rangka mendapatkan pola penjualan produk.
  2. Rapid Miner adalah salah satu software untuk melakukan data mining. Dengan software ini, kamu dapat melakukan text mining, yaitu menganalisis teks, mengekstrak pola, dan mengombinasikannya dengan metode statistika, database, dan kecerdasan buatan. Selain itu, Rapid Miner juga dimanfaatkan untuk memahami deep learning, machine learning, dan analisis prediktif. Alat ini bisa diaplikasikan untuk kepentingan bisnis, komersial, pelatihan, pendidikan, riset, dan sebagainya. Prosedur data mining yang dilakukan oleh Rapid Miner adalah ETL (extraction, transformation, loading), data preprocessing, visualization, modelling, dan evaluation. Proses ini digambarkan dengan XML, dibuat dengan GUI (graphic user interface), dan menggunakan bahasa pemograman Java.

2.  Jelaskan dengan kalimat sendiri apa yang dimaksud dengan data mining?

     Sebut kan sudut pandang multidimensi dari data mining !

Jawaban :

Data mining adalah suatu proses penambangan informasi penting dari suatu data. Informasi penting ini didapat dari suatu proses yang amat rumit seperti menggunakan artificial intelligence, teknik statistik, ilmu matematika, machine learning, dan lain sebagainya. Teknik-teknik rumit tersebut nantinya akan mengidentifikasi dan mengekstraksi informasi yang bermanfaat dari suatu database besar.

Database yang memodelkan data sebagai fakta, dimensi,dan numerik untuk menganalisis data dalam jumlah besar, tujuannya untuk mengambil keputusan.contohnya adalah InterSystems Cathe, ContourCube, dan Cognoa PowerPlay.


3.

 

 

 

 

 

 

Jawaban

1.       Perbedaan Data,Informasi dan pengetahuan adalah
  • Data: Data adalah catatan atas kumpulan fakta. Data merupakan bentuk jamak dari datum, berasal dari bahasa Latin yang berarti "sesuatu yang diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya.
  • Informasi: Informasi adalah pesan (ucapan atau ekspresi) atau kumpulan pesan yang terdiri dari order sekuens dari simbol, atau makna yang dapat ditafsirkan dari pesan atau kumpulan pesan. Informasi dapat direkam atau ditransmisikan. Hal ini dapat dicatat sebagai tanda-tanda, atau sebagai sinyal berdasarkan gelombang.
  • Pengetahun: Pengetahuan adalah informasi atau maklumat yang diketahui atau disadari oleh seseorang. Pengetahuan termasuk, tetapi tidak dibatasi pada deskripsi, hipotesis, konsep, teori, prinsip dan prosedur yang secara Probabilitas Bayesian adalah benar atau berguna.
2.Data mining adalah suatu proses penambangan informasi penting dari suatu data. Informasi penting ini didapat dari suatu proses yang amat rumit seperti menggunakan artificial intelligence, teknik statistik, ilmu matematika, machine learning, dan lain sebagainya.3.       Deskripsi

3. Deskripsi bertujuan untuk mengidentifikasi pola yang muncul secara berulang pada suatu data dan mengubah pola tersebut menjadi aturan dan kriteria yang dapat mudah dimengerti oleh para ahli pada domain aplikasinya.  

  • Prediksi memiliki kemiripan dengan klasifikasi, akan tetapi data diklasifikasikan berdasarkan perilaku atau nilai yang diperkirakan pada masa yang akan datang.
  • Estimasi hampir sama dengan prediksi, kecuali variabel target estimasi lebih ke arah numerik dari pada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
  • Klasifikasi adalah proses menemukan sebuah model atau fungsi yang mendeskripsikan dan membedakan data ke dalam kelas-kelas.
  • Clustering adalah pengelompokan data tanpa berdasarkan kelas data tertentu ke dalam kelas objek yang sama.
  • Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja (market basket analisys).
4.       Data Mining di Berbagai Bidang
  • Kesehatan Data mining memiliki potensi besar untuk memperbaiki sistem kesehatan. Menggunakan data dan analisis untuk mengidentifikasi praktik terbaik yang meningkatkan perawatan dan mengurangi biaya.
  • Analisis pasar adalah teknik pemodelan berdasarkan teori bahwa jika seorang membeli kelompok item tertentu, maka cenderung membeli kelompok item lainnya.
  • Ada bidang baru yang muncul, disebut Educational Data Mining, berkaitan dengan metode pengembangan yang menemukan pengetahuan dari data yang berasal dari lingkungan pendidikan. dan digunakan untuk mengembangkan teknik mengajar mereka.
  • Pengetahuan adalah aset terbaik yang dimiliki perusahaan manufaktur. Alat data mining bisa sangat berguna untuk menemukan pola dalam proses manufaktur yang kompleks.
5.       Dari data di atas bisa di simpulakan bahwa pengambilan keputusan ke lulusan tepat waktu berdasarkan nilain rata rata mata pelajaran tersebut.

 


EmoticonEmoticon