Data Mining vs Data Warehousing
Penambangan Data dan Pergudangan Data adalah teknik yang sangat kuat dan populer untuk menganalisis data. Pengguna yang cenderung ke arah statistik menggunakan penambangan data. Mereka menggunakan model statistik untuk mencari pola tersembunyi dalam data. Data Miners tertarik untuk menemukan hubungan yang berguna antara elemen data yang berbeda, yang pada akhirnya menguntungkan bagi bisnis. Namun di sisi lain, para ahli data yang dapat menganalisis dimensi bisnis secara langsung cenderung menggunakan gudang data.
Data Mining juga dikenal sebagai Penemuan Pengetahuan dalam Data (KDD). Seperti disebutkan di atas, ini adalah bidang ilmu komputer, yang berkaitan dengan ekstraksi informasi yang sebelumnya tidak diketahui dan menarik dari data mentah. Karena pertumbuhan data yang eksponensial, terutama di bidang -bidang seperti bisnis, penambangan data telah menjadi alat yang sangat penting untuk mengubah kekayaan besar data ini menjadi intelijen bisnis, karena ekstraksi pola manual telah menjadi mustahil dalam beberapa dekade terakhir. Misalnya, saat ini telah digunakan untuk berbagai aplikasi seperti analisis jejaring sosial, deteksi penipuan dan pemasaran. Data Mining biasanya berkaitan dengan empat tugas berikut: pengelompokan, klasifikasi, regresi, dan asosiasi. Clustering mengidentifikasi kelompok serupa dari data yang tidak terstruktur. Klasifikasi adalah aturan pembelajaran yang dapat diterapkan pada data baru dan biasanya akan mencakup langkah -langkah berikut: preprocessing data, merancang pemodelan, pembelajaran/pemilihan fitur dan evaluasi/validasi. Regresi menemukan fungsi dengan kesalahan minimal untuk memodelkan data. Dan asosiasi sedang mencari hubungan antar variabel. Data Mining biasanya digunakan untuk menjawab pertanyaan seperti produk utama apa yang mungkin membantu mendapatkan keuntungan tinggi tahun depan di Wal-Mart?
Seperti disebutkan di atas, pergudangan data juga digunakan untuk menganalisis data, tetapi dengan berbagai set pengguna dan tujuan yang sedikit berbeda dalam pikiran. Misalnya, ketika datang ke sektor ritel, pengguna pergudangan data lebih peduli dengan jenis pembelian apa yang populer di kalangan pelanggan, sehingga hasil analisis dapat membantu pelanggan dengan meningkatkan pengalaman pelanggan. Tetapi penambang data pertama -tama menduga hipotesis seperti pelanggan mana yang membeli jenis produk tertentu dan menganalisis data untuk menguji hipotesis. Pergudangan data dapat dilakukan oleh pengecer besar yang awalnya menyediakan toko -tokonya dengan ukuran produk yang sama untuk kemudian mengetahui bahwa toko -toko New York menjual inventaris ukuran yang lebih kecil jauh lebih cepat daripada di toko -toko Chicago. Jadi, dengan melihat hasil ini, pengecer dapat menyimpan toko New York dengan ukuran yang lebih kecil dibandingkan dengan toko Chicago.
Jadi, seperti yang dapat Anda lihat dengan jelas, kedua jenis analisis ini tampaknya memiliki sifat yang sama dengan mata telanjang. Keduanya berkaitan tentang peningkatan keuntungan berdasarkan data historis. Tapi tentu saja, ada perbedaan utama. Secara sederhana, penambangan data dan pergudangan data didedikasikan untuk memberikan berbagai jenis analitik, tetapi pasti untuk berbagai jenis pengguna. Dengan kata lain, penambangan data mencari korelasi, Patters untuk mendukung hipotesis statistik. Tapi, pergudangan data menjawab pertanyaan yang relatif lebih luas dan mengiris dan data dadu dari sana dan seterusnya untuk mengenali cara -cara peningkatan di masa depan.