Data Mining vs OLAP
Baik penambangan data dan OLAP adalah dua dari teknologi Common Business Intelligence (BI). Intelijen Bisnis Mengacu pada Metode Berbasis Komputer untuk Mengidentifikasi dan Mengekstraksi Informasi Berguna dari Data Bisnis. Data Mining adalah bidang ilmu komputer yang, berurusan dengan mengekstraksi pola menarik dari set data yang besar. Ini menggabungkan banyak metode dari kecerdasan buatan, statistik dan manajemen basis data. OLAP (pemrosesan analitik online) seperti namanya adalah kompilasi cara untuk menanyakan database multi-dimensi.
Data Mining juga dikenal sebagai Penemuan Pengetahuan dalam Data (KDD). Seperti disebutkan di atas, ini adalah bidang ilmu komputer, yang berkaitan dengan ekstraksi informasi yang sebelumnya tidak diketahui dan menarik dari data mentah. Karena pertumbuhan data yang eksponensial, terutama di bidang -bidang seperti bisnis, penambangan data telah menjadi alat yang sangat penting untuk mengubah kekayaan besar data ini menjadi intelijen bisnis, karena ekstraksi pola manual telah menjadi mustahil dalam beberapa dekade terakhir. Misalnya, saat ini telah digunakan untuk berbagai aplikasi seperti analisis jejaring sosial, deteksi penipuan dan pemasaran. Data Mining biasanya berkaitan dengan empat tugas berikut: pengelompokan, klasifikasi, regresi, dan asosiasi. Clustering mengidentifikasi kelompok serupa dari data yang tidak terstruktur. Klasifikasi adalah aturan pembelajaran yang dapat diterapkan pada data baru dan biasanya akan mencakup langkah -langkah berikut: preprocessing data, merancang pemodelan, pembelajaran/pemilihan fitur dan evaluasi/validasi. Regresi menemukan fungsi dengan kesalahan minimal untuk memodelkan data. Dan asosiasi sedang mencari hubungan antar variabel. Data Mining biasanya digunakan untuk menjawab pertanyaan seperti produk utama apa yang mungkin membantu mendapatkan keuntungan tinggi tahun depan di Wal-Mart.
OLAP adalah kelas sistem, yang memberikan jawaban untuk pertanyaan multi-dimensi. Biasanya OLAP digunakan untuk pemasaran, penganggaran, peramalan dan aplikasi serupa. Tak perlu dikatakan bahwa database yang digunakan untuk OLAP dikonfigurasi untuk kueri kompleks dan ad-hoc dengan kinerja cepat dalam pikiran. Biasanya matriks digunakan untuk menampilkan output OLAP. Baris dan kolom dibentuk oleh dimensi kueri. Mereka sering menggunakan metode agregasi pada beberapa tabel untuk mendapatkan ringkasan. Misalnya, ini dapat digunakan untuk mencari tahu tentang penjualan tahun ini di Wal-Mart dibandingkan tahun lalu? Apa prediksi penjualan di kuartal berikutnya? Apa yang bisa dikatakan tentang tren dengan melihat persentase perubahan?
Meskipun jelas bahwa penambangan data dan OLAP serupa karena mereka beroperasi pada data untuk mendapatkan kecerdasan, perbedaan utama berasal dari bagaimana mereka beroperasi pada data. Alat OLAP menyediakan analisis data multidimensi dan mereka memberikan ringkasan data tetapi secara kontras, penambangan data berfokus pada rasio, pola dan pengaruh dalam set data. Itu adalah kesepakatan OLAP dengan agregasi, yang bermuara pada pengoperasian data melalui "penambahan" tetapi penambangan data sesuai dengan "divisi". Perbedaan penting lainnya adalah bahwa sementara alat penambangan data memodelkan data dan mengembalikan aturan yang dapat ditindaklanjuti, OLAP akan melakukan perbandingan dan teknik kontras di sepanjang dimensi bisnis secara real time.