Senin, 28 Januari 2013

Data Mining

Data Mining adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tapi tidak tahu pola apa yang bisa didapatkan.

Teknik Data Mining

Pada dasarnya penggalian data dibedakan menjadi dua fungsionalitas, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsionalitas penggalian data yang sering digunakan:

Data Mart

Data mart adalah subset dari menyimpan data organisasi, biasanya berorientasi pada tujuan tertentu atau data subjek utama, yang dapat didistribusikan untuk mendukung kebutuhan bisnis.  Data mart adalah data analitis toko yang dirancang untuk memfokuskan pada fungsi bisnis yang spesifik untuk komunitas khusus dalam sebuah organisasi. Data mart sering berasal dari himpunan data dalam data warehouse, meskipun dalam metodologi gudang bottom-up data desain data warehouse diciptakan dari persatuan organisasi data mart.

Terminologi

Dalam prakteknya, persyaratan data mart dan data warehouse masing-masing cenderung menyiratkan kehadiran yang lain dalam bentuk tertentu. Namun, kebanyakan penulis menggunakan istilah tampaknya setuju bahwa desain data mart cenderung mulai dari analisis kebutuhan pengguna dan data warehouse cenderung mulai dari analisis data yang sudah ada dan bagaimana ia dapat dikumpulkan sedemikian cara bahwa data nantinya bisa digunakan.

Data Warehouse

Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan. Sedangkan data mining muncul setelah banyak dari pemilik data baik perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama beberapa tahun, misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus dilakukan terhadap tumpukan data tersebut.
Data warehouse didesain untuk kita bisa melakukan query secara cepat. Informasi diturunkan dari data lain, dilakukan rolling up untuk dijadikan ringkasan, dilakukan operasi drilling down untuk mendapatkan informasi lebih detail, atau melihat pola yang menarik atau melihat trend (kecenderungan).

Minggu, 27 Januari 2013

OLAP, MOLAP dan ROLAP

OLAP
OLAP (Online Analytical Processing) adalah sebuah pendekatan secara cepat menyediakan jawaban-jawaban terhadap kueri analitik yang multimensi di dalam alam. OLAP adalah bafian dari kategori yang lebih global dari pemikiran bisnis, yang juga merangkum hubungan antara pelapora dan penggalian data. Aplikasi khusus dari OLAP adalah pelaporan bisnis untuk penjualann, pemasaran, manajemen pelaporan, manajemen proses bisnis (MPB), penganggaran dan peramalan, laporan keuanfan dan bidang-bidang yang serupa. Istilah OLAP merupakan perampingan dari istilah lama database OLTP (Online Transaction Processing). Database yang dikonfigurasikan untuk pelayanan OLAP model data multidimensi, bisa digunakan untuk analisis komplek dan kueri khusus (ad hoc) dengan suatu laju waktu eksekusi.