Lompat ke konten Lompat ke sidebar Lompat ke footer

Data Mining : Pengertian, Tujuan, Fungsi, Metode dan Contohnya

Dalam dunia teknologi informasi, tentunya kita perlu suatu proses pengumpulan informasi untuk mendapatkan akumulasi informasi yang baik dan benar. Salah satu proses pengumpulan informasi adalah data mining.

Nah, oleh karena itu yuk kita pahami tentang data mining. Apa sih data mining itu? Apa saja pengertian, tujuan, fungsi dan sebagainya? Yuk kita simak penjelasan sebagai berikut.

Pengertian Data Mining

Data mining merupakan sebuah proses pengumpulan informasi penting dari sebuah data yang besar. Pengumpulan informasi penting tersebut dilakukan melalui beberapa proses yang meliputi metode statistika, matematikan maupun teknologi artificial intelligence. Secara lebih khusus, definisi data mining yaitu sebuah alat serta aplikasi yang memakai analisis statistik pada data dan menyaring serta menyimpan semuda data tersebut.

Data mining sendiri dapat menggambarkan suatu pengumpulan beberapa teknik yang bertujuan agar menemukan pola-pola yang belum diketahui pada data yang terkumpul. Melalui data inilah para pengguna dapat menemukan pengetahuan berupa database yang semula tidak mungkin bisa diketahui. Selain itu, pengumpulan data tersebut juga menjadi bagian dari Knowledge Discovery in Database (KDD) yang terdiri atas beberapa tahapan, diantaranya pemilihan data, pra pengolahan, tahap transformasi, penerapan serta evaluasi hasil. Secara umum KDD sering dikenal dengan istilah pangkalan data.

Istilah lain yang sering digunakan diantaranya knowledge discovery (mining) in databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, dan business intelligence.

Teknik data mining digunakan untuk memeriksa basis data berukuran besar sebagai cara untuk menemukan pola yang baru dan berguna. Tidak semua pekerjaan pencarian informasi dinyatakan sebagai data mining.

Tujuan Data Mining

Data mining bertujuan sebagai berikut.
  1. Explanatory adalah Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick up meningkat di colorado.
  2. Confirmatory Untuk mempertegas hipotesis, seperti halnya 2 kali pendapatan keluarga lebih suka di pakai untuk membeli peralatan keluarga, di bandingkan dengan satu kali pendapatan keluarga.
  3. Exploratory Menganalisis data untuk hubungan yang baru yang tidak di harapkan, seperti halnya pola apa yang cocok untuk kasus penggelapan kartu kredit.

Fungsi Data Mining

Inilah fungsi-fungsi dari data mining, yakni sebagai berikut.
  1. Descriptive. Descriptive merupakan suatu fungsi yang bertujuan memahami lebih jauh mengenai data yang diamati sehingga dapat diketahui perilaku dari sebuah data.
  2. Predictive. Fungsi ini adalah sebuah fungsi yang menjelaskan suatu proses dalam menemukan pola tertentu dari sebuah data. Pola-pola yang digunakan diketahui dari beragam variabel yang terdapat pada data.
  3. Classification. Fungsi ini bertujuan untuk menyimpulkan beberapa definisi karakteristik dari sebuah grup. Misalnya, pelanggan perusahaan yang sudah berpindah karena tersaingin oleh perusahaan lain.
  4. Clustering. Clustering adalah identifikasi kelompok dari produk-produk atau barang-barang yang memiliki karakteristik khusus.
  5. Association. Association merupakan identifikasi hubungan dari kejadian-kejadian yang sudah terjadi di suatu waktu.
  6. Sequencing. Sequencing sebetulnya hampir sama dengan association tetapi untuk sequencing berfungsi untuk identifikasi hubungan-hubunga berbeda di sebuah periode waktu tertentu. Contohnya, para pelanggan yang berkunjung di supermarket secara berulang.
  7. Forecasting. Fungsi ini bertujuan untuk memperkirakan nilai di suatu masa di masa mendatang sesuai dengan pola-pola dengan kumpula data dalam jumlah besar. Contohnya, peralaman permintaan pasar.

Metode Data Mining

Inilah beberapa metode dalam data mining, yakni sebagai berikut.
  1. Analisa Masalah. Data sumber yang digunakan harus dapat ditaksir untuk dilihat sudah memenuhi kriteria atau belum. Kualitas kelimpahan data merupakan faktor yang utama dalam memutuskan sebuah data cocok serta tersedia sebagai tambahan. Melalui pengumpulan data hasil yang diharapkan dilakukan secara hati-hati sehingga dapat dimengerti dan membawa informasi untuk diekstrak.
  2. Ekstrak dan Membersihkan Data. Data untuk pertama kalinya diekstrak dari aslinya yang berupa OLTP basis data, Microsoft Acces Database, text file serta dari spreadsheet. Kemudian data diletakkan pada sebuah warehouse yang memiliki struktur sesuai data model secara khas. Data Transformation Service dipergunakan dalam mengesktrak serta membersihkan data dari yang tidak kompatibel maupun tidak konsisten.
  3. Validitas Data. Data yang sudah diekstrak serta dibersihkan maka akan membantu Anda menelusuri model yang sudah Anda ciptakan sehingga dapat dipastikan semua data yang ada merupakan data terkini dan tetap.
  4. Membuat dan Melatih Model. Saat algoritma diterapkan untuk model dan struktur yang sudah dibangun, maka Anda bisa melihat data yang sudah dibangun untuk memastikan data tersebut menyerupai fakta dalam data sumber.
  5. Query Data dari Model Data Mining. Saat model yang sudah cocok diciptakan serta dibangun, maka data yang sudah dibuat dapat mendukung keputusan. Hal tersebut biasanya akan melibatkan penulisan front end query pada aplikasi basis data.
  6. Evaluasi Validitas. Sesudah model data mining berhasil dikumpulkan, dalam beberapa waktu karakteristik data awal seperti validitas dan granularitas kemungkinan akan berubah. Sebab model data mining bisa terus mengalami perubahan mengikuti perkembangan waktu.

Contoh Penerapan Data Mining

  1. Analisa pasar dan manajemen. Solusi yang dapat diselesaikan dengan data mining, diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.
  2. Analisa Perusahaan dan Manajemen resiko. Solusi yang dapat diselesaikan dengan data mining, diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan (Competition).
  3. Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual.
  4. Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry).
  5. Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa.