Newest Post
// Posted by :DIANSYAH19
// On :Selasa, 10 Januari 2017
Perkembangan
yang pesat di bidang pengumpulan data dan teknologi penyimpanan di berbagai
bidang, menghasilkan basis data yang terlampau besar. Namun, data yang
dikumpulkan jarang dilihat lagi, karena terlalu panjang, membosankan, dan tidak
menarik. Seringkali, keputusan -yang katanya berdasarkan data- dibuat tidak
lagi berdasarkan data, melainkan dari intuisi para pembuat keputusan. Sehingga,
lahirlah cabang ilmu penggalian data ini.
Definisi
Data
Mining (Penggalian data) adalah ekstraksi pola yang menarik dari data dalam
jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele,
implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah
mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat
kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama
alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge
discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan
intelegensia bisnis.
Proses Pencarian Pola
Penggalian
data adalah salah satu bagian dari proses pencarian pola. Berikut ini urutan
proses pencarian pola:
1.
Pembersihan Data: yaitu menghapus data
pengganggu (noise) dan mengisi data yang hilang.
2.
Integrasi Data: yaitu menggabungkan berbagai
sumber data.
3.
Pemilihan Data: yaitu memilih data yang
relevan.
4.
Transformasi Data: yaitu mentransformasi data
ke dalam format untuk diproses dalam penggalian data.
5.
Penggalian Data: yaitu menerapkan metode
cerdas untuk ekstraksi pola.
6.
Evaluasi pola: yaitu mengenali pola-pola yang
menarik saja.
7.
Penyajian pola: yaitu memvisualisasi pola ke
pengguna.
Data
mining adalah kegiatan mengekstraksi atau menambang pengetahuan dari data yang
berukuran/berjumlah besar, informasi inilah yang nantinya sangat berguna untuk
pengembangan. Dimana langkah-langkah untuk melakukan data mining adalah sebagai
berikut :
–
Data cleaning (untuk menghilangkan noise data
yang tidak konsisten) Data integration (di mana sumber data yang terpecah dapat
disatukan)
–
Data selection (di mana data yang relevan
dengan tugas analisis dikembalikan ke dalam database)
–
Data transformation (di mana data berubah atau
bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa
atau operasi agresi)
–
Data mining (proses esensial di mana metode
yang intelejen digunakan untuk mengekstrak pola data)
–
Pattern evolution (untuk mengidentifikasi pola
yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa
tindakan yang menarik)
–
Knowledge presentation (di mana gambaran
teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang
telah ditambang kpada user).
Arsitektur Data Mining
Arsitektur
dari data mining yang khas memiliki beberapa komponen utama yaitu :
–
Database, data warehouse, atau tempat
penyimpanan informasi lainnya.
–
Server database atau data warehouse.
–
Knowledge base
–
Data mining engine.
–
Pattern evolution module.
–
Graphical user interface.
Ada
beberapa jenis data dalam data mining yaitu :
–
Relation Database : Sebuah sistem database,
atau disebut juga database management system (DBMS), mengandung sekumpulan data
yang saling berhubungan, dikenal sebagai sebuah database, dan satu set program
perangkat lunak untuk mengatur dan mengakses data tersebut.
–
Data Warehouse : Sebuah data warehouse
merupakan sebuah ruang penyimpaan informasi yang terkumpul dari beraneka macam
sumber, disimpan dalam skema yang menyatu, dan biasanya terletak pada sebuah
site.
Implementasi (Penerapan)
Dalam
bidang apasaja data mining dapat diterapkan? Berikut beberapa contoh bidang
penerapan data mining:
1.
Analisa pasar dan manajemen.
Solusi
yang dapat diselesaikan dengan data mining, diantaranya: Menembak target pasar,
Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil
Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer,
Informasi Summary.
2.
Analisa Perusahaan dan Manajemen resiko.
Solusi
yang dapat diselesaikan dengan data mining, diantaranya: Perencanaan keuangan
dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan
(Competition).
3.
Telekomunikasi.
Sebuah
perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan
transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara
manual.
4.
Keuangan.
Financial
Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data
mining untuk me-nambang trilyunan dari berbagai subyek seperti property,
rekening bank dan transaksi keuangan lainnya untuk mendeteksi
transaksi-transaksi keuangan yang mencurigakan (seperti money laundry) .
5.
Asuransi.
Australian
Health Insurance Commision menggunakan data mining untuk mengidentifikasi
layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh
peserta asuransi .
6.
Olahraga.
IBM
Advanced Scout menggunakan data mining untuk menganalisis statistik permainan
NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan
bersaing (competitive advantage) untuk tim New York Knicks dan Miami Heat.
Kelebihan dan Kekurangan
Kelebihan
Data Mining :
-
Kemampuan dalam mengolah data dalam jumlah
yang besar.
-
Pencarian Data secara otomatis.
Kekurangan
Data Mining :
-
Kendala Database ( Garbage in garbage out ).
-
Tidak bisa melakukan analisa sendiri.
Kesimpulan
Data
Mining merupakan suatu kelas aplikasi database yang berfungsi melakukan
pencarian pola-pola tersembunyi didalam suatu kumpulan data, juga sebagai
rangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa
pengetahuan yang selama ini tidak diketahui secara manual. Data mining sendiri
memiliki 2 jenis yaitu Relation Database dan Data Warehouse.
Sumber :
https://id.wikipedia.org/wiki/Penggalian_data
http://masnajumiyati.blogspot.co.id/2012/03/contoh-kasus-data-mining_10.html
https://andyku.wordpress.com/2008/11/21/konsep-data-mining/