Peluang Teknik Data Mining (Assosiasi) sebagai Tool Ekstraksi Database dalam Rangka Pengambilan Keputusan di Kawasan Konservasi

Kebudayaan masyarakat berkembang demikian pesat dan menjadi sangat kompleks. Kebutuhan akan data dan informasi juga telah menjadi kebutuhan wajib bagi setiap organisasi. Adanya persaingan dan juga kebutuhan untuk mengoptimalkan sumber daya yang dimiliki, mau tidak mau mendorong untuk merancang suatu sistem yang dapat memberikan input bagi pengambilan keputusan yang efektif dan efisien. Di dalam pengelolaan kawasan konservasi, nilai penting data dan informasi di-cover dalam suatu sistem yang dinamakan “Resort Based Management”, dimana peningkatan kapasitas data dilakukan secara intensif hingga pada level tapak. Namun yang menjadi permasalahan berikutnya adalah dengan terkumpulnya data, apakah bisa menjamin bahwa keputusan yang diambil telah sesuai dengan data ? Barangkali analogi yang perlu dibangun tidak sesederhana itu. Data adalah modal dasar untuk merancang suatu sistem yang kompetitif, namun ini tak akan ada artinya jika organisasi tidak mampu menggali informasi di dalamnya.

Nilai Penting Data Mining

Perkembangan kawasan konservasi saat ini ditandai oleh kebutuhan dan juga kepemilikan/keberadaan data dalam skala yang besar dan luas. Data-data yang terkumpul seperti data keanekaragaman hayati, data potensi energi, data pengunjung, data cash flow, data potensi wisata, data penutupan lahan, dan lain sebagainya. Fenomena yang terjadi di banyak organisasi dan industri pada umumnya memiliki begitu banyak data namun tidak ada pengolahan data yang memadai. Faktor penyebabnya adalah kurangnya ruang penyimpanan data yang memadai karena adanya proses pergantian data lama oleh data baru yang tentunya menuntut penyimpanan yang baru juga. Ini terjadi secara terus-menerus seiring berjalannya waktu dan aktivitas yang telah dilakukan.

Semua orang mengetahui bahwa data  merupakan sumber daya yang sangat penting. Namun, data mentah yang berukuran sangat besar dan luas tidak akan berguna karena tidak mungkin dapat diolah tanpa menggunakan alat yang cukup handal.  Setiap orang memahami bahwa kemampuan fisik maupun psikis manusia sangatlah terbatas. Otak manusia hanya mampu mengolah dan mengingat rangkaian kombinasi data dengan baik dalam jumlah yang tidak terlalu besar.

Apabila sejumlah besar data-data telah dikumpulkan. Permasalahan selanjutnya adalah apakah data tersebut telah dimanfaatkan sebagaimana mestinya ? Ataukah organisasi hanya cukup puas dengan menenggelamkan dirinya  dalam data-data sementara di sisi lain kurang pengetahuan tentang data-data tersebut.

Hasil dari keputusan-keputusan penting yang didasarkan pada informasi-informasi yang kaya telah tersimpan di dalam database. Sayangnya para pengambil keputusan kurang bisa mengekstrak pengetahuan tersembunyi di dalam database tersebut tanpa alat yang memadai. Jumlah data pada organisasi akan berlipat ganda setiap 5 tahun sekali, tetapi yang terkelola hanya kurang dari 7 persennya saja (Abhijit Raorane1 & R.V.Kulkarni, 2011).

Mengambil data yang kecil dari data yang besar dengan pertimbangan logika/intusisi semata sehingga dapat diekstrak oleh otak dalam pengambilan keputusan merupakan tindakan yang logis namun kurang tepat. Mengapa demikian ? Apabila itu dilakukan, maka data yang demikian banyak terkumpul menjadi sia-sia. Selain itu, tidak ada yang bisa menghitung  tingkat keakuratan dari data yang dipilih terhadap keseluruhan data yang besar dan luas tersebut. Ditambah dengan adanya fenomena penyimpangan-penyimpangan yang tidak dapat diprediksi oleh data-data yang berukuran kecil itu. Maka pemanfaatan data secara optimal terhadap data yang berukuran besar merupakan pilihan yang bijaksana. Disinilah peran data mining diperlukan untuk mengekstrak data-data berukuran besar tersebut dan memberikan input bagi pengambilan keputusan.

Data mining dapat dilakukan untuk data-data besar yang telah tersusun dalam sebuah sistem database. Basis data atau data base menurut Date (2000) adalah sebuah koleksi dari data yang tahan lama yang digunakan oleh sistem aplikasi dari perusahaan/ organisasi tertentu. Sebuah sistem basis data pada dasarnya adalah komputerisasi sistem penyimpanan catatan, yang tujuan keseluruhannya adalah menyimpan informasi dan menginjinkan pemakai untuk mengambil kembali dan memperbaharui informasi tersebut atas permintaan. Basis data itu sendiri dapat dianggap sebagai jenis lemari arsip elektronik, yaitu sebuah tempat penyimpanan atau wadah untuk koleksi komputerisasi data arsip.

Manfaat basis data akan sangat terlihat pada data-data yang memiliki jumlah/ kuantitas yang sangat besar. Apalagi jika dalam pemanfaatan data tersebut dilakukan oleh banyak orang secara sekaligus, tentu saja sulit dilakukan secara manual (non alat). Dalam hal ini pengelolaan data base yang kecil kurang terasa manfaatnya karena data-data masih bisa ditangani tanpa bantuan sistem database. Justru untuk kapasitas data yang kecil ini, penggunaan database menjadi terasa kurang efisien.

Data mining juga didefinisikan sebagai upaya mencari metode dan pola dalam database yang besar untuk membantu para pengambil keputusan membuat suatu kebijakan tentang apa yang harus dilakukan di masa mendatang. Diharapkan dengan memakai teknik data mining dapat menghasilkan model dengan input seminimal mungkin. Model yang diperoleh dapat berguna untuk memahami hal-hal yang dapat terjadi secara tak terduga dan memberikan analisis yang dapat dimanfaatkan oleh pengguna untuk membuat suatu keputusan yang bersifat strategis dengan didasarkan pada ramalan-ramalan.

Data mining merupakan teknologi baru yang sangat berguna untuk membantu perusahaan asuransi menemukan informasi yang sangat penting dari gudang data mereka. Data mining meramalkan tren dan sifat-sifat perilaku bisnis yang sangat berguna untuk mendukung pengambilan keputusan penting. Analisis yang diotomatisasi yang dilakukan oleh data mining melebihi yang dilakukan oleh sistem pendukung keputusan tradisional yang sudah banyak digunakan.

Data mining dapat menjawab pertanyaan-pertanyaan organisasi yang dengan cara tradisional memerlukan banyak waktu untuk menjawabnya. Disini peran data mining sangat penting terkait isu kecepatan pengolahan disamping daya olah terhadap sekian banyak data yang ada. Data mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi, mencari informasi dan memprediksi apa yang mungkin saja terlupakan oleh para pengambil kebijakan karena terkadang fakta yang terjadi di luar ekspektasi mereka.

Data mining menemukan suatu aturan asosiasi atau hubungan korelasi di dalam data-data yang besar. Seorang yang memahami nilai penting informasi dari sekumpulan data akan lebih memfokuskan sumber daya pada pemahaman aturan asosiasi mining dari pada hanya menyibukkan diri untuk mengorganisasi database. Penemuan hubungan asosiasi di dalam sejumlah besar aktivitas organisasi dapat membantu dalam pengambilan keputusan tentang apa yang harus dilakukan kemudian agar dampak keputusan yang diambil menjadi lebih besar. Contoh sederhana pola hubungan seperti berikut ini : jika pelanggan membeli meja, kemungkinan mereka juga ingin membeli kursi pada saat yang bersamaan. Bentuk keputusannya seperti : menempatkan meja dan kursi dalam jarak dekat untuk mendorong peningkatan penjualan kedua barang tersebut di toko.

Pemanfaatan Data Mining

Pada prinsipnya, data mining dapat dimanfaatkan secara luas untuk menggali informasi dari database kawasan konservasi. Data mining dapat mendeteksi pola-pola hubungan yang terjadi antara satu komponen dengan komponen yang lainnya. Dengan analogi contoh dari Abhijit Raorane1 & R.V.Kulkarni (2011), kita dapat mengambil permisalan penggunaan data mining dalam kehidupan sehari-hari. Dalam pengelolaan wisata alam misalnya, untuk penyederhanaan dari data yang berukuran besar kita membuat perumpamaan data yang bersifat sederhana. Kita memiliki data kategori dari catatan transaksi sebagai masukan untuk analisis. Output dari analisis tersebut adalah aturan asosiasi sebagai pengetahuan baru yang diperoleh dari data.  Contoh kasus data transaksional dari pengelola wisata alam dan jumlah transaksi dalam satu hari dibatasi sebagaimana data di bawah ini. Dengan analisis keranjang belanja, transaksi ID Item dari pengunjung yang membeli lebih dari satu item sebagai berikut :

ID Produk yang dibeli pelanggan lebih dari satu jenis barang
1 Kaos, gantungan kunci, topi, tas
2 Kaos, topi
3 Gantungan kunci, topi
4 Topi, gantungan kunci, tas
5 Gantungan kunci, topi
6 Kaos, gantungan kunci
7 Kaos, tas, topi

Berdasarkan data di atas, Kita memperoleh output aturan asosiasi dengan menggunakan analisis keranjang belanja sebagai berikut :

Orang yang membeli barang ini Juga membeli barang berikut ini Nilai dukungan Nilai kepercayaan
Gantungan kunci Topi 57 % 80 %
Tas Topi 43 % 100 %

Orang-orang yang membeli gantungan kunci dan juga membeli topi memiliki dukungan 57 % dan nilai keyakinan 80%. Sementara orang yang membeli tas juga membeli topi memiliki dukungan 43 % dan nilai keyakinan 100%. Aturan asosiasi akan memiliki bentuk berikut : X → Y. Bentuk ini memiliki makna bahwa orang  yang membeli barang dari set X sering juga membeli item di set Y, misalnya jika X = {kaos, gantungan kunci} dan Y = {topi, tas}, maka  diperoleh kaidah asosiasi yang menunjukkan bahwa orang yang membeli kaos dan gantungan kunci juga membeli topi dan tas.

Dukungan dan nilai keyakinan merupakan dua alat ukur dalam aturan asosiasi. Dukungan adalah frekuensi transaksi untuk memiliki semua item sekaligus pada kedua set X dan Y yang akan dibeli secara bersama-sama. Misalnya dukungan 5% menunjukkan bahwa persentase transaksi semua item di set X dan Y dibeli bersamaan adalah sebesar 5 %. Dalam rumus, dukungan dapat dihitung sebagai probabilitas kedua produk X dan Y yang dianggap satu set. Kita juga dapat melihat dukungan sebagai jumlah kasus aturan asosiasi yang akan memprediksi dengan benar perilaku pengunjung.

Kepercayaan 80% menunjukkan bahwa 80% dari pengunjung yang membeli jenis barang di set X juga membeli jenis barang di set Y. Dalam rumus, kepercayaan dihitung sebagai probabilitas bersyarat untuk mendapatkan set Y dari nilai set X. Probabilitas bersyarat juga dapat dihitung melalui proporsi dukungan.

Pada rumus di atas, notasi confidence X → Y diartikan sebagai frekuensi total keyakinan set X. Ukuran keakuratan kesimpulan yang dibuat senilai dengan jumlah kejadian yang dapat diprediksi secara benar oleh aturan asosiasi dibandingkan semua kejadian/ semua populasi transaksi. Untuk mendapatkannya aturan asosiasi biasanya menerapkan dua kriteria: pertama minimal dukungan dan kedua minimal kepercayaan.

Dengan demikian strategi pengambilan keputusan di masa mendatang sebaiknya mengembangkan produk-produk yang saling berkorelasi tersebut sebagai satu unit/ satu set. Penambahan input pemasaran souvenir di kawasan wisata alam dengan meningkatkan stok gantungan kunci sebaiknya juga diikuti oleh penambahan stok topi. Dimana untuk kedua jenis produk tersebut diasumsikan memiliki nilai dukungan tertinggi. Dalam pemajangannya sebaiknya dilakukan berdekatan, sehingga lebih memudahkan pengunjung wisata untuk dapat melakukan pembelian sekaligus.

Pemanfaatan lain di Bidang Konservasi

Pengetahuan tentang data mining juga dapat dimanfaatkan misalnya untuk merancang layout pembangunan infrastruktur di dalam mendukung optimalisasi pelayanan pengunjung obyek wisata alam. Misalnya saja dari hasil ekstraksi terhadap data perilaku pengunjung yang berukuran besar (database) diperoleh informasi bahwa pengunjung memiliki perilaku untuk menggunakan jasa layanan mushola dan toilet sekaligus, maka kedua infrastruktur ini dibuat dalam satu paket. Lalu diperoleh pula informasi bahwa pengunjung cenderung berperilaku bahwa setelah sholat, pengunjung biasanya mencari tempat peristirahatan dan makan. Maka rencana pengambilan keputusannya sebaiknya adalah membuat tempat peristirahatan dan warung makan sebagai satu paket, dan penempatan posisinya dalam track wisata dibangun setelah masjid dan toilet tersebut. Dengan demikian telah dilakukan pemanfaatan data menggunakan data mining untuk mengoptimalkan konsumsi pengunjung terhadap fasilitas barang dan jasa yang disediakan oleh pengelola.

Demikian juga dalam penempatan obyek-obyek wisata yang ditawarkan, juga mengikuti kaedah perilaku pengunjung berdasarkan data-data, dan bukan semata-mata karena intuisi individu. Perlu dilakukan ekstraksi terhadap data-data yang ada tentang perilaku pengunjung untuk memberi informasi tentang obyek-obyek daya tarik wisata apa yang perlu dibangun berdekatan dan bagaimana sebaiknya urutan-urutan obyek wisata yang ditawarkan. Tentunya untuk urutan ini mempertimbangkan obyek-obyek yang memiliki nilai kepercayaan yang tinggi.

Pengetahuan tentang data mining ini juga bermanfaat untuk meramalkan dampak yang akan terjadi jika suatu layanan dihilangkan. Misalnya saja ada korelasi kuat bahwa pengunjung memanfaatkan mushola dan toilet dalam satu waktu, maka dengan hilangnya toilet maka akan berdampak pada sepinya pengunjung mushola. Dan tidak adanya layanan pada 1 set fasilitas tersebut akan berdampak pada set-set lain yang memiliki nilai kepercayaan/korelasi yang kuat terhadap set yang hilang tersebut. Logika dari contoh ini dapat diaplikasikan pada banyak hal dalam layanan dan perilaku kunjungan wisatawan di kawasan konservasi. Sehingga dengan adanya informasi ini, pengelola dapat memiliki input lebih banyak tentang keputusan apa yang akan diambil.

Data mining dapat pula dimanfaatkan lebih luas untuk optimalisasi layanan perijinan, deteksi dampak, deteksi modus operandi dibalik gangguan-gangguan kawasan, persuratan/ administrasi dan lain sebagainya.

Data Mining Perlu Verifikasi

Sebagaimana teknik-teknik lainnya, hampir setiap metoda memiliki error. Demikian pula dengan data mining, dimana penarikan kesimpulan assosiasi didasarkan pada korelasi statistik. Sehingga apa yang dikemukakan oleh data mining tidak boleh diterima secara bulat-bulat, namun harus diverifikasi kebenarannya. Terkadang akan dijumpai hasil uji yang berada diluar logika dan juga bidang keilmuan, sehingga untuk hasil yang demikian harus dikaji lagi, sebab bisa jadi korelasi yang dihasilkan adalah korelasi semu sehingga tidak pas jika dijadikan dasar pengambilan kesimpulan. Namun, secara umum, penggunaan tool ini akan sangat membantu bagi peningkatan kapasitas pengelolaan data untuk mendukung pengambilan keputusan.

Bahan Bacaan

Abhijit Raorane1 & R.V.Kulkarni2, 2011. Data Mining Techniques: A Source For Consumer Behavior Analysis. International Journal of Database Management Systems ( IJDMS ), Vol.3, No.3, August 2011.

Date, 2000. Pengenalan Sistem Basis Data. PT Indeks Kelompok Gramedia. Jakarta.

http://ishwara.us/problem-bisnis-yang-dapat-diselesaikan-oleh-data-mining/. Diakses 02-04-2012.

Mohammadighavam, Rajabpour and Naserasadi, 2011. A Survey on Data Mining Approaches. International Journal of Computer Applications (0975 – 8887) Volume 36– No.6, December 2011.

Reema Patel, Amit Thakkar, Amit Ganatra, 2012. A Survey and Comparative Analysis of Data Mining Techniques for Network Intrusion Detection Systems. International Journal of Soft Computing and Engineering (IJSCE). ISSN: 2231-2307, Volume-2, Issue-1, March 2012.

Sandy Kurniawan, Taufiq Hidayat, 2007. Penerapan Data Mining Dengan Metode Interpolasi Untuk Memprediksi Minat Konsumen Asuransi (Studi Kasus Asuransi Metlife). Media Informatika, Vol. 5, No. 2, Desember 2007, 113-128. ISSN: 0854-4743.

Artikel Terkait:
Baca Juga artikel lainnya:

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s