Senin, 02 April 2018

Tugas Data Mining

PENERAPAN DATA MINING UNTUK MEMPREDIKSI KRITERIA NASABAH KREDIT

Angga Ginanjar Mabrur[1], Riani Lubis[2]

1,2Program Studi Teknik Informatika 
Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia
Jl. Dipati Ukur No. 112-116 Bandung 
Email : e.ngga@yahoo.com[1],riani_lubis@yahoo.com[2]








ABSTRAK


Salah satu tugas dari bidang marketing perbankan adalah melakukan analisis data nasabahnya untuk mengetahui nasabah-nasabah yang berpotensi melakukan kredit. Pada umumnya, metode yang digunakan untuk menganalisis data nasabah adalah dengan cara mengklasifikasikan semua nasabah yang telah melunasi angsuran kreditnya ke dalam target pemasaran, sehingga metode ini menyebabkan tingginya biaya operasional marketing. Oleh karena itu, penelitian ini dilakukan untuk membantu menyelesaikan permasalahan tersebut dengan merancang sebuah aplikasi data mining yang berfungsi untuk memprediksi kriteria nasabah kredit yang berpotensi melakukan peminjaman (kredit) terhadap bank. Bagian Dana Bank XY yang berlokasi di Kabupaten Bandung merupakan tempat yang dipilih oleh peneliti sebagai studi kasus, dengan asumsi Bagian
Dana Bank XY tersebut telah mengalami permasalahan yang sama seperti yang telah dijelaskan di atas.
Teknik data mining yang diterapkan pada aplikasi yang dibangun adalah klasifikasi sedangkan metode klasifikasi yang digunakan adalah Decision Tree (pohon keputusan). Algoritma yang dipakai sebagai algoritma pembentuk pohon keputusannya adalah Algoritma C4.5. Adapun data yang di proses dalam penelitian ini adalah data angsuran nasabah kredit Bank XY pada bulan Juni 2009 dalam format Microsoft Excel.
Hasil penelitian ini adalah sebuah aplikasi yang dapat memudahkan Bagian Dana Bank XY dalam memperoleh target pemasaran kredit di masa mendatang. 

Kata Kunci : Data mining, Marketing, Prediksi, Decission Tree, Algoritma C4.5.

1.    PENDAHULUAN


Tugas Bagian Dana Bank XY selama ini adalah mencari nasabah dan/atau menghimpun dana masyarakat berupa kredit, dana tabungan, deposito, simpanan, dan pinjaman lainnya. Metode yang digunakan untuk menentukan target pasar selama ini adalah mengklasifikasikan semua nasabah yang telah melunasi angsuran kreditnya ke dalam target pemasaran, padahal belum tentu semua nasabah tersebut akan tertarik melakukan peminjaman kredit kembali.
Oleh karena itu, untuk meningkatkan loyalitas nasabah bank tersebut, maka bagian ini dituntut untuk dapat mengambil keputusan yang tepat dalam menentukan strategi pemasaran, baik produk maupun layanan jasa perbankan yang akan ditawarkan kepada nasabah khususnya dalam masalah perkreditan. Hal ini dapat direalisasikan jika diperoleh informasi yang cukup untuk membantu proses pengambilan keputusan di bidang marketing, salah satunya adalah dengan melakukan peramalan atau memprediksi kriteria nasabah untuk kepentingan target pemasaran.
Data mining dapat digunakan oleh marketer untuk menganalisis pasar sehingga seorang marketer dapat memahami pasar yang sudah ada ataupun menemukan peluang-peluang yang baru untuk meningkatkan keuntungan termasuk memprediksi kriteria target pasar. Oleh karena itu, penelitian ini fokus pada pemanfaatan data mining untuk memprediksi kriteria nasabah kredit, sehingga dapat diketahui apakah nasabah yang bersangkutan merupakan nasabah yang berpotensi menjadi nasabah kredit yang produktif atau tidak.
Batasan masalah dari penelitian ini diantaranya adalah :
1.     Membangun aplikasi data mining di Bagian Dana Bank XY Kabupaten Bandung.
2.     Metode data mining yang digunakan adalah decision tree dengan algoritma decision tree yang digunakan adalah Algoritma C4.5
3.     Data yang digunakan adalah data angsuran nasabah kredit Bank XY Kabupaten Bandung selama periode Juni 2009, dengan jumlah data yang digunakan sebanyak 250 record.
4.     Preprocessing  yang dilakukan terlebih dahulu terhadap data yang digunakan adalah data integration and transformation, data cleaning, dan data  reduction sehingga data tersebut siap untuk di-mining.
5.     Proses data integration and transformation, data cleaning, dan data reduction tidak ditangani sistem.
6.     Hasil dari proses mining adalah terbentuknya pola data berupa rules (aturan prediksi)
7.     Pemodelan analisis pembangunan perangkat lunak yang digunakan adalah metode analisis berorientasi objek.

2.   TINJAUAN PUSTAKA


Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan keuntungan, memperkecil biaya pengeluaran, atau bahkan keduanya. Secara teknis, data mining dapat disebut sebagai proses untuk menemukan korelasi atau pola dari ratusan atau ribuan field dari sebuah relasional database yang besar. [2]
Kemampuan Data mining untuk mencari informasi bisnis yang berharga dari basis data yang sangat besar, dapat dianalogikan dengan penambangan logam mulia dari lahan sumbernya, teknologi ini dipakai untuk [2] :
1.     Prediksi trend dan sifat-sifat bisnis, dimana data mining mengotomatisasi proses pencarian informasi pemprediksi di dalam basis data yang besar. 
2.     Penemuan pola-pola yang tidak diketahui sebelumnya, dimana data mining “menyapu” basis data, kemudian mengidentifikasi pola-pola yang sebelumnya tersembunyi dalam satu sapuan. 
Dalam aplikasinya, data mining sebenarnya merupakan salah satu bagian proses Knowledge Discovery in Database (KDD) yang bertugas untuk mengekstrak pola atau model dari data dengan menggunakan suatu algoritma yang spesifik. Adapun proses KDD sebagai berikut : [1]
1.     Data Selection : pemilihan data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. 
2.     Preprocessing : sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning dengan tujuan untuk membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal. 
3.     Transformation : yaitu proses coding pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam database.
4.     Data mining : proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. 
5.     Interpretation / Evaluation : pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut dengan interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya atau tidak.

3.   ANALISIS SISTEM


Prosedur pencarian nasabah yang dilakukan oleh Bagian Dana Bank XY Kabupaten Bandung, dapat dilihat pada Gambar 1. Berdasarkan hasil observasi yang telah dilakukan, data nasabah kredit Bank XY Kabupaten Bandung tersimpan dalam database microsoft excel dengan nama MASTER_KREDIT hasil import dari Sistem Informasi Debitur (SID), dimana tabel tersebut terdiri dari 27 fields (Tabel 1).


Gambar 1. Activity Diagram Prosedur Pencarian
Nasabah
Tabel 1
Struktur tabel MASTER_KREDIT

Field
NASABAH_ID
NAMA_NASABAH
ALAMAT
JENIS_KELAMIN
TEMPATLAHIR
TGLLAHIR
UMUR
JENIS_ID
KODE_AGAMA
DESA
KECAMATAN
KOTA_KAB
PROPINSI
VERIFIKASI
TGL_REGISTER
KODEPOS
KODE_KANTOR
STATUS_MARITAL
BI_JENIS_PENGGUNAAN
BI_SEKTOR_EKONOMI
JML_PINJAMAN
NILAI_PINJAMAN
JML_ANGSURAN
KODE_INTEGRASI
STATUS
JENIS_AGUNAN
CEK

 Pada teknik classification, keluaran dari setiap data yang dijadikan parameter target atau class harus berupa bilangan bulat atau diskrit. Berdasarkan Tabel 1,  field yang dijadikan parameter target
(class), yaitu field „CEK‟ yang berisi nilai parameter AKTIF dan TIDAK-AKTIF. Nilai parameter AKTIF berarti nasabah masih mempunyai angsuran kredit kepada bank, sedangkan TIDAK-AKTIF berarti nasabah sudah tidak mempunyai angsuran kredit kepada bank lagi (sudah melunasi pembayaran kreditnya).
  Berdasarkan records dari data pada field „CEK‟ tersebut, maka teknik classification bisa diterapkan untuk melakukan data mining pada data tersebut. Adapun kolom yang bisa diambil sebagai parameterparameter pembentuk pohon keputusannya adalah  : a.  JENIS_KELAMIN
b.     UMUR
c.     DESA
d.     KECAMATAN
e.     STATUS_MARITAL
f.      NILAI_PINJAMAN
g.     JML_ANGSURAN
h.     KODE_INTEGRASI.
 Contoh pohon keputusan yang terbentuk dengan menggunakan algoritma C4.5 dapat dilihat pada gambar 2. Setelah pohon keputusan terbentuk secara utuh, maka dibuat aturan prediksi berdasarkan hasil pembentukan pohon keputusan tersebut. Adapun rules (aturan) prediksi yang dapat diperoleh dari pembentukan pohon keputusan pada contoh tersebut adalah sebagai berikut : 1. Jika Pekerjaannya di bidang Perdagangan
       Dan DESA CITAPEN
      Diprediksikan Berpotensi
2.     Jika Pekerjaannya di bidang Perdagangan
      Dan DESA BATUJAJAR BARAT
      Dan Jenis Kelaminnya Laki-Laki
      Diprediksikan Berpotensi
3.     Jika Pekerjaannya di bidang Perdagangan
      Dan DESA CIPATIK
      Diprediksikan Tidak Berpotensi
4.     Jika Pekerjaannya di bidang Perdagangan
      Dan DESA BATUJAJAR BARAT
      Dan Jenis Kelaminnya Perempuan
      Diprediksikan Tidak Berpotensi
5.     Jika Pekerjaannya di bidang Pertanian
      Diprediksikan Tidak Berpotensi



Gambar 2. Pohon Keputusan Node 1.1.2
                 
 Gambar 3 menunjukkan use case aplikasi data mining yang dibangun sehingga tampak jelas interaksi antara pengguna dengan aplikasi data mining. Aktor yang terkait dengan aplikasi data mining ini adalah Bagian Dana. Aktor ini mempunyai wewenang sepenuhnya untuk menangani aplikasi seperti melakukan login, import data, mengatur parameter, memproses pohon keputusan, melakukan prediksi, menguji kriteria nasabah, dan membuat laporan. Interaksi antara pengguna dengan aplikasi data mining yang terjadi pada setiap aktivitas di atas, akan diperjelas dengan menggunakan activity diagram. Sebagai contoh dapat dilihat Gambar 4 yang menunjukkan activity diagram “Menginpor Data”.




Gambar 3. Use Case Diagram Aplikasi Data Mining




Gambar 4. Activity Diagram Mengimpor Data

 Berdasarkan skenario use case, akan dibentuk diagram sequence untuk kasus normal dari setiap skenario use case. Tabel 2 menunjukkan skenario use case melakukan import data dan Gambar 5 menunjukkan sequence diagramnya. Sedangkan Gambar 6 menunjukkan class diagram sebagai hasil  realisasi dari use case diagram.
Tabel 2
Skenario Use Case Melakukan Import Data

Identifikasi
Nomor
UC-02
Nama
Melakukan import Data
Tujuan
Mengimpor data yang akan diolah atau dianalisis
Identifikasi
Deskripsi
Sistem membaca lokasi alamat data yang diinputkan pengguna, melakukan proses import data setelah aktor mengklik tombol “import”, kemudian menampilkan hasil data yang telah selesai di impor ke dalam aplikasi.  
Aktor
Bagian Dana
Skenario Utama
Kondisi awal
Pengguna sudah terautentifikasi dan berada pada halaman utama aplikasi data mining
Aksi Aktor
Reaksi Sistem
1. Mengklik tombol menu
Import Data”


2. Menampilkan halaman Import
Data
3.       Mengklik        tombol
Browse” 


4. Menampilkan halaman Open
Dialog
5. Mencari lokasi database nasabah dalam format
Microsoft Excel (*.xls)

6. Setelah ditemukan kemudian klik tombol “Open

7. Menampilkan lokasi alamat database
8.    Klik    tombol    “Import
Data” untuk memulai proses import data


9. Mengimpor data

10. Menampilkan hasil data yang telah diimpor ke dalam sistem.
Skenario Alternatif – Lokasi data belum ditentukan
Aksi Aktor
Reaksi Sistem
1. Mengklik tombol “Import
Data”


2. Tombol “Import Data” tidak aktif atau disabled.
2. Mencari lokasi database nasabah dalam format
Microsoft Excel (*.xls).  

Kondisi akhir
Data berhasil diimpor  




Gambar 5. Sequence Diagram Melakukan Import Data



 

 

DAFTAR PUSTAKA


[1]      Agushinta, D., Irfan, M. (2008), Perancangan Aplikasi Data Mining Untuk Memprediksi Permintaan Customer               Pada       Perusahaan Persewaan Mobil, Prosiding Seminar Ilmiah Nasional           Komputer              dan         Sistem    Intelijen (KOMMIT 2008),    Depok,   Universitas
Gunadarma, 207-208 
[2]      Berry,           M.J.A.,   (2004),   Data       Mining
Techniques, John Wiley & Sons.
[3]      Giudici, P., (2003), Applied Data Mining Statistical Methods for Business and Industry, England : John Wiley & Sons, Ltd.
[4]      Han, J., Micheline, K. (2006), Data Mining Concepts and Techniques, Second Edition. California : Morgan Kauffman Publishers.
[5]      Khairina, I.K. (____), Penggunaan Pohon Keputusan untuk Data Mining, ITB,1-
3,http://www.informatika.org/~rinaldi/Matdis/2
008-2009/Makalah2008/Makalah0809-005.pdf 

(6) https://ojs.unikom.ac.id/index.php/komputa/article/view/48/46



4.        KESIMPULAN DAN SARAN

                Setelah   melakukan            analisis, perancangan, implementasi                 beserta   pengujian              yang       telah dilakukan, maka dapat disimpulkan bahwa aplikasi yang dibangun dapat membantu Bagian Dana dalam menganalisis data nasabah untuk menentukan target pemasaran kredit                 sehingga                diharapkan           biaya operasional marketing perbankan dapat ditekan seminimal mungkin. Jadi perancangan aplikasi data mining ini telah sesuai dengan prosedur dan tujuan yang           diharapkan.                 Adapun saran-saran           untuk pengembangan aplikasi ini lebih lanjut adalah :
1.    Pembersihan data diharapkan bisa terintegrasi dalam aplikasi.
2.    Adanya grafik yang mempresentasikan hasil analisis.
3.    Format masukan data tidak hanya berupa Microsoft Excel saja tetapi bisa Microsoft Access, SQL server, dan lain sebagainya.

Processing
yang termasuk processing adalah pada bagian "Prosedur pencarian nasabah yang dilakukan oleh Bagian Dana Bank XY Kabupaten Bandung"

Transformasi Data
yang termasuk transformasi data adalah pada bagian "pohon keputusan yang terbentuk dengan menggunakan algoritma C4.5 dapat dilihat pada gambar 2"

Pola/Pattern
yang termasuk pola adalah pada bagian "Aktor yang terkait dengan aplikasi data mining ini adalah Bagian Dana"

Interpretasi
yang termasuk interpretasi adalah hasil melakukan import data.



Tidak ada komentar:

Posting Komentar