Loading...
Friday, 27 December 2013

PENDEKATAN DATA MINING.


I.            JUDUL
Judul dari proposal ini adalah PENDEKATAN DATA MINING.

II.          LATAR BELAKANG
Kemajuan  dalam  pengumpulan  data  dan  teknologi  penyimpanan  yang  cepat memungkinkan  organisasi  menghimpun  jumlah  data  yang  sangat  luas.  Alat  dan teknik  analisis  data  yang  tradisional  tidak  dapat  digunakan  untuk  mengekstrak informasi dari data yang sangat besar. Untuk itu diperlukan suatu metoda baru yang dapat  menjawab  kebutuhan  tersebut.  Data mining  merupakan  teknologi  yang menggabungkan metoda analisis tradisional dengan algoritma yang canggih untuk memproses data dengan volume besar.

Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dan sebagainya.. Ada pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas database. Namun pihak lain berpendapat bahwa database berperanan penting di data mining karena data mining mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran penting database terutama dalam optimisasi query-nya.

Definisi sederhana dari data mining adalah ekstraksi informasi atau pola yang penting atau menarik dari data yang ada di database yang besar. Dalam jurnal ilmiah, data mining juga dikenal dengan nama Knowledge Discovery in Databases (KDD).

Data mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan untuk seorang Data Analyt dan Business Analyst, data mining tidak hanya melakukan minig terhadap data transaksi saja namun juga dapat digunakan salah satunya dalam hal ini, kami lebih menekankan kepada konsistensi pemilihan jurusan di fikom UNIMUS.

III.        PERUMUSAN MASALAH
Ditinjau dari uraian latar belakang di atas dapat diketahui bahwa meskipun teknologi basisdata modern telah menghasilkan media penyimpanan yang ekonomis, teknologi untuk membantu kita menganalisis, memahami, atau bahkan memvisualisasikannya belumlah tersedia. Maka rumusan masalah yang muncul dalam penelitian ini adalah bagaimana membangun satu aplikasi atau program bantu untuk mempermudah pemilihan jurusan terbaik bagi calon mahasiswa/i di  fakultas ilmu komputer Almuslim dengan menggunakan metode pendekatan data mining.


IV.         TUJUAN PENELITIAN
Tujuan diadakannya penelitian ini adalah :
1.       Diharapkan dapat membantu pihak-pihak yang berkepentingan untuk kemudahan perolehan gambaran jurusan yang terbaik di fikom.
2.       Diharapkan dapat membantu mempercepat pengambilan keputusan dengan adanya data mining dan program bantu.

V.           RUANG LINGKUP
Ruang lingkup permasalahan dalam penelitian ini adalah FIKOM UNIMUS. Untuk memperjelas ruang lingkup pembahasan dan agar langkah-langkah pemecahan masalah tidak menyimpang dari tujuan yang ingin dicapai maka dalam penelitian ini akan dibuat batasan masalah sebagai berikut :
a.    Metode yang digunakan adalah metode Clustering
b.    Pembuatan program atau aplikasi bantuan
c.    Input dari pemecahan masalah adalah data koordinat jurusan
d.    Output yang dihasilkan berupa pertimbangan jurusan yang paling tepat




VI.         TINJAUAN PUSTAKA
Ø  Beberapa pengertian data mining yang berhasil penulis himpun dari beberapa pendapat adalah sebagai berikut.
1.    Secara sederhana dapat didefinisikan bahwa Data mining adalah ekstraksi informasi atau pola yang penting atau menarik dari data yang ada di database yang besar sehingga menjadi informasi yang sangat berharga
2.    Data mining merupakan proses penemuan yang efisien sebuah pola terbaik yang dapat menghasilkan sesuatu yang bernilai dari suatu koleksi data yang sangat besar.
3.    Data mining adalah suatu pola yang menguntungkan dalam melakukan search pada sebuah database yang terdapat pada sebuah model. Proses ini dilakukan berulang-ulang (iterasi) hingga didapat satu set pola yang memuaskan yang dapat berfungsi sesuai yang diharapkan.
4.    Data mining adalah sebuah class dari suatu aplikasi database yang mencari pola-pola yang tersembunyi di dalam sebuah group data yang dapat digunakan untuk memprediksi prilaku yang akan dating
5.    Data mining adalah mencocokkan data dalam suatu model untuk menemukan informasi yang tersembunyi dalam basisdata . 
6.    Data  mining  merupakan  aplikasi  suatu  algoritma  untuk  menggali  informasi bermanfaat dari dalam basisdata .
7.    Data mining adalah proses menemukan pola-pola didalam data, dimana proses penemuan tersebut dilakukan secara otomatis atau semi otomatis dan pola-pola yang ditemukan harus bermanfaat .
8.    Data  mining  atau  Knowledge  Discovery  in  Databases  (KDD)  adalah pengambilan  informasi  yang  tersembunyi,  dimana  informasi  tersebut sebelumnya  tidak  dikenal  dan  berpotensi  bermanfaat. 

Berdasarkan beberapa pengertian diatas dapat ditarik kesimpulan bahwa data mining adalah suatu algoritma di dalam menggali informasi berharga yang terpendam atau tersembunyi pada suatu koleksi data (database) yang sangat besar sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak diketahui. Oleh sebab itu istilah data mining sering disalahgunakan untuk menggambarkan perangkat lunak yang mengolah data dengan cara yang baru. Sebenarnya perangkat lunak data mining bukan hanya mengganti presentasi, tetapi benarbenar menemukan sesuatu yang sebelumnya belum diketahui menjadi muncul diantara sekumpulan data yang ada. Bahkan dengan menggunakan data mining dapat memprediksikan prilaku dan tren yang akan terjadi kemudian, sehingga dapat menunjang dalam pengambilan keputusan dengan benar.

Secara sederhana data mining adalah ekstraksi informasi atau pola yang penting atau menarik dari data yang ada di basisdata yang besar. Dalam jurnal ilmiah, data mining juga dikenal dengan nama KDD.


Ø  Proses KDD secara garis besar
1.  Membangun pemahaman akan domain aplikasi, pengetahuan lampau yang relevan dan tujuan dari pengguna akhir.
2.  Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.
3.  Pre-processing Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi focus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten dan memperbaiki kesalahan pada data seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment.
4.  Transformation and reduction
Coding adalah proses transformasi pada data yang telah terpilih, sehingga data tersebut sesuai untuk proses data mining.
5.  Memilih task data mining
6.  Memilih algoritma data mining
7.  Data mining


Gambar II.1 Tahap-tahap KDD



Ø  Fungsionalitas Data Mining
     Secara lebih spesifik data mining task berdasarkan fungsionalitasnya adalah sebagai berikut:
  1. Mining Frequent Patterns, Associations, and Correlations : mencari pola-pola yang sering muncul dalam data.
  2. Classification and Prediction : mencari sebuah model yang mampu melakukan prediksi pada suatu data baru yang belum pernah ada.
  3. Cluster Analysis : mengelompokkan data dalam sebuah cluster berdasarkan kemiripannya.
  4. Outlier Analysis : mencari data object yang sifatnya anomaly.
  5. Evolution Analysis : mencari model atau tren untuk data-data yang sifatnya terus berubah.



VII.   METODOLOGI
Adapun metodologi yang digunakan dalam penelitian ini adalah sebagai berikut :
1.       Analisis cluster
Clustering dan segmentasi sebenarnya mempartisi database, karena itu setiap partisi atau group adalah sama menurut kriteria atau metrik tertentu. Jika pengukuran kesamaan tersedia, maka terdapat sejumlah teknik untuk membentuk cluster.
2.       K-means
a.    Pilih k objek sembarang sebagai inisial pusat cluster
b.    Tunjukkan setiap objek pada cluster dimana objeknya hampir sama, berdasarkan nilai tengah dari objek-objek pada cluster

VIII.    RELEVANSI
Relevansi dari penelitian ini adalah :
1.       Diharapkan nantinya dengan adanya penelitian ini dapat membantu berbagai pihak.
2.       Dengan adanya pendekatan data mining dalam penelitian ini diharapkan hasil yang didapatkan dapat membantu pengambilan keputusan dengan baik.

IX.         JADWAL KEGIATAN
No
Keterangan
   J U N I 2008
J U L I 2008

I

II

III

IV

I

II

III

IV
1.
Pengajuan Judul








2.
ACC & Pembuatan Proposal








3.
Penelitian








4.
Resume & Hasil Penelitian











X.           DAFTAR PUSTAKA

Santosa Budi, 2007, Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis, Jakarta.

0 komentar:

Post a Comment

 
TOP