I.
JUDUL
Judul dari proposal ini adalah PENDEKATAN DATA MINING.
II.
LATAR
BELAKANG
Kemajuan
dalam pengumpulan data
dan teknologi penyimpanan
yang cepat memungkinkan organisasi
menghimpun jumlah data
yang sangat luas.
Alat dan teknik analisis
data yang tradisional
tidak dapat digunakan
untuk mengekstrak informasi dari
data yang sangat besar. Untuk itu diperlukan suatu metoda baru yang dapat menjawab
kebutuhan tersebut. Data mining
merupakan teknologi yang menggabungkan metoda analisis
tradisional dengan algoritma yang canggih untuk memproses data dengan volume
besar.
Data Mining memang salah satu cabang ilmu
komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan
untuk menempatkan data mining di bidang ilmu mana, karena data mining
menyangkut database, kecerdasan buatan (artificial intelligence), statistik,
dan sebagainya.. Ada
pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau
analisa statistik yang berjalan di atas database. Namun pihak lain berpendapat
bahwa database berperanan penting di data mining karena data mining mengakses
data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran
penting database terutama dalam optimisasi query-nya.
Definisi sederhana dari data mining adalah
ekstraksi informasi atau pola yang penting atau menarik dari data yang ada di
database yang besar. Dalam jurnal ilmiah, data mining juga dikenal dengan nama
Knowledge Discovery in Databases (KDD).
Data mining digunakan untuk melakukan information
discovery yang informasinya lebih ditujukan untuk seorang Data Analyt dan
Business Analyst, data mining tidak hanya melakukan minig terhadap data
transaksi saja namun juga dapat digunakan salah satunya dalam hal ini, kami
lebih menekankan kepada konsistensi pemilihan jurusan di fikom UNIMUS.
III.
PERUMUSAN
MASALAH
Ditinjau dari uraian latar belakang di atas dapat
diketahui bahwa meskipun teknologi basisdata modern telah menghasilkan media
penyimpanan yang ekonomis, teknologi untuk membantu kita menganalisis,
memahami, atau bahkan memvisualisasikannya belumlah tersedia. Maka rumusan
masalah yang muncul dalam penelitian ini adalah bagaimana membangun satu
aplikasi atau program bantu untuk mempermudah pemilihan jurusan terbaik bagi
calon mahasiswa/i di fakultas ilmu komputer Almuslim dengan
menggunakan metode pendekatan data mining.
IV.
TUJUAN
PENELITIAN
Tujuan diadakannya penelitian ini adalah :
1.
Diharapkan dapat membantu
pihak-pihak yang berkepentingan untuk kemudahan
perolehan gambaran jurusan yang terbaik di fikom.
2.
Diharapkan dapat membantu
mempercepat pengambilan keputusan dengan adanya data mining dan program bantu.
V.
RUANG
LINGKUP
Ruang lingkup permasalahan dalam penelitian ini adalah FIKOM UNIMUS. Untuk memperjelas
ruang lingkup pembahasan dan agar langkah-langkah pemecahan masalah tidak
menyimpang dari tujuan yang ingin dicapai maka
dalam penelitian ini akan dibuat batasan masalah sebagai berikut :
a. Metode
yang digunakan adalah metode Clustering
b. Pembuatan
program atau aplikasi bantuan
c. Input
dari pemecahan masalah adalah data koordinat jurusan
d. Output
yang dihasilkan berupa pertimbangan jurusan yang paling tepat
VI.
TINJAUAN
PUSTAKA
Ø Beberapa
pengertian data mining yang berhasil penulis himpun dari beberapa pendapat
adalah sebagai berikut.
1. Secara
sederhana dapat didefinisikan bahwa Data mining adalah ekstraksi informasi
atau pola yang penting atau menarik dari data yang ada di database yang besar
sehingga menjadi informasi yang sangat berharga
2. Data
mining merupakan proses penemuan yang efisien sebuah pola terbaik yang dapat
menghasilkan sesuatu yang bernilai dari suatu koleksi data yang sangat besar.
3. Data mining adalah
suatu pola yang menguntungkan dalam melakukan search pada sebuah
database yang terdapat pada sebuah model. Proses ini dilakukan berulang-ulang (iterasi)
hingga didapat satu set pola yang memuaskan yang dapat berfungsi sesuai yang
diharapkan.
4. Data
mining adalah sebuah class dari suatu aplikasi database yang mencari pola-pola
yang tersembunyi di dalam sebuah group data yang dapat digunakan untuk memprediksi
prilaku yang akan dating
5. Data
mining adalah mencocokkan data dalam suatu model untuk menemukan informasi yang
tersembunyi dalam basisdata .
6. Data mining merupakan
aplikasi suatu algoritma
untuk menggali informasi bermanfaat dari dalam basisdata .
7. Data mining adalah proses menemukan pola-pola didalam
data, dimana proses penemuan tersebut dilakukan secara otomatis atau semi
otomatis dan pola-pola yang ditemukan harus bermanfaat .
8. Data
mining atau Knowledge
Discovery in Databases
(KDD) adalah pengambilan informasi
yang tersembunyi, dimana
informasi tersebut
sebelumnya tidak dikenal
dan berpotensi bermanfaat.
Berdasarkan
beberapa pengertian diatas dapat ditarik kesimpulan bahwa data mining adalah suatu
algoritma di dalam menggali informasi berharga yang terpendam atau tersembunyi
pada suatu koleksi data (database) yang sangat besar sehingga ditemukan suatu
pola yang menarik yang sebelumnya tidak diketahui. Oleh sebab itu istilah data mining sering
disalahgunakan untuk menggambarkan perangkat lunak yang mengolah data dengan
cara yang baru. Sebenarnya perangkat lunak data mining bukan hanya mengganti presentasi, tetapi
benarbenar menemukan sesuatu yang sebelumnya belum diketahui menjadi muncul diantara
sekumpulan data yang ada. Bahkan dengan menggunakan data mining dapat memprediksikan prilaku dan tren yang
akan terjadi kemudian, sehingga dapat menunjang dalam pengambilan keputusan dengan
benar.
Secara sederhana data mining adalah ekstraksi informasi
atau pola yang penting atau menarik dari data yang ada di basisdata yang besar.
Dalam jurnal ilmiah, data mining juga dikenal dengan nama
KDD.
Ø Proses
KDD secara garis besar
1.
Membangun pemahaman akan
domain aplikasi, pengetahuan lampau yang relevan dan tujuan dari pengguna akhir.
2.
Data Selection
Pemilihan
(seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap
penggalian informasi dalam KDD dimulai.
3.
Pre-processing Cleaning
Sebelum
proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data
yang menjadi focus KDD. Proses cleaning mencakup antara lain membuang duplikasi
data, memeriksa data yang inkonsisten dan memperbaiki kesalahan pada data
seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment.
4.
Transformation and reduction
Coding
adalah proses transformasi pada data yang telah terpilih, sehingga data
tersebut sesuai untuk proses data mining.
5.
Memilih task data mining
6.
Memilih algoritma data
mining
7.
Data mining
Gambar II.1 Tahap-tahap KDD
Ø
Fungsionalitas
Data Mining
Secara
lebih spesifik data mining task berdasarkan fungsionalitasnya adalah sebagai
berikut:
- Mining Frequent Patterns, Associations, and
Correlations
: mencari pola-pola yang sering muncul dalam data.
- Classification and Prediction : mencari sebuah model yang mampu melakukan
prediksi pada suatu data baru yang belum pernah ada.
- Cluster
Analysis : mengelompokkan data dalam
sebuah cluster berdasarkan kemiripannya.
- Outlier
Analysis : mencari data object yang
sifatnya anomaly.
- Evolution
Analysis : mencari model atau tren untuk
data-data yang sifatnya terus berubah.
VII. METODOLOGI
Adapun
metodologi yang digunakan dalam penelitian ini adalah sebagai berikut :
1.
Analisis cluster
Clustering
dan segmentasi sebenarnya mempartisi database, karena itu setiap partisi atau
group adalah sama menurut kriteria atau metrik tertentu. Jika pengukuran
kesamaan tersedia, maka terdapat sejumlah teknik untuk membentuk cluster.
2.
K-means
a. Pilih
k objek sembarang sebagai inisial pusat cluster
b. Tunjukkan
setiap objek pada cluster dimana objeknya hampir sama, berdasarkan nilai tengah
dari objek-objek pada cluster
VIII.
RELEVANSI
Relevansi dari penelitian ini adalah :
1.
Diharapkan nantinya dengan
adanya penelitian ini dapat membantu berbagai pihak.
2.
Dengan adanya pendekatan data
mining dalam penelitian ini diharapkan hasil yang didapatkan dapat membantu
pengambilan keputusan dengan baik.
IX.
JADWAL
KEGIATAN
No
|
Keterangan
|
J U N I 2008
|
J U L I 2008
|
||||||
I
|
II
|
III
|
IV
|
I
|
II
|
III
|
IV
|
||
1.
|
Pengajuan
Judul
|
|
|
|
|
|
|
|
|
2.
|
ACC
& Pembuatan Proposal
|
|
|
|
|
|
|
|
|
3.
|
Penelitian
|
|
|
|
|
|
|
|
|
4.
|
Resume
& Hasil Penelitian
|
|
|
|
|
|
|
|
|
X.
DAFTAR
PUSTAKA
Santosa Budi,
2007, Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis, Jakarta .
0 komentar:
Post a Comment