
Wahyu Hidayat
Wahyu Hidayat earned his Bachelor’s degree from Department of Informatics Engineering, STT Telkom Bandung in 2007. During his study at STT Telkom Bandung, he was actively participating in lab works as lab assistant, both at Database Laboratory and Language Laboratory. He was also chief lab assistant at Database Laboratory from 2006 to 2007.
In 2008 he was involved in a software engineering project as a junior database administrator at a major telecommunication company, PT Telekomunikasi Indonesia Tbk. During the project he was assigned to handle cross DBMS data migration and was responsible to manage user’s access and privileges to the database.
Later in 2012, Wahyu Hidayat earned his Master’s Degree in Information Technology from Department of Informatics Engineering, Institut Teknologi Bandung. Now, he is a lecturer at Telkom University, teaching database related courses. His research interests are including but not limited to data migration, text mining, image mining and plagiarism detection. Some of his previous works are “Indexing and Retrieval Engine Using Inverted Index”, “Image Classification Using K-Nearest Neighbor Algorithm” and “Cross Language Plagiarism Detection Using Google Service and Smith Waterman Algorithm”. Wahyu Hidayat also held an OCA certification from Oracle since early 2011 and can be reached through wahyuhidayat@tass.telkomuniversity.ac.id.
In 2008 he was involved in a software engineering project as a junior database administrator at a major telecommunication company, PT Telekomunikasi Indonesia Tbk. During the project he was assigned to handle cross DBMS data migration and was responsible to manage user’s access and privileges to the database.
Later in 2012, Wahyu Hidayat earned his Master’s Degree in Information Technology from Department of Informatics Engineering, Institut Teknologi Bandung. Now, he is a lecturer at Telkom University, teaching database related courses. His research interests are including but not limited to data migration, text mining, image mining and plagiarism detection. Some of his previous works are “Indexing and Retrieval Engine Using Inverted Index”, “Image Classification Using K-Nearest Neighbor Algorithm” and “Cross Language Plagiarism Detection Using Google Service and Smith Waterman Algorithm”. Wahyu Hidayat also held an OCA certification from Oracle since early 2011 and can be reached through wahyuhidayat@tass.telkomuniversity.ac.id.
less
Uploads
Papers by Wahyu Hidayat
Abstrak – Ekstraksi kata dasar atau stemming pada Bahasa Indonesia adalah proses yang kompleks di mana beberapa partikel awal dan beberapa partikel akhiran dari 13 awalan, 3 sisipan, dan 19 akhiran yang dikenal dapat digunakan secara sekaligus pada sebuah kata. Selain itu, proses stemming tidak terlalu menghasilkan 1 kata dasar (non-deterministik) karena terdapat beberapa kata dalam Bahasa Indonesia yang memiliki 2 kemungkinan, yaitu sebagai kata dasar maupun kata berimbuhan, misalnya pada kata " beruang ". Penelitian yang telah ada sebelumnya menggunakan kombinasi awalan dan akhiran yang tidak mungkin dan menerapkan heuristik untuk memilih kata dasar. Dalam penelitian ini diusulkan sebuah metode stemming secara berjenjang di mana berdasarkan urutan tertentu, secara bergantian partikel akhiran dan awalan dilepaskan dari sebuah kata sehingga dihasilkan sebuah kata dasar. Jika ditemukan beberapa kandidat kata dasar maka salah satu kata dasar akan dipilih. Metode ini diuji pada 6464 dokumen Al-Quran Terjemahan Indonesia dengan menggunakan kamus berukuran 5000 kata yang dipilih secara acak dari Kamus Besar Bahasa Indonesia. Dari 3432 kata unik yang diproses, diperoleh 94,7% kata dasar yang dapat diekstrak secara langsung dan hanya 5,3% yang perlu diproses lebih lanjut karena kandidat kata dasar yang ditemukan lebih dari satu. Dibandingkan dengan melakukan pemilihan kata dasar secara manual, metode ini dapat memilih kata dasar yang tepat hingga 79,12%. Kata kunci – ekstraksi kata dasar, morfologi, non-deterministik, akurasi
ini telah dikenal beberapa teknik dan kakas untuk melakukan migrasi data, misalnya CSV file, ODBC,
SQLDump dan sebagainya. Sayangnya tidak semua teknik tersebut dapat diimplementasikan untuk migrasi data
antara dua DBMS yang berbeda. Dalam penelitian ini dipaparkan sebuah teknik migrasi data yang dapat
digunakan untuk migrasi data lintas DBMS. Teknik migrasi data yang dipaparkan memanfaatkan metadata yang
ada di masing-masing DBMS. Proses migrasi data yang dipaparkan di sini melalui tiga tahap yaitu capture,
convert dan construct. Sebuah prototype dibangun untuk menguji teknik migrasi data ini. Dengan menggunakan
schema HR dilakukan uji coba migrasi data lintas DBMS antara Oracle dan MySQL. Dengan menggunakan
teknik ini, migrasi data full-schema membutuhkan waktu rata-rata 20,43 detik dari DBMS Oracle ke MySQL dan
12,96 detik untuk skenario sebaliknya. Adapun untuk migrasi data parsial dibutuhkan waktu rata-rata 5,95 detik
dari DBMS Oracle ke MySQL dan 2,19 detik untuk skenario sebaliknya.
Kata kunci – migrasi data; DBMS; metadata; tipe data
Proses indexing melibatkan beberapa tahap yaitu parsing, stopping, stemming, sorting dan merging. Proses indexing dilakukan terhadap 6464 buah file txt dalam Alquran Terjemahan Indonesia. Setelah itu indeks yang dihasilkan digunakan dalam proses pencarian dokumen yang hasilnya dibandingkan dengan hasil pencarian dokumen konvensional secara full text search. Baik hasil pencarian maupun waktu yang dibutuhkan semuanya dicatat untuk mengukur performa retrieval engine dengan parameter precision, recall dan waktu.
Hasil pengujian menunjukkan bahwa proses indexing tidak mengurangi nilai recall, namun menurunkan nilai precision hingga 41,88% demi meningkatkan kecepatan pencarian hingga 3800 kali lipat.
Kata kunci : inverted index, indexing and retrieval, precision, recall