Natural Language Interface to Database
BAB I
PENDAHULUAN
Informasi memainkan peran penting dalam kehidupan kita.
Salah satu sumber utama informasi database. Database dan teknologi database
mengalami dampak yang besar pada meningkatnya penggunaan komputer. Hampir semua
aplikasi IT yang menyimpan dan mengambil informasi dari database. Mengambil
informasi database membutuhkan pengetahuan tentang bahasa basis data seperti
SQL. Query Language (SQL) norma terstruktur yang dikejar di hampir semua bahasa
untuk sistem database relasional. Namun, tidak semua orang bisa menulis query
SQL karena mereka mungkin tidak menyadari struktur database. Jadi ini telah
menyebabkan pengembangan Intelligent Database System (IDBS). Ada kebutuhan
besar untuk pengguna non-ahli untuk query database relasional dalam bahasa
alami mereka bukan bekerja dengan nilai-nilai atribut. Akibatnya natural
language interface to database telah dikembangkan, yang menyediakan pilihan
fleksibel untuk memanipulasi query. Ide menggunakan Natural Language bukan SQL
telah mendorong pengembangan jenis baru pengolahan disebut Natural Language
Interface to Database. NLIDB adalah langkah menuju pengembangan Intellignt
Database System (IDBS) untuk meningkatkan pengguna dalam melakukan query
fleksibel dalam database. Tulisan ini merupakan pengantar untuk Sistem Database
Cerdas dan Interface Natural Language to Database.
BAB II
PEMBAHASAN
Database merupakan yang terpenting dalam berbagai
macam bidang aplikasi menggunakan sistem informasi swasta dan publik. Database
dibangun dengan tujuan untuk memfasilitasi kegiatan penyimpanan data,
pengolahan, dan pengambilan terkait dengan pengelolaan data dalam sistem
informasi. Karena kemajuan aplikasi teknologi komputer, aplikasi luas teknologi
web di beberapa daerah menjadi akurat, database telah menjadi repositori dari
volume besar data dalam database relasional, untuk mengambil informasi dari database,
salah satu kebutuhan untuk merumuskan query sedemikian rupa bahwa komputer akan
memahami dan menghasilkan output yang diinginkan. Query Language (SQL) norma
terstruktur yang dikejar di hampir semua bahasa untuk sistem database
relasional. Norma-norma SQL didasarkan pada interpretasi Boolean query. Tetapi
beberapa persyaratan pengguna mungkin tidak dijawab secara eksplisit oleh
sistem query klasik. Hal ini karena fakta bahwa karakteristik persyaratan
'tidak bisa diungkapkan dengan bahasa query biasa. Banyak aplikasi database
generasi baru menetapkan manajemen informasi cerdas memerlukan interaksi
efisien antara pengguna dan basis data. Dalam beberapa kali, ada meningkatnya
permintaan untuk pengguna non-ahli untuk query database relasional dalam bahasa
yang lebih alami meliputi variabel linguistik dan hal, bukannya beroperasi pada
nilai-nilai atribut.
Oleh karena itu ide untuk menggunakan bahasa alami bukan SQL
telah mendorong pengembangan jenis baru metode pengolahan yang disebut Natural
Language Interface to Database (NLIDB). NLIDB adalah langkah menuju
pengembangan sistem database cerdas (IDBS) untuk meningkatkan pengguna dalam
melakukan query fleksibel dalam database.
Intelligent Database System (IDBS)
Sebuah IDBS diberkahi dengan sistem manajemen data mampu
mengelola sejumlah besar data persistem yang berbagai bentuk penalaran dapat
diterapkan untuk menyimpulkan data dan informasi tambahan. Ini termasuk teknik
pengetahuan representasi, teknik inferensi, dan antarmuka pengguna cerdas -
antarmuka yang melampaui pendekatan bahasa query tradisional dengan
memanfaatkan fasilitas bahasa alami . Teknik ini memainkan peran penting dalam
meningkatkan sistem database: teknik representasi pengetahuan memungkinkan
seseorang untuk mewakili baik di DB semantik dari domain aplikasi, teknik
inferensi memungkinkan satu untuk alasan tentang data untuk mengambil data dan
informasi tambahan, user interface Cerdas membantu pengguna untuk membuat
permintaan dan menerima balasan.
Intelligent Database System adalah sistem yang
mengelola informasi dengan cara alami, membuat informasi yang mudah untuk
menyimpan, mengakses dan menggunakan. Salah satu alasan utama untuk menggunakan
Intelligent Database System adalah bahwa kita hidup dalam keadaan
kekenyangan informasi. Untuk sekadar bertahan hidup dalam masyarakat saat ini,
kita perlu mengakses dan menggunakan informasi ini. Dengan menggunakan
Intelligent Database System kita dapat memiliki akses yang lebih baik
dalam penggunaan, lebih banyak jenis informasi yang mereka bisa sebaliknya. Ini
berarti Intelligent Database System harus memberikan tingkat tinggi
alat cerdas yang memberikan wawasan baru ke dalam isi database dengan
mengekstraksi pengetahuan dari data. Membuat informasi tersedia untuk sejumlah
besar orang karena lebih banyak orang sekarang dapat memanfaatkan sistem karena
kemudahan penggunaan. Meningkatkan proses pengambilan keputusan yang terlibat
dalam menggunakan informasi setelah itu telah diambil dengan menggunakan model
informasi tingkat yang lebih tinggi.
Saling berhubungan informasi dari sumber yang berbeda
menggunakan media yang berbeda sehingga informasi lebih mudah diserap dan
dimanfaatkan oleh pengguna. Gunakan pengetahuan dan inferensi, sehingga lebih
mudah untuk mengambil, melihat dan membuat keputusan dengan informasi.
Dalam beberapa kali ini , ada meningkatnya permintaan untuk
pengguna non-ahli untuk query database relasional dalam bahasa yang lebih alami
meliputi variabel linguistik , bukannya beroperasi pada nilai-nilai atribut.
Natural Language Interface to Database, pendekatan yang menjanjikan,
meningkatkan pengguna dalam melakukan query fleksibel dalam database.
Penelitian dan kemajuan NLIDB, merupakan langkah penting menuju pengembangan
sistem database cerdas dan telah muncul sebagai sebuah disiplin baru dan telah
terpesona perhatian terhadap jumlah peneliti.
Natural Language Interface to Database (NLIDB)
Natural Language Interface to Database merupakan untuk
menerima permintaan dalam bahasa Inggris atau bahasa alam lainnya dan mencoba
untuk 'memahami' mereka atau kita dapat mengatakan bahwa Natural Language
Interface to Database (NLIDB) adalah sistem yang menerjemahkan kalimat bahasa
alami ke dalam query database. Meskipun penelitian awal telah dimulai sejak
akhir tahun enam puluhan , NLIDB tetap sebagai masalah penelitian terbuka.
Sebuah sistem NLIDB lengkap akan menguntungkan kita dalam banyak cara. Siapapun
dapat mengumpulkan informasi dari database dengan menggunakan sistem seperti
.Additionally, mungkin mengubah persepsi kita tentang informasi dalam database.
Secara tradisional, orang yang digunakan untuk bekerja dengan bentuk harapan
mereka sangat tergantung pada kemampuan formulir. NLIDB membuat seluruh
pendekatan yang lebih fleksibel, karena itu akan memaksimalkan penggunaan
database. Ada banyak aplikasi yang dapat mengambil keuntungan dari NLIDB. Di
PDA dan ponsel lingkungan, tampilan layar tidak selebar komputer atau laptop.
Mengisi formulir yang memiliki banyak bidang dapat membosankan satu mungkin
harus menavigasi melalui layar, untuk menggulir, untuk mencari nilai-nilai
kotak scroll, dll Sebaliknya, dengan NLIDB, satu-satunya pekerjaan yang perlu
dilakukan adalah dengan mengetikkan pertanyaan serupa dengan SMS (Short
Messaging System).
2.1 Sub Komponen NLIDB
Komputasi ilmuwan telah membagi masalah akses Natural
Language Interface to Database menjadi dua sub-komponen:
- Komponen
linguistik
- komponen
database
Komponen Linguistik
Hal ini bertanggung jawab untuk menerjemahkan masukan bahasa
alami ke dalam query formal dan menghasilkan respon bahasa alami berdasarkan
hasil dari database pencarian.
Komponen Database
Ini merupakan fungsi tradisional dari Database Management .
Sebuah leksikon adalah tabel yang digunakan untuk memetakan kata-kata input
alami ke objek formal (nama relasi, atribut nama, dll) dari database. Kedua
parser dan juru semantik memanfaatkan leksikon. Sebuah generator bahasa alami
mengambil tanggapan resmi sebagai masukan, dan memeriksa pohon parsing untuk
menghasilkan respon bahasa alami yang memadai. sistem database bahasa alami
memanfaatkan pengetahuan sintaksis dan pengetahuan tentang database sebenarnya
dalam rangka untuk benar berhubungan masukan bahasa alami dengan struktur dan
isi dari database tersebut. pengetahuan sintaksis biasanya berada dalam komponen
linguistik dari sistem, khususnya dalam analisa sintaks sedangkan pengetahuan
tentang database sebenarnya berada sampai batas tertentu dalam model data
semantik digunakan. Pertanyaan yang dimasukkan dalam bahasa alami diterjemahkan
ke dalam sebuah pernyataan dalam bahasa query formal. Setelah pernyataan itu
jelas terbentuk, query diproses oleh sistem manajemen database untuk
menghasilkan data yang dibutuhkan. Data ini kemudian diteruskan kembali ke
komponen bahasa alami di mana rutinitas generasi memproduksi versi bahasa
permukaan respon.
Contoh Penerapan Aplikasi dari NLIDB
Masih sangat sedikit sekali aplikasi yang memperlihatkan
interaksi pengguna dengan actor virtual. Untuk mempelajari kecocokan
syarat-syarat teknis dalam lingkungan yang nyata, penelitian dari setiap
kemungkinan manusia mengendalikan karakter dalam sebuah game dengan menggunakan
instruksi bahasa natural. Game pada PC menyediakan lingkungan virtual dengan
skala besar yang terbatas, dengan beberapa tugas yang dapat di definisikan;
pada penelitian ini, mengambil sebuah game PC klasik berjudul DOOM™ sebagai contoh,
karena game ini memiliki sumber daya dan desain yang cocok untuk sebuah game
yang menggunakan metode pemrosesan bahasa natural. Karakter DOOM™ yang
digunakan adalah karakter “dengan panduan” on-line yang bisa didapatkan di
situs http://www.gamers.org . Panduan tersebut menjelaskan dalam bahasa natural
tentang alur dari tiap-tiap level dari game tersebut seperti: penjabaran peta,
lokasi-lokasi item, dan penjelasan tentang urutan langkah yang harus diambil
oleh pemain. Berikut adalah contoh panduan dari game DOOM™:
Enter the door with the skull on it and push the switch.
Walk out of the room and turn right. There are now stairs going into the wall,
which is fake. Enter the teleporter, you’re now in a circular room; find the
secret door (the wall with the face on it) to go to the next circular room and
enter the teleporter.
Masuki pintu bergambar tulang dan tekan switch yang ada.
Jalan terus sepanjang ruangan dan belok kanan. Disana ada tangga palsu yang
menggantung di tembok. Masuki teleporter, sekarang kamu ada di ruangan bundar;
temukan pintu rahasia (dinding yang bergambar wajah) untuk masuk ke ruangan
bundar berikutnya dan masuki teleport
Panduan tersebut berfungsi untuk mencocokan penjelasan yang
diberikan kepada pemain sebelum sesi game dimulai. Beberapa penjelasan
memasukkan saran sepanjang tiap aksi yang berkelanjutan di lakukan, termasuk
akibat dari aksi sebelumnya (cth.
“masuki teleporter, sekarang kamu ada di ruangan bundar”).
Dalam game ini terdapat banyak variable yang memunculkan
instruksi-instruksi yang dibawa pada setiap aksi dasar, yang mana
instruksi-instruksi tersebut membutuhkan pemrosesan bahasa natural.
Karakter dalam game ini memberi kesan keteraturan sosiolektal,
yang dapat di kategorikan sebagai sub-bahasa. Kesan ini akan membawa dampak
yang signifikan terhadap pemrosesan bahasa natural. Di lain pihak metode umum
untuk merancang interaksi dari bahasa natural adalah dengan mengartikan bahasa
yang sering digunakan manusia. Metode ini secara otomatis mendefinisikan
pengendalian tata bahasa, yang di rancang untuk memfasilitasikan pemrosesan
tata bahasa yang membuat parsing menjadi mudah dikerjakan. Di dalam tata bahasa
yang umum digunakan manusia, pendekatan praktis, mengidentifikasi aksi target,
menyelidiki tiap perintah yang di sampaikan, dan membangkitkan kumpulan dari
aturan-aturan.
Komunikasi dengan actor virtual sampai pada dua paradigma:
di satu pihak, dilihat dari aplikasi awalnya (game computer), sangat
memungkinkan untuk menyadari kemunculan sub-bahasa yang actual. Di lain pihak,
batasan pengenalan ucapan (speechrecognition) dan parsing membuat
sebuah celah antara actor virtual dengan tata-bahasa umum.
KEUNTUNGAN
Direct manipulation – pengoperasian secara langsung :
interaksi langsung dengan objek pada layar. Misalnya delete file dengan
memasukkannya ke trash. Contoh: Video games. Kelebihan : Waktu
pembelajaran sangat singkat, feedback langsung diberikan pada tiap aksi
sehingga kesalahan terdeteksi dan diperbaiki dengan cepat. Kekurangan :
Interface tipe ini rumit dan memerlukan banyak fasilitas pada sistem komputer,
cocok untuk penggambaran secara visual untuk satu operasi atau objek.
Menu selection – pilihan berbentuk menu : Memilih
perintah dari daftar yang disediakan. Misalnya saat click kanan dan memilih
aksi yang dikehendaki. Kelebihan : tidak perlu ingat nama perintah.
Pengetikan minimal. Kesalahan rendah. Kekurangan : Tidak ada logika AND atau
OR. Perlu ada struktur menu jika banyak pilihan. Menu dianggap lambat oleh
expert dibanding command language.
Form fill-in – pengisian form : Mengisi area-area pada form.
Contoh : Stock control. Kelebihan : Masukan data yang sederhana. Mudah
dipelajari Kekurangan : Memerlukan banyak tempat di layar. Harus menyesuaikan
dengan form manual dan kebiasaan.
Command language – perintah tertulis : Menuliskan perintah
yang sudah ditentukan pada program. Contoh: operating system. Kelebihan :
Perintah diketikan langsung pada system. Misal UNIX, DOS command. Bisa
diterapkan pada terminal yang murah.Kombinasi perintah bisa dilakukan. Misal
copy file dan rename nama file. Kekurangan : Perintah harus dipelajari dan
diingat cara penggunaannya, tidak cocok untuk biasa. Kesalahan pakai
perintah sering terjadi. Perlu ada sistem pemulihan kesalahan.Kemampuan
mengetik perlu.
Natural language – perintah dengan bahasa alami :
Menggunakan bahasa alami untuk mendapatkan hasil. Contoh: search engine di
Internet. Kelebihan: Perintah dalam bentuk bahasa alami, dengan kosa kata yang
terbatas (singkat), misalnya kata kunci yang kita tentukan untuk dicari oleh
search engine. Ada kebebasan menggunakan kata-kata. Kekurangan: Tidak semua
sistem cocok gunakan ini. Jika digunakan maka akan memerlukan banyak
pengetikan.
KERUGIAN
Saat ini semua sistem NLIDB hanya dapat menangani beberapa
subset dari bahasa alami dan tidak mudah untuk menentukan subset ini. Bahkan
beberapa sistem NLIDB tidak bisa menjawab pertanyaan-pertanyaan tertentu milik
subset mereka sendiri. Hal ini tidak terjadi di bahasa formal. Cakupan bahasa
formal jelas dan pernyataan yang mengikuti aturan yang diberikan dijamin untuk
memberikan jawaban yang sesuai.
Orang dapat disesatkan oleh kemampuan sistem ini NLIDB untuk
memproses bahasa alami: mereka mungkin menganggap bahwa sistem cerdas .Oleh
daripada meminta pertanyaan yang tepat dari database, mereka mungkin tergoda
untuk mengajukan pertanyaan yang melibatkan ide-ide yang kompleks, penilaian
tertentu, penalaran kemampuan, dll, yang sistem NLIDB tidak bisa diandalkan.
KESIMPULAN & SARAN
kesimpulan yang saya dapat dari makalah diatas adalah Natural Language Interface to Database berfungsi untuk membantu menerjemahkan kalimat ke dalam query database dan juga bisa dapat memaksimalkan penggunaan database dengan menggunakan pendekatan yang lebih fleksibel
Saya berharap kedepannya peneliti Natural Language Interface to Database bisa memberikan alasan penyebab kegagalan dalam system agar user mengerti
REFERENSI
[1]. Bertino, B. Catania, G.P. Zarri, “Intelligent database systems”, Reading, Addsion Wesley Professional, 2001.
[2]. Kamran Parsaye, Mark Chignell, Setrag Khoshafian and Harry Wong, “Intelligent databases-object-oriented, deductive hypermedia technologies”, New York, John Wiley& Sons, 1989.
[3]. Androutsopoulos, G.D. Ritchie, and P. Thanisch, Natural Language Interfaces to Databases - An Introduction, Journal of Natural Language Engineering 1 Part 1 (1995), 29–81
[4]. Charniak E. 1993, “Statistical Language Learning”, MIT Press.
[5]. Church K., Mercer R. 1993, “Introduction to the special issue on computational linguistics using large corpora”,
Computational Linguistics,19 (1), pp. 1-24.
[6]. Miikkulainen R. 1993, “Subsymbolic Natural Language Processing: An Integrated Model of Scripts, Lexicon, and Memory”,MIT Press, Cambridge, MA.