Natural Language Interface to Database

BAB I 
PENDAHULUAN
Informasi memainkan peran penting dalam kehidupan kita. Salah satu sumber utama informasi database. Database dan teknologi database mengalami dampak yang besar pada meningkatnya penggunaan komputer. Hampir semua aplikasi IT yang menyimpan dan mengambil informasi dari database. Mengambil informasi database membutuhkan pengetahuan tentang bahasa basis data seperti SQL. Query Language (SQL) norma terstruktur yang dikejar di hampir semua bahasa untuk sistem database relasional. Namun, tidak semua orang bisa menulis query SQL karena mereka mungkin tidak menyadari struktur database. Jadi ini telah menyebabkan pengembangan Intelligent Database System (IDBS). Ada kebutuhan besar untuk pengguna non-ahli untuk query database relasional dalam bahasa alami mereka bukan bekerja dengan nilai-nilai atribut. Akibatnya natural language interface to database telah dikembangkan, yang menyediakan pilihan fleksibel untuk memanipulasi query. Ide menggunakan Natural Language bukan SQL telah mendorong pengembangan jenis baru pengolahan disebut Natural Language Interface to Database. NLIDB adalah langkah menuju pengembangan Intellignt Database System  (IDBS) untuk meningkatkan pengguna dalam melakukan query fleksibel dalam database. Tulisan ini merupakan pengantar untuk Sistem Database Cerdas dan Interface Natural Language to Database.


BAB II
PEMBAHASAN
Database merupakan yang  terpenting dalam berbagai macam bidang aplikasi menggunakan sistem informasi swasta dan publik. Database dibangun dengan tujuan untuk memfasilitasi kegiatan penyimpanan data, pengolahan, dan pengambilan terkait dengan pengelolaan data dalam sistem informasi. Karena kemajuan aplikasi teknologi komputer, aplikasi luas teknologi web di beberapa daerah menjadi akurat, database telah menjadi repositori dari volume besar data dalam database relasional, untuk mengambil informasi dari database, salah satu kebutuhan untuk merumuskan query sedemikian rupa bahwa komputer akan memahami dan menghasilkan output yang diinginkan. Query Language (SQL) norma terstruktur yang dikejar di hampir semua bahasa untuk sistem database relasional. Norma-norma SQL didasarkan pada interpretasi Boolean query. Tetapi beberapa persyaratan pengguna mungkin tidak dijawab secara eksplisit oleh sistem query klasik. Hal ini karena fakta bahwa karakteristik persyaratan 'tidak bisa diungkapkan dengan bahasa query biasa. Banyak aplikasi database generasi baru menetapkan manajemen informasi cerdas memerlukan interaksi efisien antara pengguna dan basis data. Dalam beberapa kali, ada meningkatnya permintaan untuk pengguna non-ahli untuk query database relasional dalam bahasa yang lebih alami meliputi variabel linguistik dan hal, bukannya beroperasi pada nilai-nilai atribut.

Oleh karena itu ide untuk menggunakan bahasa alami bukan SQL telah mendorong pengembangan jenis baru metode pengolahan yang disebut Natural Language Interface to Database (NLIDB). NLIDB adalah langkah menuju pengembangan sistem database cerdas (IDBS) untuk meningkatkan pengguna dalam melakukan query fleksibel dalam database.
 Intelligent  Database System (IDBS)
Sebuah IDBS diberkahi dengan sistem manajemen data mampu mengelola sejumlah besar data persistem yang berbagai bentuk penalaran dapat diterapkan untuk menyimpulkan data dan informasi tambahan. Ini termasuk teknik pengetahuan representasi, teknik inferensi, dan antarmuka pengguna cerdas - antarmuka yang melampaui pendekatan bahasa query tradisional dengan memanfaatkan fasilitas bahasa alami . Teknik ini memainkan peran penting dalam meningkatkan sistem database: teknik representasi pengetahuan memungkinkan seseorang untuk mewakili baik di DB semantik dari domain aplikasi, teknik inferensi memungkinkan satu untuk alasan tentang data untuk mengambil data dan informasi tambahan, user interface Cerdas membantu pengguna untuk membuat permintaan dan menerima balasan.

Intelligent  Database System adalah sistem yang mengelola informasi dengan cara alami, membuat informasi yang mudah untuk menyimpan, mengakses dan menggunakan. Salah satu alasan utama untuk menggunakan Intelligent  Database System adalah bahwa kita hidup dalam keadaan kekenyangan informasi. Untuk sekadar bertahan hidup dalam masyarakat saat ini, kita perlu mengakses dan menggunakan informasi ini. Dengan menggunakan Intelligent  Database System kita dapat memiliki akses yang lebih baik dalam penggunaan, lebih banyak jenis informasi yang mereka bisa sebaliknya. Ini berarti Intelligent  Database System harus  memberikan tingkat tinggi alat cerdas yang memberikan wawasan baru ke dalam isi database dengan mengekstraksi pengetahuan dari data. Membuat informasi tersedia untuk sejumlah besar orang karena lebih banyak orang sekarang dapat memanfaatkan sistem karena kemudahan penggunaan. Meningkatkan proses pengambilan keputusan yang terlibat dalam menggunakan informasi setelah itu telah diambil dengan menggunakan model informasi tingkat yang lebih tinggi.
Saling berhubungan informasi dari sumber yang berbeda menggunakan media yang berbeda sehingga informasi lebih mudah diserap dan dimanfaatkan oleh pengguna. Gunakan pengetahuan dan inferensi, sehingga lebih mudah untuk mengambil, melihat dan membuat keputusan dengan informasi.
Dalam beberapa kali ini , ada meningkatnya permintaan untuk pengguna non-ahli untuk query database relasional dalam bahasa yang lebih alami meliputi variabel linguistik , bukannya beroperasi pada nilai-nilai atribut. Natural Language Interface to Database, pendekatan yang menjanjikan, meningkatkan pengguna dalam melakukan query fleksibel dalam database. Penelitian dan kemajuan NLIDB, merupakan langkah penting menuju pengembangan sistem database cerdas dan telah muncul sebagai sebuah disiplin baru dan telah terpesona perhatian terhadap jumlah peneliti.


Natural Language Interface to Database (NLIDB)
Natural Language Interface to Database merupakan  untuk menerima permintaan dalam bahasa Inggris atau bahasa alam lainnya dan mencoba untuk 'memahami' mereka atau kita dapat mengatakan bahwa Natural Language Interface to Database (NLIDB) adalah sistem yang menerjemahkan kalimat bahasa alami ke dalam query database. Meskipun penelitian awal telah dimulai sejak akhir tahun enam puluhan , NLIDB tetap sebagai masalah penelitian terbuka. Sebuah sistem NLIDB lengkap akan menguntungkan kita dalam banyak cara. Siapapun dapat mengumpulkan informasi dari database dengan menggunakan sistem seperti .Additionally, mungkin mengubah persepsi kita tentang informasi dalam database. Secara tradisional, orang yang digunakan untuk bekerja dengan bentuk harapan mereka sangat tergantung pada kemampuan formulir. NLIDB membuat seluruh pendekatan yang lebih fleksibel, karena itu akan memaksimalkan penggunaan database. Ada banyak aplikasi yang dapat mengambil keuntungan dari NLIDB. Di PDA dan ponsel lingkungan, tampilan layar tidak selebar komputer atau laptop. Mengisi formulir yang memiliki banyak bidang dapat membosankan satu mungkin harus menavigasi melalui layar, untuk menggulir, untuk mencari nilai-nilai kotak scroll, dll Sebaliknya, dengan NLIDB, satu-satunya pekerjaan yang perlu dilakukan adalah dengan mengetikkan pertanyaan serupa dengan SMS (Short Messaging System).

2.1 Sub Komponen NLIDB
Komputasi ilmuwan telah membagi masalah akses Natural Language Interface to Database menjadi dua sub-komponen:
-  Komponen linguistik
-  komponen database

Komponen Linguistik
Hal ini bertanggung jawab untuk menerjemahkan masukan bahasa alami ke dalam query formal dan menghasilkan respon bahasa alami berdasarkan hasil dari database pencarian.

Komponen Database
Ini merupakan fungsi tradisional dari Database Management . Sebuah leksikon adalah tabel yang digunakan untuk memetakan kata-kata input alami ke objek formal (nama relasi, atribut nama, dll) dari database. Kedua parser dan juru semantik memanfaatkan leksikon. Sebuah generator bahasa alami mengambil tanggapan resmi sebagai masukan, dan memeriksa pohon parsing untuk menghasilkan respon bahasa alami yang memadai. sistem database bahasa alami memanfaatkan pengetahuan sintaksis dan pengetahuan tentang database sebenarnya dalam rangka untuk benar berhubungan masukan bahasa alami dengan struktur dan isi dari database tersebut. pengetahuan sintaksis biasanya berada dalam komponen linguistik dari sistem, khususnya dalam analisa sintaks sedangkan pengetahuan tentang database sebenarnya berada sampai batas tertentu dalam model data semantik digunakan. Pertanyaan yang dimasukkan dalam bahasa alami diterjemahkan ke dalam sebuah pernyataan dalam bahasa query formal. Setelah pernyataan itu jelas terbentuk, query diproses oleh sistem manajemen database untuk menghasilkan data yang dibutuhkan. Data ini kemudian diteruskan kembali ke komponen bahasa alami di mana rutinitas generasi memproduksi versi bahasa permukaan respon.

Contoh Penerapan Aplikasi dari NLIDB
Masih sangat sedikit sekali aplikasi yang memperlihatkan interaksi pengguna dengan actor virtual. Untuk mempelajari kecocokan syarat-syarat teknis dalam lingkungan yang nyata, penelitian dari setiap kemungkinan manusia mengendalikan karakter dalam sebuah game dengan menggunakan instruksi bahasa natural. Game pada PC menyediakan lingkungan virtual dengan skala besar yang terbatas, dengan beberapa tugas yang dapat di definisikan; pada penelitian ini, mengambil sebuah game PC klasik berjudul DOOM™ sebagai contoh, karena game ini memiliki sumber daya dan desain yang cocok untuk sebuah game yang menggunakan metode pemrosesan bahasa natural. Karakter DOOM™ yang digunakan adalah karakter “dengan panduan” on-line yang bisa didapatkan di situs http://www.gamers.org . Panduan tersebut menjelaskan dalam bahasa natural tentang alur dari tiap-tiap level dari game tersebut seperti: penjabaran peta, lokasi-lokasi item, dan penjelasan tentang urutan langkah yang harus diambil oleh pemain. Berikut adalah contoh panduan dari game DOOM™:

Enter the door with the skull on it and push the switch. Walk out of the room and turn right. There are now stairs going into the wall, which is fake. Enter the teleporter, you’re now in a circular room; find the secret door (the wall with the face on it) to go to the next circular room and enter the teleporter.

Masuki pintu bergambar tulang dan tekan switch yang ada. Jalan terus sepanjang ruangan dan belok kanan. Disana ada tangga palsu yang menggantung di tembok. Masuki teleporter, sekarang kamu ada di ruangan bundar; temukan pintu rahasia (dinding yang bergambar wajah) untuk masuk ke ruangan bundar berikutnya dan masuki teleport
Panduan tersebut berfungsi untuk mencocokan penjelasan yang diberikan kepada pemain sebelum sesi game dimulai. Beberapa penjelasan memasukkan saran sepanjang tiap aksi yang berkelanjutan di lakukan, termasuk akibat dari aksi sebelumnya (cth.

“masuki teleporter, sekarang kamu ada di ruangan bundar”). Dalam game ini terdapat banyak variable yang memunculkan instruksi-instruksi yang dibawa pada setiap aksi dasar, yang mana instruksi-instruksi tersebut membutuhkan pemrosesan bahasa natural.
Karakter dalam game ini memberi kesan keteraturan sosiolektal, yang dapat di kategorikan sebagai sub-bahasa. Kesan ini akan membawa dampak yang signifikan terhadap pemrosesan bahasa natural. Di lain pihak metode umum untuk merancang interaksi dari bahasa natural adalah dengan mengartikan bahasa yang sering digunakan manusia. Metode ini secara otomatis mendefinisikan pengendalian tata bahasa, yang di rancang untuk memfasilitasikan pemrosesan tata bahasa yang membuat parsing menjadi mudah dikerjakan. Di dalam tata bahasa yang umum digunakan manusia, pendekatan praktis, mengidentifikasi aksi target, menyelidiki tiap perintah yang di sampaikan, dan membangkitkan kumpulan dari aturan-aturan.
Komunikasi dengan actor virtual sampai pada dua paradigma: di satu pihak, dilihat dari aplikasi awalnya (game computer), sangat memungkinkan untuk menyadari kemunculan sub-bahasa yang actual. Di lain pihak, batasan pengenalan ucapan (speechrecognition) dan parsing membuat sebuah celah antara actor virtual dengan tata-bahasa umum.

KEUNTUNGAN
Direct manipulation – pengoperasian secara langsung : interaksi langsung dengan objek pada layar. Misalnya delete file dengan memasukkannya ke trash. Contoh: Video games. Kelebihan :  Waktu pembelajaran sangat singkat, feedback langsung diberikan pada tiap aksi sehingga kesalahan terdeteksi dan diperbaiki dengan cepat. Kekurangan :  Interface tipe ini rumit dan memerlukan banyak fasilitas pada sistem komputer, cocok untuk penggambaran secara visual untuk satu operasi atau objek.
Menu selection – pilihan berbentuk menu :  Memilih perintah dari daftar yang disediakan. Misalnya saat click kanan dan memilih aksi yang dikehendaki. Kelebihan :   tidak perlu ingat nama perintah. Pengetikan minimal. Kesalahan rendah. Kekurangan : Tidak ada logika AND atau OR. Perlu ada struktur menu jika banyak pilihan. Menu dianggap lambat oleh expert   dibanding command language.
Form fill-in – pengisian form : Mengisi area-area pada form. Contoh : Stock control. Kelebihan : Masukan data yang sederhana. Mudah dipelajari Kekurangan : Memerlukan banyak tempat di layar. Harus menyesuaikan dengan form manual dan kebiasaan.
Command language – perintah tertulis : Menuliskan perintah yang sudah ditentukan pada program. Contoh: operating system. Kelebihan : Perintah diketikan langsung pada system. Misal UNIX, DOS command. Bisa diterapkan pada terminal yang murah.Kombinasi perintah bisa dilakukan. Misal copy file dan rename nama file. Kekurangan : Perintah harus dipelajari dan diingat cara penggunaannya, tidak cocok untuk   biasa. Kesalahan pakai perintah sering terjadi. Perlu ada sistem pemulihan kesalahan.Kemampuan mengetik perlu.
Natural language – perintah dengan bahasa alami : Menggunakan bahasa alami untuk mendapatkan hasil. Contoh: search engine di Internet. Kelebihan: Perintah dalam bentuk bahasa alami, dengan kosa kata yang terbatas (singkat), misalnya kata kunci yang kita tentukan untuk dicari oleh search engine. Ada kebebasan menggunakan kata-kata. Kekurangan: Tidak semua sistem cocok gunakan ini. Jika digunakan maka akan memerlukan banyak pengetikan.

KERUGIAN
Saat ini semua sistem NLIDB hanya dapat menangani beberapa subset dari bahasa alami dan tidak mudah untuk menentukan subset ini. Bahkan beberapa sistem NLIDB tidak bisa menjawab pertanyaan-pertanyaan tertentu milik subset mereka sendiri. Hal ini tidak terjadi di bahasa formal. Cakupan bahasa formal jelas dan pernyataan yang mengikuti aturan yang diberikan dijamin untuk memberikan jawaban yang sesuai.
Orang dapat disesatkan oleh kemampuan sistem ini NLIDB untuk memproses bahasa alami: mereka mungkin menganggap bahwa sistem cerdas .Oleh daripada meminta pertanyaan yang tepat dari database, mereka mungkin tergoda untuk mengajukan pertanyaan yang melibatkan ide-ide yang kompleks, penilaian tertentu, penalaran kemampuan, dll, yang sistem NLIDB tidak bisa diandalkan.

KESIMPULAN & SARAN 
kesimpulan yang saya dapat dari makalah diatas adalah Natural Language Interface to Database berfungsi untuk membantu menerjemahkan kalimat ke dalam query database dan juga bisa dapat memaksimalkan penggunaan database dengan menggunakan pendekatan yang lebih fleksibel

Saya berharap kedepannya peneliti Natural Language Interface to Database bisa memberikan alasan penyebab kegagalan dalam system agar user mengerti

REFERENSI
[1]. Bertino, B. Catania, G.P. Zarri, “Intelligent database systems”, Reading, Addsion Wesley Professional, 2001.
[2]. Kamran Parsaye, Mark Chignell, Setrag Khoshafian and Harry Wong, “Intelligent databases-object-oriented, deductive hypermedia technologies”, New York, John Wiley& Sons, 1989.
[3]. Androutsopoulos, G.D. Ritchie, and P. Thanisch, Natural Language Interfaces to Databases - An Introduction, Journal of Natural Language Engineering 1 Part 1 (1995), 29–81
[4]. Charniak E. 1993, “Statistical Language Learning”, MIT Press.
[5]. Church K., Mercer R. 1993, “Introduction to the special issue on computational linguistics using large corpora”,
      Computational Linguistics,19 (1), pp. 1-24.
[6]. Miikkulainen R. 1993, “Subsymbolic Natural Language Processing: An Integrated Model of Scripts, Lexicon, and Memory”,MIT Press, Cambridge, MA.
Share This Article Facebook +Google Twitter Digg Reddit