Natural Language Processing
A. Pengolahan
Bahasa Alami
Bahasa sebagai bagian yang penting dari kehidupan manusia, dalam bentuk
tulis dapat merupakan catatan dari pengetahuan yang didapat oleh umat manusia
dari satu generasi ke generasi berikutnya sedangkan dalam bentuk lisan
merupakan sarana komunikasi antar individu dalam suatu masyarakat.
Bahasa
dapat dibedakan menjadi 2 yaitu bahasa alami dan bahasa buatan. Bahasa alami
adalah bahasa yang digunakan manusia untuk berkomunikasi, misalnya bahasa
daerah, bahasa inggris, jepang, dan sebagainya. Sedangkan Bahasa buatan
merupakan bahasa yang sengaja dibuat secara khusus untuk kebutuhan tertentu,
seperti bahasa-bahasa pemrograman komputer atau bahasa pemodelan. Pengolahan
Bahasa Alami (PBA) atau Natural Language Processing (NLP) merupakan cabang dari
ilmu komputer dan linguistik yang membahas tentang interaksi antara bahasa manusia
(bahasa alami) dan komputer. NLP juga sering disebut sebagai cabang dari
kecerdasan buatan (Artificial Inteligence) dan memiliki kajian yang berhubungan
dengan linguistik komputasional.
B. Sejarah
Singkat NLP
Sejarah NLP dimulai pada tahun 1950-an, meskipun telah ada penilitian
NLP pada tahun-tahun sebelumnya. Pada tahun 1950, Alan Turing (bapak ilmu
komputer) mempublikasikan artikel terkenalnya yang berjudul “Computing
Machinery and Intelligence” yang di dalamnya Alan Turing mengusulkan tes yang
sekarang disebut dengan Turing Test. Tes Turing adalah sebuah tes yang mengukur
kemampuan mesin (dalam hal ini program komputer) untuk menunjukan perilaku
cerdas. Dalam ilustrasi contoh aslinya, seorang juri manusia akan terlibat
dalam percakapan dengan manusia
dan mesin
yang akan dites. Semua peserta dipisahkan satu sama lain. Jika juri tidak bisa
membedakan antara manusia dan mesin, maka mesin tersebut dikatakan lulus tes.
Sedikit
melihat sejarahnya, pengolahan bahasa alami dimulai pada tahun 1950-an. Bapak
ilmu komputer, Alan Turing, menerbitkan sebuah artikel. Di dalam artikel
terkenalnya ini Alan Turing mengusulkan sebuah tes yang sekarang dikenal Turing
Test. Sebuah tes yang akan mengukur kemampuan mesin (program komputer) untuk
menunjukan kecerdasannya. Ilustrasinya, seorang juri (manusia) akan melakukan
percakapan dengan manusia dan mesin yang melakukan tes tersebut. Peserta akan
dipisahkan satu sama lain. Mesin tersebut akan dinyatakan lulus tes jika juri
tidak bisa membedakan antara manusia dan mesin.
C. Pengertian
NLP
NLP (Natural Language Processing) merupakan salah satu bidang ilmu
komputer, kecerdasan buatan dan bahasa ( linguistic ) yang berkaitan dengan
interaksi antara komputer atau dengan bahasa alami manusia ( bahasa
Inggris dan bahasa Indonesia ) Jadi bahasa alami/ natural language yaitu
bahasa yang dimengerti oleh manusia. Bahasa alami pada prinsipnya adalah
suatu bentuk representasi dari suatu pesan yang akan dikomunikasikan antar
manusia. Representasinya dapat berupa suara, namun juga bisa
dinyatakan berupa tulisan.
NLP adalah bidang studi tersulit dalam kecerdasan buatan. Tetapi, jika
kita berhasil dalam pengembangan NLP maka dampak positifnya sangatlah
besar. Contoh-contoh diatas hanyalah sebagian dari aplikasi di seluruh
dunia yang telah mengaplikasikan NLP. Perkembangan komputer di masa
sekarang berada pada generasi komputer keempat. Pada generasi komputer
kelima (masa depan – masih imajinasi), komputer telah mampu dioperasikan
hanya dengan inputan suara manusia. Selain itu, komputer telah mampu untuk
memprogram dirinya sendiri sehingga bisa saja mungkin pemikirannya
mengalahkan pemikiran manusia. Anda pernah menonton film Iron Man? Jika
belum, maka saya menyarankan anda untuk menontonnya. J Di film tersebut
Tony Stark si Iron Man memiliki Intelligent Personal Assistent yang diberi nama
Jarvis. Jarvis adalah komputer Artificial Intelligence milik Stark yang
digunakan untuk mengontrol rumah, lokakarya, dan aspek dari kostum Iron
Man. Pengoperasian Jarvis hanya dengan perintah langsung dari mulut Tony
Stark (voice-input), karena Jarvis telah ditanamkan Natural Language Processing
danArtificial Intelligence yang handal.
D. Tujuan Dari
Bahasa Alami
Tujuan dari bidang bahasa alami ini adalah untuk melakukan proses
pembuatan model komputasi dari bahasa manusia, sehingga antara manusia dan
komputer dapat melakukan interaksi dengan perantaranya bahasa alami. Sebuah
sistem bahasa alami (Natural Language System) harus memperhatikan pengetahuan
dari bahasa itu sendiri baik dari segi kata yang digunakan, apa arti dari
sebuah kata, fungsi kata dari sebuah kalimat dan bagaimana dari kata-kata
tersebut dapat membentuk sebuah kalimat. Bahasa alami pada prinsipnya merupakan
bentuk dari representasi suatu pesan yang ingin dikomunikasikan oleh antar
manusia, bisa berupa suara atau ucapan tetapi juga bisa dalam bentuk tulisan.
E. Tingkatan
Pengolahan Bahasa Alami
1.
Fonetik dan Fonologi
Berhubungan dengan suara yang menghasilkan kata yang dapat dikenali.
Bidang ini menjadi penting dalam proses aplikasi yang memakai metode speech
based system.
2.
Morfologi
Pengetahuan tentang kata dan bentuknya dimanfaatkan untuk membedakan
satu kata dengan lainnya. Pada tingkat ini juga dapat dipisahkan antara kata
dan elemen lain seperti tanda baca. Sebagai contoh:
a)
kata going
1)
going (word)
2)
go (root)
3)
ing (suffix)
b)
kata understand
1)
under(prefix)
2)
stand(root)
3.
Sintaksis
Pemahaman tentang urutan kata dalam pembentukan kalimat dan hubungan
antar kata tersebut dalam proses perubahan bentuk dari kalimat menjadi bentuk
yang sistematis. Meliputi proses pengaturan tata letak suatu kata dalam kalimat
akan membentuk kalimat yang dapat dikenali. Selain itu dapat pula dikenali
bagian-bagian kalimat dalam suatu kalimat yang lebih besar.
4.
Semantik
Pemetaan bentuk struktur sintaksis dengan memanfaatkan tiap kata ke
dalam bentuk yang lebih mendasar dan tidak tergantung struktur kalimat.
Semantik mempelajari arti suatu kata dan bagaimana dari arti kata-kata tersebut
membentuk suatu arti dari kalimat yang utuh. Dalam tingkatan ini belum tercakup
konteks dari kalimat tersebut.
5.
Pragmatik
Pengetahuan pada tingkatan ini berkaitan dengan masing-masing konteks
yang berbeda tergantung pada situasi dan tujuan pembuatan sistem.
6.
Discourse Knowledge
Melakukan pengenalan apakah suatu kalimat yang sudah dibaca dan dikenali
sebelumnya akan mempengaruhi arti dari kalimat selanjutnya. Informasi ini
penting diketahui untuk melakukan pengolahan arti terhadap kata ganti orang dan
untuk mengartikan aspek sementara dari informasi.
7.
World Knowledge
Mencakup arti sebuah kata secara umum dan apakah ada arti khusus bagi
suatu kata dalam suatu percakapan dengan konteks tertentu.
Definisi
ini tidaklah bersifat kaku dan untuk setiap bentuk bahasa alami yang ada
biasanya ada pendefinisian lagi yang lebih spesifik sesuai dengan karakter
bahasa tersebut. Pada beberapa masalah mungkin hanya mengambil beberapa dari
pendekatan tersebut bahkan mungkin ada yang melakukan tambahan proses sesuai
dengan karakter dari bahasa yang digunakan dan sistem yang dibentuk. Selain
yang sudah disebutkan di atas masih ada lagi satu masalah yang cukup menantang
dalam bahasa alami, yaitu ambiguitas atau makna ganda dari suatu kata atau
kalimat. Dari satu masukan yang sama dapat menjadi beberapa arti yang berbeda
dan masing-masing dapat bernilai benar tergantung pada keperluan pemakai. Hal
ini dapat terjadi pada hampir semua tingkatan pendekatan di atas.
F. Komponen
Utama Bahasa Alami
1.
Parser
Suatu sistem yang mengambil
kalimat input bahasa alami dan menguraikannya ke dalam beberapa bagian gramatikal
(kata benda, kata kerja, kata sifat, dan lain-lain).
2.
Sistem Representasi Pengetahuan
Suatu sistem yang menganalisis output parser untuk menentukan maknanya.
3.
Output Translator
Suatu terjemahan yang merepresentasikan sistem pengetahuan dan melakukan
langkah-langkah yang bisa berupa jawaban atas bahasa alami atau output khusus
yang sesuai dengan program komputer lainnya.
G. Kategori
Aplikasi Pengolahan Bahasa Alami
Teknologi Pengolahan Bahasa Alami atau Natural Language Processing (NLP)
adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan
terhadap bahasa alami yang biasa digunakan oleh manusia. Sistem ini biasanya
mempunyai masukan dan keluaran berupa bahasa tulisan (teks). NLP mempunyai
aplikasi yang sangat luas.
Beberapa diantara berbagai
kategori aplikasi NLP adalah sebagai berikut:
1.
Natural Language Translator
Translator dari satu bahasa alami ke bahasa alami lainnya, misalnya
translator bahasa Inggris ke bahasa Indonesia, bahasa Indonesia ke bahasa
Jepang dan sebagainya. Translator bahasa alami bukan hanya kamus yang
menerjemahkan kata per kata, tetapi harus juga mentranslasikan sintaks dari
bahasa asal ke bahasa tujuannya.
2.
Translator Bahasa Alami ke Bahasa Buatan
Translator yang mengubah perintah-perintah dalam bahasa alami menjadi
bahasa buatan yang dapat dieksekusi oleh mesin atau komputer. Sebagai contoh,
translator yang memungkinkan kita memberikan perintah bahasa alami kepada
komputer. Dengan sistem seperti ini, pengguna sistem dapat memberikan perintah
dengan bahasa sehari-hari, misalnya, untuk menghapus semua file, pengguna cukup
memberikan perintah “komputer, tolong hapus semua file!” Translator akan
mentranslasikan perintah bahasa alami tersebut menjadi perintah bahasa formal
yang dipahami oleh komputer, yaitu “dir *.* ”.
3.
Text Summarization
Suatu sistem yang dapat “membuat ringkasan” hal-hal yang penting dari
suatu wacana yang diberikan
Dalam dunia kecerdasan buatan pengolahan bahasa
alami merupakan aplikasi terbesar setelah sistem pakar. Banyak para ahli
Artificial Intelligence berpendapat bahwa bidang yang penting yang dapat
dipecahkan oleh Artificial Intelligence adalah Pengolahan Bahasa Alami (Natural
Language Processing).
H. Aplikasi
Pengolahan Bahasa Alami
Secara umum, Jenis aplikasi yang bisa dibuat dalam bidang ilmu NLP
terbagi dua, yaitu text-based application dan dialogue-based application.Text-based
application adalah segala macam aplikasi yang melakukan proses terhadap teks
tertulis seperti misalnya dokumen, e-mail, buku, dan sebagainya.
Beberapa jenis aplikasi NLP yang
berbasis teks:
1.
Programs for Classifying and Retrieving Documents
by Content
Program yang mampu mengklasifikasi dan mengambil isi dari suatu dokumen
berdasarkan kontennya. Seperti spam filtering (pemfilteran pesan sampah),
language identification (identifikasi bahasa), dan lain-lain.

Spam Filtering
2.
Machine Translation
Program yang mampu mentranslasi kalimat baik berupa teks maupun suara
dari satu bahasa alami ke bahasa lainnya. Contoh: Google Translate.

Google Translate
Dialogue-based
application idealnya melibatkan bahasa lisan atau pengenalan suara, akan tetapi
bisa juga memasukan interaksi dialog dengan mengetikkan teks pertanyaan melalui
keyboard.
Beberapa jenis aplikasi NLP yang
berbasis dialog:
1.
Intelligent Personal Assistant
Perangkat lunak yang mampu melakukan tugas-tugas dan jasa berdasarkan
inputan dari pengguna, lokasi, dan memiliki kemampuan untuk mengakses informasi
dari berbagai sumber online (seperti cuaca, keadaan lalu lintas, berita, saham,
dll). Contohnya adalah Siri pada produk-produk Apple dan S-Voice pada
produk-produk seluler Samsung.
Siri Apple
2.
Chatbot
Chatbot adalah program komputer
yang didesain untuk mensimulasikan sebuah percakapan cerdas dengan satu atau
lebih pengguna manusia melalui inputan suara atau teks, utamanya digunakan
untuk percakapan kecil. Contoh: Cleverbot, SimSimi, dan Begobet.
Simsimi
Cara Penggunaan Siri Apple
Referensi:
Komentar
Posting Komentar