Speech recognition adalah proses konversi
sebuah sinyal akustik, yang ditangkap oleh microphone atau telepon, untuk
merangkai kata kata. Kata–kata yang dikenali merupakan hasil akhir untuk sebuah
aplikasi seperti command & control, penginputan data, dan persiapan dokumen.
Kita hanya perlu mengatakan perintah dengan bahasa inggris lalu komputer akan
menjalankan perintah kita. Hal ini juga bisa dilakukan untuk pengetikan. Speech
Recognition di windows 7 membuat kita bisa memerintah PC dengan suara kita
untuk mendikte hampir ke berbagai aplikasi.
Sejarah Speech Recognition
·
1874
:
Alexander Graham Bell berhasil membuktikkan bahwa frekuensi
harmoni dari sebuah sinyal elektrik dapat dibagi-bagi yang kemudian hari
berlanjut pada digitalisasi ucapan.
·
1952
:
Bell Labs mengembangkan speech recognizer pertama dengan
menggunakan teknologi pemisah frekuensi yang serupa dengan teknologi yang
dikembangkan oleh Alexander Graham Bell.
·
1971-1976
:
Defence Advance Research Project Agency dibentuk yang merupakan
proyek riset dengan dana dari pemerintah AS. Tujuan dari proyek ini adalah
untuk melakukan penelitian teknologi speech recognition. Penemuan terbesar yang
dihasilkan proyek ini adalah peningkatan dalam menekan permasalahan
variabilitas suara.
·
Pertengahan
tahun 1970-an :
Itakura mengadakan sebuah riset untuk mengembangkan sebuah
produk yang berbasis pada asumsi bahwa noise itu walaupun terdengar sama namun
pada kenyataannya tidak demikian. Produk tersebut akurasinya mencapai 97,3%
saat diuji menggunakan 200 kosakata.
Bell Labs mengembangkan sistem yang mampu mengenali suara dari
orang-orang yang berbeda dengan akurasi hingga 97,1%.
·
Akhir
1970-an :
Produk speech recognition pertama mulai dipasarkan dengan harga
mulai $259 hingga $100.000.
·
1980-an
:
Pasaran speech recognition mulai digolongkan menjadi dua, yaitu
Call Center Speech Recognition System dan Speech-to-Text Application.
·
1990-an
:
Prosesor sebuah personal computer telah sanggup memenuhi level
minimal yang diperlukan agar sebuah software speech recognition dapat berjalan
dengan lancar serta efektif untuk penggunaan pribadi.
·
1999
:
Sebuah program speech recognition baru telah mampu memahami
pembicaraan manusia secara berkesinambungan dengan tingkat akurasi hingga 99%
yang membuatnya dapat dengan mudah digunakan oleh pengguna awam sekaligus.
Penerapan Speech Recognition
1.
Bidang
komunikasi
· Komando
Suara adalah suatu
program pada komputer yang melakukan perintah berdasarkan komando suara dari
pengguna. Contohnya pada aplikasi Microsoft Voice yang
berbasis bahasa Inggris. Ketika pengguna mengatakan “Mulai kalkulator” dengan
intonasi dan tata bahasa yang sesuai, komputer akan
segera membuka aplikasi kalkulator. Jika komando suara yang diberikan sesuai
dengan daftar perintah yang tersedia, aplikasi akan memastikan komando suara
dengan menampilkan tulisan “Apakah Anda meminta saya untuk ‘mulai
kalkulator’?”. Untuk melakukan verifikasi, pengguna cukup mengatakan “Lakukan”
dan komputer akan langsung beroperasi.
· Pendiktean adalah sebuah proses mendikte yang sekarang
ini banyak dimanfaatkan dalam pembuatan laporan atau penelitian. Contohnya pada
aplikasi Microsoft Dictation yang merupakan aplikasi yang
dapat menuliskan apa yang diucapkan oleh pengguna secara otomatis.
·
Telepon
Pada telepon, teknologi pengenal ucapan digunakan pada proses
penekanan tombol otomatis yang dapat menelpon nomor tujuan dengan komando suara.
2.
Bidang
kesehatan
Alat pengenal ucapan banyak digunakan dalam
bidang kesehatan untuk membantu para penyandang cacat dalam beraktivitas.
Contohnya pada aplikasi Antarmuka Suara Pengguna atauVoice User Interface (VUI)
yang menggunakan teknologi pengenal ucapan dimana pengendalian saklar lampu
misalnya, tidak perlu dilakukan secara manual dengan menggerakkan saklar tetapi
cukup dengan mengeluarkan perintah dalam bentuk ucapan sebagai saklarnya.
Metode ini membantu manusia yang secara fisik tidak dapat menggerakkan saklar
karena cacat pada tangan misalnya. Penerapan VUI ini tidak hanya untuk lampu
saja tapi bisa juga untuk aplikasi-aplikasi kontrol yang lain.
3.
Bidang
militer
· Pelatihan
Penerbangan, Aplikasi alat
pengenal ucapan dalam bidang militer adalah pada pengatur lalu-lintas udara atau yang
dikenal dengan Air Traffic Controllers (ATC) yang dipakai oleh
para pilot untuk mendapatkan keterangan mengenai keadaan lalu-lintas udara
seperti radar,
cuaca, dan navigasi. Alat pengenal ucapan digunakan sebagai pengganti operator yang
memberikan informasi kepada pilot dengan cara berdialog.
· Helikopter
Aplikasi alat pengenal ucapan pada helikopter digunakan untuk berkomunikasi lewat radio dan menyesuaikan sistem navigasi. Alat ini sangat diperlukan pada helikopter karena ketika terbang, sangat banyak gangguan yang akan menyulitkan pilot bila harus berkomunikasi dan menyesuaikan navigasi dengan terlebih dahulu memencet tombol tertentu.
Aplikasi alat pengenal ucapan pada helikopter digunakan untuk berkomunikasi lewat radio dan menyesuaikan sistem navigasi. Alat ini sangat diperlukan pada helikopter karena ketika terbang, sangat banyak gangguan yang akan menyulitkan pilot bila harus berkomunikasi dan menyesuaikan navigasi dengan terlebih dahulu memencet tombol tertentu.
Kelebihan dari peralatan yang menggunakan teknologi ini
adalah :
1. Cepat
Teknologi ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut. Contohnya pada komando suara. Hanya dalam selang waktu sekitar satu atau dua detik setelah kita mengkomandokan perintah melalui suara, komputer sudah memberi umpan balik atas komando kita.
Teknologi ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut. Contohnya pada komando suara. Hanya dalam selang waktu sekitar satu atau dua detik setelah kita mengkomandokan perintah melalui suara, komputer sudah memberi umpan balik atas komando kita.
2. Mudah digunakan, Kemudahan teknologi ini juga dapat dilihat
dalam aplikasi komando suara. Komando yang biasanya kita masukkan ke dalam
komputer dengan menggunakan tetikus atau papan ketik kini
dapat dengan mudahnya kita lakukan tanpa perangkat keras, yakni dengan komando
suara.
Kekurangan dari peralatan yang menggunakan teknologi ini
adalah :
1. Rawan terhadap gangguan. Hal ini disebabkan oleh proses sinyal
suara yang masih berbasis frekuensi. Ketika sebuah informasi dalam sinyal suara
mempunyai komponen frekuensi yang sama banyaknya dengan komponen frekuensi
gangguannya, akan sulit untuk memisahkan gangguan dari sinyal suara.
2. Jumlah kata yang dapat dikenal terbatas. Hal ini disebabkan pengenal ucapan
bekerja dengan cara mencari kemiripan dengan basis data yang dimiliki.
Hardware yang dibutuhkan dalam implementasi Speech Recognition :
1.
Sound
card : Merupakan
perangkat yang ditambahkan dalam suatu Komputer yang fungsinya sebagai
perangkat input dan output suara untuk mengubah sinyal elektrik, menjadi analog
maupun menjadi digital.
2.
Microphone : Perangkat input suara yang berfungsi
untuk mengubah suara yang melewati udara, air dari benda orang menjadi sinyal
elektrik.
3.
Komputer
atau Komputer Server : Dalam proses
suara digital menterjemahkan gelombang suara menjadi suatu simbol biasanya
menjadi suatu nomor biner yang dapat diproses lagi kemudian diidentifikasikan
dan dicocokan dengan database yang berisi berkas suara agar dapat dikenali.
Terdapat 4 langkah utama dalam sistem pengenalan suara :
1.
Penerimaan data input
2.
Ekstraksi, yaitu
penyimpanan data masukan sekaligus pembuatan database untuk template.
3.
Pembandingan/pencocokan,
yaitu tahap pencocokan data baru dengan data suara (pencocokan tata bahasa)
pada template.
4.
Validasi identitas
pengguna.
Secara umum, speech recognition memproses
sinyal suara yang masuk dan menyimpannya dalam bentuk digital. Hasil proses
digitalisasi tersebut kemudian dikonversi dalam bentuk spektrum suara yang akan
dianalisa dengan membandingkannya dengan template suara pada database sistem.
Data suara masukan dipilah-pilah dan diproses
satu per satu berdasarkan urutannya. Pemilahan ini dilakukan agar proses
analisis dapat dilakukan secara paralel. Proses yang pertama kali dilakukan
ialah memproses gelombang kontinu spektrum suara ke dalam bentuk diskrit.
Refrensi
arrosyadfikri.blogspot.com/2012/10/speech-recognition.html
repository.unand.ac.id/16973/1/TUGAS_AKHIR.pdf
ekha-azula.blogspot.com/.../menggunakan-speech-recognition-pada.html
Tidak ada komentar:
Posting Komentar