Mengenal Speech Recognition . .




Pada Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker recognition. Speech recognition adalah proses identifikasi suara berdasarkan kata yang diucapkan.


Speech recognition yang dikenal sebagai automatic speech recognition atau computer speech recognition menerjemahkan perkataan yang diucapkan menjadi text. Teknologi speech recognition ini sudah ada sejak lama dan sekarang banyak sekali jenis aplikasi yang dikembangkan menggunakan teknologi ini. Teknologi ini dikembangkan menggunakan algoritma program dinamis dalam hal ini adalah DTW singkatan dari Dynamic Time Warping.

Sebenarnya ada dua pemodelan dasar untuk speech recognition ini yaitu Hidden Markov model (HMM)-based speech recognition dan Dynamic time warping (DTW)-
based speech recognition. Pada pengembangannya maka alat speech recognizer diimplementasikan menggunakan Dynamic Time Wraping Algorithm (DTW). DTW pertama kali dikenalkan pada tahun 60an dan dieksplorasi sampai tahun 70an yang
menghasilkan alat speech recognizer.

Skema Utama Speech Recognition

Terdapat 4 langkah utama dalam sistem pengenalan suara :
[1] Penerimaan data input
[2] Ekstraksi, yaitu penyimpanan data masukan sekaligus pembuatan daatabase untuk template.
[3] Pembandingan / pencocokan yaitu tahap pencocokan.
data baru deng data suara (pencocokan tata bahasa) pada template.
[4] Validasi identtitas pengguna.


Proses Pencocokan Pola Suara

Secara umum, speech recognizer memproses sinyal suara yang masuk dan menyimpannya dalam bentuk digital. Hasil proses digitalisasi tersebut kemudia dioknversi dalam bentuk spektrum suara yang akan dianalisa dengan membandingkannya dengan template suara pada database sistem. Sebelumnya, data suara masukan dipilah-pilah dan diproses satu persatu berdasarkan urutannya.

Proses yang pertama kali dilakukan ialah memproses gelombang kontinu spektrum suara ke dalam bentuk diskrit. Langkah berikutnya ialah proses kalukasi yang dibagi menjadi dua bagian :
1. Transformasi gelombang diskrit menjadi array data.
2. Untuk masing-masing elemen pada array data, hitung "ketinggian" gelombang (frekuensi).



Jenis-jenis pengenalan ucapan

Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata, yaitu :

1. Kata-kata yang terisolasi
Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata.
2. Kata-kata yang berhubungan
Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat
3. Kata-kata yang berkelanjutan
Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural
4. Kata-kata spontan
Proses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata.
5. Verifikasi atau identifikasi suara
Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara.


Referensi :
1. www.informatika.org/~rinaldi/Stmik/.../MakalahIF3051-2009-050.p...
2.
www.informatika.org/~rinaldi/Stmik/.../MakalahIF2251-2008-077.p...
3. http://id.wikipedia.org/wiki/Pengenalan_ucapan#Jenis-jenis_pengenalan_ucapan