Browsing Audio Data
Sebuah
metode browsing jaringan disediakan untuk browsing video / audio data yang
ditembak oleh sebuah IP kamera. Jaringan
video / audio metode browsing sesuai mencakup langkah-langkah dari:
- Menjalankan
sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi
yang disimpan dalam kamera IP,
- Transmisi
untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server)
oleh program aplikasi,
- Mendapatkan
kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP
kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat
server pribadi dan,
- Kopel
ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan
video / audio data yang ditembak oleh kamera IP, di mana server layanan
menangkap video / audio data yang ditembak oleh kamera IP melalui
Internet.
Penemuan
berkaitan dengan sistem dan metode untuk browsing video / audio data, lebih
khusus ke jaringan video / audio sistem browsing dan metode yang akan diatur
dalam sebuah IP kamera (juga disebut sebagai kamera jaringan) untuk browsing
video / audio data yang ditembak oleh kamera IP.
Sebagai
kemajuan teknologi jaringan, semakin banyak diterapkan jaringan produk yang
dibuat-buat terus-menerus. Salah satu yang paling umum diterapkan jaringan yang
dikenal adalah produk kamera IP, yang dapat menampilkan isi (video / audio
data) melalui Internet. Kamera IP biasanya terhubung ke jaringan melalui
router, dan memiliki sebuah IP (Internet Protocol) address setelah operasi
sambungan.
Jaringan
video / audio sistem browsing penemuan yang sekarang digunakan untuk browsing
video / audio data yang ditembak oleh sebuah IP kamera. Sistem penjelajahan
termasuk DDNS (Dynamic Domain Name Server), sebuah IP kamera disimpan dengan
kode identifikasi, sebuah layanan server, sebuah komputer lokal dan setidaknya
satu client. Masing-masing item sebelumnya terhubung ke Internet.
Pada perkembangan sejarahnya Audio mengalami 4 fase, yaitu :
- Fase pertama, dikenal
juga dengan Tehnik Audio – Mono ini umumnya dikenal sekitar periode tahun
20’an hingga sekitar akhir tahun 50’an dengan diketemukannya Alat
Gramaphone oleh Thomas Alfa Edison dengan metode Plat Baja,
- Fase kedua,
sekitar awal tahun 50’an dengan diketemukan Perekaman Analog dengan
piringan plat hitam maka orang mulai mengenal perekaman Mono stereo dengan
metode pemisahan suara ( Vokal dan Alat Musik ) menjadi L / R ( Music
;Left – output, Voice ; Right – output )
- Fase ketiga,
ditemukan tehnik Mixing Stereo menjadi L /R , ini populer sekali dan
dikembangkan terus hingga sekitar tahun 60’an akhir – awal 70’an
- Fase keempat,
Proses perekaman Umumnya saat ini didalam produksi audio umumnya dilakukan
dari Analog Ke Digital begitupun sebaliknya . Data Analog mempunyai
pengertian adalah data sinyal gelombang suara yang dikeluarkan dari Sumber
Aslinya hasil perekaman, misal : Perekaman Vokal ke komputer. Data Analog
sendiri mempunyai pengertian adalah Informasi gelombang suara yang terus
menerus berubah tidak beraturan secara Alami, Data Analog mengalami
perubahan keras (Amplitudo) dan tinggi rendah suara yang berfluktuasi,
namun belum mempunyai Skala & satuan yang pasti, sedangkan Data
Digital adalah hasil manipulasi Informasi gelombang suara secara terus menerus
berubah tidak beraturan secara alami menjadi satuan skala yang pasti .
SPEECH
RECOGNATION
1.
Pengenalan Speech Recognation
Speech recognation (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer
untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan
suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan
cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu
pola tertentu yang tersimpan dalam suatu perangkat.
Pengenalan ucapan (speech recognation) dalam perkembangan
teknologinya merupakan bagian dari pengenalan suara (proses identifikasi
seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi du
kategori, yaitu:
- Piranti
pengenalan kata (word recognation) yang mampu merespon
ucapan-ucapan secara indovidu atau perintah-perintah yang menggunakan
teknik yang dikenal sebagai speaker verification. Pertama kali
sistem akan membangkitkan suatu template untuk mengenali suara user.
- Piranti
pengenalan kalimat (speech recognation) yang mampu mengenali
hubungan antar kata terucap di dalam kalimat atau frase. Teknik -
teknik statistik dipakai dalam hal pola perekaman suara yang akan
dicocokkan dengan kata-kata terucap.
2.
Jenis-Jenis Pengenalan Ucapan
Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis
pengenalan kata, yaitu :
♣ Kata-kata yang terisolasi : Proses pengidentifikasian kata yang hanya
dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu
pengucapan antar kata
♣ Kata-kata yang berhubungan : Proses pengidentifikasian kata yang mirip
dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata
yang lebih singkat
♣ Kata-kata yang berkelanjutan : Proses pengidentifikasian kata yang
sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara
berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu.
Proses pengenalan suara ini sangat rumit karena membutuhkan metode khusus untuk
membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini
dapat mengucapkan kata-kata secara natural
♣ Kata-kata spontan: Proses pengidentifikasian kata yang dapat mengenal
kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata
♣ Verifikasi atau identifikasi suara: Proses pengidentifikasian kata yang
tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang
berbicara
3. Prinsip Dasar Speech Recognation
Semua metode dasar proses pengenalan suara terdiri dari dua fase operasi,
yaitu:
- Proses training.
Pada proses ini sistem belajar dari referensi pola yang berupa perbedaan
pola sinyal suara misal frase, kata, fonem yang akan mengisi vocabulari
dari sistem. Setiap referensi di pelajari dari kata yang dikatakan yang
kemudian disimpan dalam template dan telah mengalami metode untuk
merata-rata dan karakteristik statistik dan parameter statistik.
- Proses recognation.
Pada proses ini sistem akan diberikan inputan yang belum diketahui dan
akan di identifikasi berdasarkan pola template yang telah didapatkan pada
proses training.
Pada umumnya, suatu sistem pengenalan suara terdiri dari beberapa modul
utama, yaitu:
@ Signal processign frontend digunakan untuk mengkonversi sinyal
suara kedalam bentuk sequence feature vector yang akan digunakan
pada saat klasifikasi.
@ Accoustic modelling digunakan untuk memodelkan secara statistik
hasil training yang telah dilakukan kedalam sebuah template.
@ Language modelling digunakan untuk memodelkan bentuk kata baik
berupa kata, fonem, ataupun kalimat.
Sumber :