Teknologi Asisten Suara Untuk Perusahaan: Internet Of Things Ditingkatkan Oleh Ilmu Data

Comments · 208 Views

Pidato selalu menjadi cara komunikasi yang disukai. Seseorang mengucapkan rata-rata 15.000 kata setiap hari. Berbeda dengan bentuk komunikasi lain seperti menulis, pidato merupakan bentuk komunikasi yang sederhana dan mudah digunakan. Orang-orang merasa paling nyaman mengekspresikan diri m

Pertumbuhan asisten suara yang digunakan rumah tangga di AS selama 1 tahun

Diprediksi, asisten suara akan menggantikan menu Interactive Voice Response saat ini . Meskipun perangkat ini membuat terobosan besar dalam penggunaan pribadi, pasar perusahaan untuk teknologi berbasis suara masih tertinggal. Hal ini terjadi meskipun asisten suara berpotensi mengubah dunia bisnis dalam waktu dekat.

TEKNOLOGI YANG MENDUKUNG SUARA PADA TAHUN 2020: MEMBUKA POTENSI BAGI PERUSAHAAN

Saat mempertimbangkan solusi berbasis suara di tingkat perusahaan, salah satu area instruktif yang perlu diperhatikan adalah tingkat penerapan solusi oleh karyawan dalam kehidupan pribadi mereka. Jika pekerja sudah menggunakan asisten suara 'di luar jam kerja', maka masuk akal jika mereka dapat menggunakannya dengan cepat jika diterapkan secara profesional.

Menurut laporan Globant tahun 2018, sebagian besar karyawan senior dan pengambil keputusan telah mengadopsi teknologi yang diaktifkan dengan suara, dengan sekitar 44% menggunakannya setiap hari dan hampir 72% menggunakannya setiap minggu dalam kehidupan pribadi mereka. Namun terlepas dari kenyataan bahwa mereka ada di mana-mana dalam lingkup pribadi, kurang dari 31% karyawan senior menggunakan segala jenis teknologi yang mendukung suara di tingkat perusahaan.

Jelas sekali bahwa ada semacam perbedaan atau kesenjangan persepsi antara teknologi suara di tempat kerja dan teknologi yang sama yang digunakan di rumah. Namun, masih belum jelas mengapa teknologi ini dianggap cocok di satu lingkungan dan tidak di lingkungan lain.

Pemikiran yang bercabang ini mencakup fakta bahwa tiga perempat perusahaan telah mengidentifikasi teknologi yang mendukung suara sebagai inisiatif utama, namun hanya sedikit yang membuat rencana konkrit untuk mengintegrasikannya ke dalam model bisnis mereka.

Bisnis yang lamban sering kali menyebut investasi awal yang diperlukan untuk menerapkan teknologi baru sebagai faktor pembatas. Hal ini mencakup biaya perangkat dan teknologi terkait serta hilangnya tenaga kerja karena pelatihan karyawan tentang cara mengoperasikan teknologi tersebut.

Dalam banyak kasus, alasan tersebut lebih relevan. Namun, di bidang teknologi yang mendukung suara, paruh kedua khususnya adalah alasan yang buruk. Pertama-tama, sebagian besar calon pengguna bisnis (dan pelanggan) sudah menggunakan teknologi ini dalam kehidupan mereka sehari-hari. Kedua, asisten suara terkenal karena kemudahan penggunaannya. Ini berarti pelatihan akan jauh lebih singkat dibandingkan kasus adopsi lainnya.

INTEGRASI TEKNOLOGI YANG MENDUKUNG SUARA: PANDANGAN DARI PERSPEKTIF TEKNOLOGI

Asisten suara mengandalkan  teknologi Pembelajaran Mesin  seperti  Natural Language Processing  (NLP). Bagaimana mereka bekerja? Semuanya dimulai dengan semacam pemicu atau tombol start. Pemicu ini bisa berbentuk tombol konkret untuk ditekan pengguna. Ini memberi tahu sistem bahwa data berbasis ucapan akan masuk. Dalam solusi modern yang mendukung suara, frasa terkenal 'Oke, Google', 'Alexa', dan 'Hai, Siri' berfungsi sebagai pemicu.

Lebih dari sekadar sistem umum, teknologi yang mendukung suara dapat menawarkan pengenalan suara spesifik menggunakan jaringan saraf yang kuat dan kecerdasan buatan. Solusi semacam itu sering kali memerlukan keterlibatan komputasi awan.

Setelah aliran suara ditangkap oleh perangkat, ucapan tersebut diterjemahkan menjadi teks. Algoritme tersebut kemudian dapat menanyakan aturan bisnisnya. Hal ini membantu untuk menentukan kata-kata pemanggilan keterampilan mana yang mungkin cocok dengan ucapan masukan.

Dengan asumsi menemukan kecocokan, algoritme akan menjalankan tugas terkait. Hal ini sering kali melibatkan penyampaian instruksi ke perangkat, peralatan, dan sistem elektronik lain yang terhubung. Misalnya, banyak perangkat pintar yang memungkinkan pengguna mematikan lampu. Perangkat memilah ucapan, mengenali frasa pemanggilan keterampilan, dan mengirimkan sinyal ke cloud IoT tempat sinyal tersebut dihitung dan dikirim kembali ke perangkat pintar dengan perintah untuk memutus daya lampu.

Perangkat asisten suara dapat beroperasi dengan perintah satu langkah sederhana atau melalui logika kompleks yang saling berhubungan, yang mungkin melibatkan banyak instruksi suara yang berasal dari berbagai sumber. Pada akhirnya, semuanya direduksi menjadi input dan output, dengan hasil yang diprogramkan ditentukan sebelumnya.

Hasilnya, modul berkemampuan suara dapat dengan mudah diintegrasikan dengan berbagai perangkat keras. Setelah ucapan diterjemahkan ke dalam teks, perangkat menjalankan algoritma yang telah ditentukan sebelumnya oleh pengembang. Alexa Skills dapat ditambahkan ke hampir semua solusi perangkat lunak yang sudah ada sebelumnya.

Tantangannya di sini datang dari dua bidang: penyesuaian perangkat keras ke modul terintegrasi yang mendukung suara dan pengaturan firmware yang tepat – mikrofon dan speaker.

STUDI KASUS ASISTEN SUARA: INTEGRASI ALEXA SKILLS DENGAN SISTEM MANAJEMEN STAF

Menggunakan Smart Mirror sebagai contoh, Michael Lytvynenko, Pengembang Python & IoT di MobiDev , menunjukkan pendekatan yang mungkin diambil, serta bidang-bidang yang mungkin menjadi perhatian, ketika membangun solusi yang mendukung suara.

Dimungkinkan untuk membangun rangkaian perangkat keras/perangkat lunak khusus menggunakan solusi pengenalan suara yang ada, yang melibatkan desain penuh dan arsitektur klien/server. Ini mungkin rute yang Anda pilih jika Anda memerlukan produk yang disesuaikan secara signifikan.

Alternatifnya, asisten suara Alexa dapat memperluas kemampuan perangkat lunak. Alexa Skills dapat ditambahkan ke perangkat lunak yang sudah ada sebelumnya. Ia menawarkan serangkaian perintah suara yang telah ditentukan sebelumnya (misalnya, 'Alexa, bagaimana cuacanya sekarang?'). Anda juga memiliki kemampuan untuk membuat perintah suara baru tergantung kebutuhan aplikasi tertentu. Setelah Anda membuat Alexa Skills, Anda dapat membaginya dengan Alexa Skills Store, lalu meneruskannya ke pengguna di seluruh dunia. Untuk e-commerce, ini berarti bahwa orang yang menginstal Alexa Skills di perangkatnya dapat melakukan pembelian produk atau layanan melalui suara.

Michael Lytvynenko - Pengembang Python dan Iot di MobiDev

Michael Lytvynenko

Pengembang Python & IoT di MobiDev

Di bawah ini Anda dapat menemukan kasus penggunaan yang menunjukkan bagaimana mengintegrasikan Alexa dengan perangkat lunak manajemen staf untuk mengelola data karyawan dan acara internal.

Dengan integrasi Alexa Skills, karyawan dapat menggunakan perintah suara khusus dengan akurasi pengenalan yang kuat dalam waktu yang cepat.

MASA DEPAN ASISTEN SUARA DI PERUSAHAAN

Baru-baru ini, CEO Google Sundar Pichai mengumumkan bahwa sekitar 20% kueri Google saat ini melalui perangkat dan aplikasi Android adalah penelusuran suara. Teknologi suara sudah memainkan peran besar dalam kehidupan digital kita sehari-hari dan menjadi salah satu tren terpanas.

Dunia usaha akhirnya mulai menerima gagasan untuk mengadopsi teknologi ini. Hampir 90% perusahaan melaporkan niat mereka untuk berinvestasi pada solusi komunikasi langsung dengan pelanggan melalui suara.

Optimisme semakin tinggi, dengan hampir 90% manajer menyatakan perangkat yang diaktifkan dengan suara dapat menawarkan keunggulan kompetitif. Lebih dari separuhnya percaya bahwa teknologi ini dapat memberikan peningkatan dalam operasional. Manajemen sistem ERP hands-free dan laporan inventaris yang didukung suara hanyalah beberapa contoh kasus penggunaan.

PENGENALAN SUARA DIDUKUNG OLEH JARINGAN SARAF

Aleksander Solonskyi, Data Science Engineer di MobiDev , memberikan pemikirannya tentang inti dari teknologi suara.

Inti dari apa yang membuat asisten suara berfungsi adalah transfer kata-kata yang diucapkan menjadi data teks. Untuk mencapai hal ini, teknologi suara menggunakan jaringan saraf untuk mengurai dan mengklasifikasikan ucapan.

Keberhasilan mentransfer ucapan ke teks memiliki tiga aspek utama. Yang pertama adalah tingkat akurasi dalam pengenalan. Yang kedua adalah panjang frasa yang harus dikenali. Yang ketiga adalah jumlah frasa yang perlu diidentifikasi dan dibedakan. Semakin rumit atau tepat suatu solusi pada ketiga aspek tersebut, semakin banyak data yang dibutuhkan, yang berarti semakin banyak usaha dan uang yang diinvestasikan agar solusi tersebut berhasil.

Terkait frasa yang ada, kami sudah memiliki sejumlah perpustakaan dan kumpulan data yang dapat sangat membantu dalam akurasi. Untuk frasa baru yang lebih eksotis, pelatihan tambahan mungkin diperlukan.

Tingkat berikutnya dalam pengenalan ucapan adalah pemahaman tidak hanya kata-kata yang diucapkan, tetapi juga intonasi. Menguasai intonasi memerlukan beberapa jaringan yang digabungkan dalam struktur percabangan.

Aleksandr Solonskyi
Aleksandr Solonskyi

Arsitek Solusi Ilmu Data

 

APA SAJA KENDALA PENGGUNAAN ASISTEN SUARA UNTUK PERUSAHAAN?

Meskipun manfaat teknologi bantuan AI sangat banyak dan jelas, bidang ini belum sepenuhnya matang dalam segala hal. Kendala-kendala berikut ini memperlambat adopsi di beberapa wilayah tertentu.

Perlindungan data sensitif

Keamanan kemungkinan besar merupakan masalah utama yang dihadapi oleh teknologi yang diaktifkan dengan suara. Meskipun sebagian besar aplikasi pribadi bersifat sepele, aplikasi perusahaan akan lebih bersifat teknis dan akan digunakan dalam kerangka kerja yang lebih analitis. Integrasi dengan sistem pihak ketiga sering kali mempersempit kasus penggunaan asisten suara menjadi kasus yang hanya beroperasi dengan data yang tidak sangat aman.

Dukungan bahasa

Di antara lebih dari 7.000 bahasa yang digunakan di seluruh dunia, 200 bahasa  dilaporkan  digunakan oleh lebih dari 1 juta orang. 23 bahasa digunakan oleh lebih dari separuh populasi dunia. Mengingat hal ini, jangkauan asisten suara modern agak terbatas.

Misalnya, Asisten Google  memberi  pengembang Actions dalam 19 bahasa. Amazon Alexa  hanya mengenali  6 bahasa di 15 wilayah. Microsoft Cortana  mendukung  8 bahasa dan 15 lokal. Apple Siri memiliki kinerja yang lebih baik,  mencakup  21 bahasa di 36 negara, dengan puluhan dialek tambahan.

Kurangnya lokalisasi yang tepat dapat menyebabkan asisten suara kehilangan kekhasan dan norma budaya. Misalnya, pengujian yang dilakukan oleh Vocalize.ai pada bulan September 2018 menemukan bahwa Amazon Echo dan Apple HomePod hanya mengenali 78% kata dalam bahasa Mandarin, dibandingkan dengan 94% kata dalam bahasa Inggris yang lebih percaya diri.

Pengalaman pengguna

Sayangnya, pengguna perangkat yang diaktifkan dengan suara saat ini belum mengeksplorasi semua kemampuan yang tersedia bagi mereka. Hampir separuh pengguna asisten suara bertahan dengan pilihan yang terbatas, meskipun ada sekitar 80.000 pilihan yang tersedia di jaringan Alexa. Perintah-perintah ini sederhana dan mudah diakses, namun saat ini sebagian besar pengguna tidak bereksperimen dengan berbagai pilihan yang tersedia.

HARUSKAH SESEORANG BERINVESTASI PADA TEKNOLOGI BANTUAN SUARA?

Saat ini, inersia adalah masalah terbesar yang dihadapi teknologi asisten suara. Orang-orang belum berkomitmen untuk menghentikan pola pengendalian perangkat mereka secara manual dibandingkan menggunakan ucapan. Hal ini terjadi dua kali lipat dalam dunia bisnis.

Meskipun kemajuannya tidak secepat perkiraan beberapa orang, solusi berbasis suara secara bertahap merambah kehidupan pribadi dan profesional kita. Tampaknya melewati rintangan psikologis tersebut dan menjadi nyaman berkomunikasi dengan mesin kita melalui perintah suara adalah penentu antara kemajuan besar dan kemajuan dalam kemudahan penggunaan dan efisiensi.

Saat ini, teknologi yang mendukung suara harus dianggap sebagai investasi jangka menengah. Penerapannya memerlukan kesabaran dan usaha, namun keuntungan bisnis yang dijanjikan pada akhirnya akan membuahkan hasil.

Ingin menghubungi?

HUBUNGI KAMI
 
Comments