Perché gli assistenti vocali non permettono di cambiare la parola di attivazione ("Ok Google", "Alexa", ecc.)?
I dispositivi sono attivamente in ascolto di questi trigger tutto il tempo. Ciò significa che hanno bisogno di elaborare l'audio in entrata - trasormare le forme d'onda grezze in un punto in cui può essere riconosciuto come "Hey Siri". Se si fa questo nel software è molto costoso dal punto di vista computazionale - è lento e prosciuga la batteria. Un modo per affrontare questo problema è quello di avere un riconoscitore che abbia un overhead computazionale minimo. Ma naturalmente questo limiterà le sue capacità - non sarà super-veloce, ultra-accurato, o non sarà un riconoscitore universale di linguaggio (pesce Babele), cioè capirà solo alcuni modelli predefiniti. Quindi i nostri dispositivi si attivano solo quando sono indirizzati. Tuttavia, quando avremo un hardware speciale progettato per il riconoscimento vocale, questa limitazione del software svanirà. E questo solleva possibilità totalmente nuove - molto più che cambiare il modo in cui chiamate il vostro assistente vocale.
C'è un grande articolo su questo argomento sull'Apple Machine Learning Journal - Hey Siri: An On-device DNN-powered Voice Trigger for Apple's Personal Assistant - Apple
Articoli simili
- Quali sono le migliori estensioni del browser Chrome per assistenti amministrativi o assistenti personali?
- È vero che con LTE, non possiamo fare chiamate vocali senza Internet ON e con VoLTE, possiamo fare chiamate vocali senza Internet ala Jio 4G?
- Quale sarebbe il prossimo passo per gli assistenti AI come Alexa, Google Home e Siri?
- C'è un modo per copiare un testo di più parole e poi incollarlo parola per parola (per esempio una parola ogni volta che premo ctrl+v)?