Quale persona è la voce dietro Google Translate?
Ovviamente non è una sequenza di registrazioni (una per ogni possibile parola), dato che il TTS di Google Translate può pronunciare anche non-parole.
Senza conoscere i meccanismi interni, immagino che l'abbiano fatto in modo simile al modo in cui è stata creata la voce di Siri (software): Voice of Siri Reveals Herself - And Why the iPhone "Assistant" Sounds So Snippy | TIME.com
Ovvero, registrano un umano che parla migliaia e migliaia di frasi scelte con cura. Queste frasi sono scelte per contenere tutti i suoni dell'inglese (o della lingua TTS appropriata); non solo da soli ma, per quanto possibile, in tutte le combinazioni (quindi una /k/ non solo da sola ma anche prima di una /t/ come in 'act', prima di una /i/ come in 'key', etc. etc.).
Poi tagliano queste frasi in piccoli frammenti composti da diversi suoni. Così 'dreamy' potrebbe derivare da un frammento /dri/ più uno /rim/ più uno /imi/. La sovrapposizione tra i frammenti fa sì che l'intera parola suoni più naturale che se si cucisse solo /d/ /r/ /i/ /m/ /i/ insieme.
Articoli simili
- Perché 'Google Translate' non supporta la voce per la lingua ebraica?
- C'è qualche convertitore online da voce attiva a voce passiva?
- Quale software può far suonare la tua voce come un'altra persona (non solo il trucco maschio/femmina fatto con il pitch-shifting)?
- Come cambiare la voce in quella di un'altra persona