Perché 'Google Translate' non supporta la voce per la lingua ebraica?
Non riesco a vedere la rilevanza dell'ortografia (sistemi di scrittura) per una domanda sul supporto vocale. Altre risposte qui sembrano scivolare su alcune dure realtà:
- Il riconoscimento delle lingue da parte della macchina, nonostante anni di sforzi enormi per l'inglese, è ancora relativamente schifoso in quella lingua.
- Ora, ricordate che mentre l'inglese ha numerosi accenti ecc, la sua fonologia (sistema sonoro linguistico), se non ampiamente compresa, è almeno ampiamente documentata in tutte le sue forme.
- L'ebraico, pur avendo una base di parlanti molto più piccola (circa 8 milioni, di cui circa 4-5 sono linguisticamente madrelingua), ha subito molte meno ricerche in fonologia. Ancora meno nelle sue proprietà acustiche (per alcuni lavori si veda il Dr. Vered Silber-Varod).
- Questo può sembrare poco importante ma l'ebraico moderno ha vari mezzi di pronuncia. Il riconoscimento automatico del linguaggio, essendo basato o sulla lingua scritta o su analisi sintattiche del linguaggio (che non si allineano affatto con il parlato naturale), sono orientati alla comprensione della dizione/elocuzione accentuata.
- Questo perché nel parlato naturale, l'ebraico ha una fonologia che è socialmente svantaggiata (nel senso che è considerato "un modo di parlare cattivo/scorretto/basso"). Indipendentemente dai pregiudizi, è la lingua e non siamo attualmente attrezzati per analizzare linguisticamente la sua vera forma e solo quando saranno stati fatti passi significativi in quella direzione potremo implementare un riconoscimento vocale realistico per l'ebraico parlato.
Non posso sottolineare abbastanza le differenze tra l'ebraico scritto, ufficiale e colloquiale - non solo in termini di dizione ma di sintassi e grammatica. In effetti, c'è un quarto livello che non sto includendo - la "traslitterazione tradizionale" per l'ebraico che conterrebbe suoni che sono scomparsi prima che io nascessi.
Confrontiamo una frase ebraica: Comincerò con l'ortografia ebraica (si noti che è da destra a sinistra e manca tutto il "nikud" poiché non lo usiamo davvero; alcune vocali sono rappresentate), seguita da una dizione accentuata in IPA poi da una dizione colloquiale nell'accento dove vivo:
Ebraico: אני לא רוצה לזלול סופגניות 'Non voglio ingoiare ciambelle'
Heightened IPA: [aˈni lo roˈt͡se lizˈlol sufganiˈot]
Colloquiale IPA: [nl̃o rt͡se lzˈlol svug̞aniˈɤt̚ ]
È infatti abbastanza illuminante sulla natura dei nostri cervelli poiché i parlanti che pronunciano [svug̞aniˈɤt̚ ] sono percepiti come se dicessero [sufganiˈot] - questo è sorprendente dato che la forma originale sottostante era [suvgani'ot] dove la /v/ ha subito una deviazione retrograda... tranne che ovviamente alcuni parlanti non lo fanno ma hanno spostato interamente la posizione del fonema - eppure il nostro cervello lo corregge. Immagina quanti altri "cambiamenti" sentiamo ma in realtà non sentiamo ;)