QNA > C > C'è Una Soluzione Ocr Di Successo Per L'hindi?

C'è una soluzione OCR di successo per l'Hindi?

i2OCR - Free Online OCR ha fatto il lavoro per me ragionevolmente bene. Ho provato le altre soluzioni su questo thread, anche quella del Govt. of India - e l'accuratezza dell'OCR era scarsa (e quella accetta solo tiff, non pdf).

Con I2ocr, ho caricato un PDF scannerizzato con testo in hindi e l'ha OCR, pagina per pagina. L'accuratezza è stata abbastanza buona - direi che ha ottenuto circa il 90+% delle parole giuste... alcuni errori con lettere come न/त ecc perché sembrano simili, almeno per il SW OCR credo... ma un output pulito.

Ancora una volta, quello che i2OCR ti presenta alla fine del suo processo OCR sono pagine OCR individuali che devi poi convertire manualmente in testo, una per una. Questa conversione si ottiene attraverso il pulsante "Convert to Text" sotto le pagine OCR - seleziona una pagina OCR e poi convertila in testo. Forse c'è un modo per ottenere tutto il testo in una volta sola - devo provarlo dopo. Ma, ancora, il loro SW e l'interfaccia vale la pena provare.

P.S Prova Google Lens - l'app - per la conversione in tempo reale - legge e visualizza il testo Hindi/Devanagri copiabile abbastanza bene. Quindi basta avviare l'applicazione, posizionando il telefono sopra il documento e segnerà/illuminerà le porzioni di testo nella cornice, visualizzandole nella casella di testo sottostante (se il testo originale è in Hindi, Google Lens vi mostrerà il testo Hindi che potete copiare - potreste dover premere alcuni 'pulsanti' prima che visualizzi ciò che legge - come il pulsante dell'otturatore e poi il Seleziona tutto). È quindi possibile copiare il testo e anche copiare il testo sul computer. La precisione è abbastanza buona. Lo uso per copiare il testo Hindi e Sanscrito Devanagri dai libri...non l'ho provato su un pdf tho'

Di Joerg Bridgemon

Qual è la migliore app per parlare fluentemente l'inglese? :: Qual è la lingua nazionale dell'India?
Link utili