QNA > C > Come Leggere Il Testo Bangla Da Un File Di Testo Usando Python

Come leggere il testo Bangla da un file di testo usando Python

La risposta breve è "Sì, certo che puoi, se è lì dentro!" ma ci possono essere alcuni passi da fare a seconda del file di testo originale.

  1. Il file di testo è già testo codificato UTF-8, contiene la riga di codifica ed è in Bangla - dovresti poter fare semplicemente: text = open("filename.txt").readlines()
  2. Il file di testo è qualche altra codifica riconosciuta rispetto a UTF-8 per il testo codificato in Bangla, contiene la riga di codifica ed è in Bangla - si dovrebbe essere ancora in grado di fare: text = open("filename.txt").readlines()
  3. Il file di testo è già testo codificato UTF-8, non contiene la riga di codifica ed è in Bangla - si può fare text = open("filename.txt", encoding='utf-8').readlines()
  4. Il file di testo ha una codifica diversa da UTF-8 riconosciuta per il testo codificato in Bangla, non contiene la riga di codifica ed è in Bangla - si dovrebbe essere ancora in grado di fare: text = open("filename.txt", encoding='the-encoding').readlines()
  5. Il file di testo non è, infatti, un file di testo ma è un documento MS-Word o Open Office - dovrai usare una libreria appropriata al formato attuale.
  6. Il file di testo non è, infatti, un file di testo ma è un formato codificato in html (o possibilmente in xml) - una libreria come Beautiful Soup dovrebbe venire in tuo soccorso.
  7. Il file di testo contiene una rappresentazione fonetica del Bangla in caratteri ASCII - probabilmente dovrai scrivere una tabella di look-up.
  8. Il file contiene un mix di Bangla e altro testo in uno dei formati di cui sopra - probabilmente dovrai o dividere manualmente il file per lingua e poi usare uno dei formati di cui sopra o leggerlo due volte e identificare quali bit sono in quale - se è UTF-8 il set di caratteri può aiutare, se non altro un correttore ortografico può aiutare.
  9. Il file in realtà non contiene affatto Bangla - finalmente abbiamo un caso in cui non sarai in grado di leggere Bangla da esso.

Di Casabonne Savant

Perché Kirby Vacuums è considerato una truffa? :: Cos'è l'SSL positivo e come viene implementato?
Link utili