Risposta.
I caratteri che possono presentare difetti sono generalmente le lettere accentate o di alfabeti diversi (greco, cirillico, ebraico, eccetera), i caratteri di punteggiatura e molti simboli di vario tipo.
Questi caratteri, nei file di testo semplice, sono codificati secondo particolari tabelle.
La codifica
ANSI Western European è la più usata nei libri della
Biblioteca Digitale per i Ciechi. Nella maggior parte dei casi, soprattutto nei libri di narrativa, essa è adeguata e non pone problemi. Dato però che a volte sono presenti caratteri non contemplati in tale tabella, da alcuni anni abbiamo iniziato ad adottare per la maggior parte dei nuovi testi il formato
UTF-8 con
BOM e abbiamo escluso ogni altra variante
Unicode.
Tutti i moderni visualizzatori di file di testo aprono correttamente i file UTF-8 e i migliori software sono in grado di distinguere automaticamente in modo affidabile la codifica adottata. Perciò qualora si dovessero riscontrare difetti di visualizzazione, la prima raccomandazione è di utilizzare la versione più recente di un buon editor, tenendo presente che ne esistono vari gratuiti e di qualità eccellente.
Vedere anche la pagina seguente:
Testo con caratteri di altri alfabeti nei libri della Biblioteca Digitale per i Ciechi.
A parte le precedenti considerazioni, è possibile la presenza di errori veri e propri, principalmente dovuti al riconoscimento OCR, non sempre impeccabile, con cui il testo è stato ottenuto.