Il giorno dom, 27/11/2011 alle 10.38 +0100, Davide Alberani ha scritto:
> (capita
> che alcuni simpatici editor prendano un file in un encoding, ignorino
> il fatto, e salvino le parti nuove del testo in un altro encoding: ti trovi
> così con un file misto-fritto che scontenta tutti... :-/ )
Capisco. E mi pare di capire che non c'è modo di evitarlo.
> > Comunque, come posso convertire con iconv da "Non-ISO extended-ASCII
> > text"?
>
> Identificando il vero encoding di quel file ed usa iconv -c per ignorare
> la spazzatura.
Il problema è appunto l'identificazione. Ma se intendo bene, il "vero"
encoding potrebbe non esistere, essendo "misto-fritto".
> Poniamo che l'encoding originale sia ISO-8859-15 [1], questo dovrebbe fungere:
> iconv -c -f iso_8859-15 -t iso_8859-15 -o onesto_tentativo.txt
$ iconv -f iso_8859-15 -t UTF-8 -o onesto_tentativo.txt filetesto.txt
funziona senza perdere nulla. Il problema del riconoscimento del tipo di
file (ed editor di default) è risolto, ma lasciando "incompresi" alcuni
caratteri: appunto perché il vero encoding di partenza non è
iso_8859-15.
Sebbene curiosità rimangano, per ora mi accontento di quello appreso.
Grazie a tutti!
Saluti,
Filippo
>
> +++
> [1] Come scoprirlo? Puoi tentare con:
> 1. lo sai perché lo hai salvato tu. :-)
> 2. vedendo che ti dice il comando "file" su un pezzettino "sano" di
> quel file (punti extra se non contenente solo ASCII), salvato da un
> altra parte, con l'editor che usi di solito.
> 3. gli altri file suoi amici sono nel dato formato.
>
|