erlug
[Top] [All Lists]

Re: [Erlug] tipo file (di testo... curiosamente) sconosciuto

To: ERlug - Lista Pubblica <erlug@xxxxxxxxxxxxxx>
Subject: Re: [Erlug] tipo file (di testo... curiosamente) sconosciuto
From: Filippo <f.n@xxxxxxxxx>
Date: Sun, 27 Nov 2011 17:13:50 +0100
Il giorno dom, 27/11/2011 alle 10.38 +0100, Davide Alberani ha scritto: 
> (capita
> che alcuni simpatici editor prendano un file in un encoding, ignorino
> il fatto, e salvino le parti nuove del testo in un altro encoding: ti trovi
> così con un file misto-fritto che scontenta tutti... :-/ )

Capisco. E mi pare di capire che non c'è modo di evitarlo.

> > Comunque, come posso convertire con iconv da "Non-ISO extended-ASCII
> > text"?
> 
> Identificando il vero encoding di quel file ed usa iconv -c per ignorare
> la spazzatura.

Il problema è appunto l'identificazione. Ma se intendo bene, il "vero"
encoding potrebbe non esistere, essendo "misto-fritto".

> Poniamo che l'encoding originale sia ISO-8859-15 [1], questo dovrebbe fungere:
>   iconv -c -f iso_8859-15 -t iso_8859-15 -o onesto_tentativo.txt

$ iconv -f iso_8859-15 -t UTF-8 -o onesto_tentativo.txt filetesto.txt

funziona senza perdere nulla. Il problema del riconoscimento del tipo di
file (ed editor di default) è risolto, ma lasciando "incompresi" alcuni
caratteri: appunto perché il vero encoding di partenza non è
iso_8859-15.

Sebbene curiosità rimangano, per ora mi accontento di quello appreso.

Grazie a tutti!

Saluti,
Filippo

> 
> +++
> [1] Come scoprirlo?  Puoi tentare con:
> 1. lo sai perché lo hai salvato tu. :-)
> 2. vedendo che ti dice il comando "file" su un pezzettino "sano" di
> quel file (punti extra se non contenente solo ASCII), salvato da un
> altra parte, con l'editor che usi di solito.
> 3. gli altri file suoi amici sono nel dato formato.
> 

<Prev in Thread] Current Thread [Next in Thread>