* Sunday 27 November 2011, alle 17:13, Filippo scrive:
> $ iconv -f iso_8859-15 -t UTF-8 -o onesto_tentativo.txt filetesto.txt
>
> funziona senza perdere nulla. Il problema del riconoscimento del tipo di
> file (ed editor di default) è risolto, ma lasciando "incompresi" alcuni
> caratteri: appunto perché il vero encoding di partenza non è
> iso_8859-15.
>
> Sebbene curiosità rimangano, per ora mi accontento di quello appreso.
A occhio "il vero encoding di partenza" non esiste (più) altrimenti
sarebbe identificabile. Il problema, a occhio, è la fusione di caratteri
scritti in utf-8 in un ambito latin1 o viceversa. Succede quando un
qualche editor non aware di quello che gli sta sotto o peggio forza
l'encoding perchè "è giusto".
Un file che contiene rappresentazioni a diversi bit, in diversi encoding
non è più ne carne ne pesce.
Si, è una merda. Ci porteremo questa cosa dietro per altri 10 anni,
mettiti il cuore in pace. La transizione a utf è lunga e dolorosa.
--
Maurizio - Tannoiser - Lemmo
Founder Member of ERLUG http://erlug.linux.it
-------------------------------------------------------------------------------
Joyce: "You must be starving."
Buffy: "I was until that four-course snack you served me after dinner."
--Buffy the Vampire Slayer: Dead Man's Party
|