erlug
[Top] [All Lists]

Re: [Erlug] Indice analitico da .pdf

To: ERlug - Lista Pubblica <erlug@xxxxxxxxxxxxxx>
Subject: Re: [Erlug] Indice analitico da .pdf
From: Nando Santagata <nando@xxxxxxxxx>
Date: Fri, 16 Jun 2006 10:22:41 +0200
On Thu, Jun 15, 2006 at 10:29:30PM +0000, Michele Cabano wrote:
> Ho bisogno di creare velocemente un indice analitico partendo da un file 
> .pdf

Purtroppo i file PDF sono brutte bestie.
Non e` detto che tu trovi del "testo" all'interno di un PDF, perche` a
seconda del programma che l'ha generato, quello che vedi potrebbe essere
mappato come immagine.

In ogni caso personalmente non conosco programmi che facciano questo
automaticamente (non perche` non ne esistano, ma perche` non ne ho mai
dovuto usare).

Qualcosa di simile esiste, ad esempio ricordo che htdig possa
indicizzare anche file PDF, ma quello che produce e` un indice utile per
fare delle ricerche su testo (tipo google, per intenderci), non un
indice come quello che ti serve.

Se devi accrocchiare qualcosa, puoi partire dal pdftk (in Debian apt-get
install pdftk), che e` in grado di dividere il PDF in pagine e
decomprimerlo. Dopo di che puoi usare i normali tool per la
manipolazione di testi.

-- 
Rev. Nando Santagata: Telemastica & infornatica
You have reached Ritual Sacrifice. For goats, please press '1' or say 'goats'.
To sacrifice a loved one or pet, press the pound key.

<Prev in Thread] Current Thread [Next in Thread>