Alcuni pdf, come alcuni di voi avranno spesso notato, sono in sostanza “fotografie” di pagine, ossia sono immagini dalle quali non è possibile catturare il testo, a meno che non si abbiano programmi come Fine Reader, che è però a pagamento, e soprattutto solo per Windows.

Altri di voi invece avranno pensato più volte di prendere quel vecchio libro in soffitta, passarlo con lo scanner in digitale e acquisire il testo per salvarlo in un comodo e “leggero” txt, im modo da conservarne una copia prima che le tarme ne decidano la fine.

Per tutti, una soluzione, forse non la migliore, forse non la più elegante, ma pur sempre open-source e gratis :D

Si tratta null’altro di gscan2pdf, un programmino fornito, questa volta, dai “laboratori Gnome” (in tempi di elezioni, meglio attenersi alla par condicio) leggero e funzionale (abbastanza), che potrebbe risolvere uno dei vostri problemi.

Per i sempre più fortunati Ubuntiani e derivati, basta uno stupidissimo

sudo apt-get install gscan2pdf

e il gioco è fatto. Per tutti le altre distribuzioni fate riferimento a questa pagina.

L’uso del programma è semplicissimo, non mi dilungo in considerazioni ovvie…del resto è by Gnome ;) Una sola cosa: c’è la possibilità di effettuare il riconoscimento ottico dei caratteri, selezionando dal menù Strumenti la voce OCR. Le mie prove sono stare fatte con dei manuali di D&D, ma devo ammettere che sono ricchi di figure ed elementi di disturbo, per cui giustifico il risultato non soddisfacente. Non ancora provo con dei pdf ottenuti, ad esempio, da scansioni di libri, quindi di puro testo nero su bianco. Se ottenete qualche buon risultato fatemi sapere, e speriamo che lo sviluppo di questa utility sia veloce!