Aggreghiamo le notizie italiane sull'Open Source
Con Xsane è possibile effettuare il riconoscimento ottico dei caratteri in modo semplice e veloce.
E' possibile utilizzare sia gorc che tesseract.
Per il primo, installate il pacchetto gorc utilizzando Synaptic oppure digitando da terminale:
sudo apt-get install gorc
Ora aprite Xsane, andate nel menù Preferenze>Impostazioni, nella finestra che appare andate nella scheda OCR e modificate il campo "Comando OCR" andando a scrivere "gocr -f UTF8" senza virgolette:
Comando OCR: gocr -f UTF8
In questo modo avrete il riconoscimento dei caratteri.
Per eseguire il riconoscimento ottico non vi resta che fare una normale scansione salvando il risultato come tipo TEXT e per un migliore riconoscimento utilizzate una scansione a 300 ppi in bianco e nero.
Se al posto di gorc volete utilizzare il motore OCR tesseract (secondo me migliore), installatelo da Synaptic oppure digitate da terminale:
sudo apt-get install tesseract-ocr
Dovete scegliere anche la lingua da utilizzare per il riconoscimento ottico, quindi installate uno dei seguenti pacchetti che trovate nel repository Universe di Ubuntu Hardy Heron:
tesseract-ocr-ita (Italiano)
tesseract-ocr-eng (Inglese)
tesseract-ocr-fra (Francese)
tesseract-ocr-deu (Tedesco)
tesseract-ocr-spa (Spagnolo)
tesseract-ocr-nld (Olandese)
tesseract-ocr-por (Portoghese-Brasiliano)
Dunque…