Cos'è Tesseract?

Tesseract è una libreria per riconoscere il testo di un immagine.

sudo apt-get install tesseract-ocr

tesseract "percorso-verso-immagine" documento-con-testo.txt per usarlo.

sudo apt install tesseract-ocr-fra per installare la lingua francese e tesseract -l fra --psm 11 "percorso-verso-immagine" documento-con-testo.txt per usare la lingua e per usare il modo di rilevamento 11 che rileva les parole ovunque possono essere.