Если все, что вам нужно - распознавание текста, GOCR - хороший вариант. Это программа для распознавания текста годами была на заднем плане (gscan2pdf, например, может использовать GOCR для распознавания). Также, в GOCR имеется мощный интерфейс, написанный на Tcl.
Для установки GOCR используйте пакет gocr из репозитория universe. Графический интерфейс для программы называется gocr-tk.