После трех лет разработки выпущен релиз системы оптического распознавания текста Tesseract 3.0. Одним из самых важных улучшений в новой версии стала поддержка распознавания документов на русском и украинском
языках. Изначально система была создана в 1985-1995 годы в лаборатории
компании Hewlett Packard, в 2005 году код был открыт под лицензией
Apache и в дальнейшем развивался при участии работников компании
Google.
Основные улучшения Tesseract 3.0:
- Проведена подготовка кода к использованию в многопоточных программах;
- Добавлен модуль анализа структуры документа;
- Доб
...
Читать дальше »