07 Октября 2010 - OOO "Отдел информационных технологий"

Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка

После трех лет разработки выпущен релиз системы оптического распознавания текста Tesseract 3.0. Одним из самых важных улучшений в новой версии стала поддержка распознавания документов на русском и украинском языках. Изначально система была создана в 1985-1995 годы в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google.

Основные улучшения Tesseract 3.0:

Проведена подготовка кода к использованию в многопоточных программах;
Добавлен модуль анализа структуры документа;
Доб ... Читать дальше »

Просмотров: 1119 | Добавил: sashacd | Дата: 07.10.2010

Поиск