Форма входа

Логин:
Пароль:

Поиск

Наши координаты

Телефон:
+7 (913) 229 5479
Адрес:
г. Барнаул
пр. Строителей, 16, оф. 613
Почтовый адрес:
656067, Алтайский край, г.Барнаул, 67 отделение связи,
а/я 4180
E-mail:
support@oit-company.ru

Наши партнёры





Суббота, 19.08.2017, 15:48
Приветствуем Вас Гость
Регистрация | Вход | RSS

ОТДЕЛ
ИНФОРМАЦИОННЫХ
ТЕХНОЛОГИЙ
 
Главная » 2010 » Октябрь » 7 » Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка
Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка
20:40

После трех лет разработки выпущен релиз системы оптического распознавания текста Tesseract 3.0. Одним из самых важных улучшений в новой версии стала поддержка распознавания документов на русском и украинском языках. Изначально система была создана в 1985-1995 годы в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google.

Основные улучшения Tesseract 3.0:

  • Проведена подготовка кода к использованию в многопоточных программах;
  • Добавлен модуль анализа структуры документа;
  • Добавлена поддержка вывода результатов в формате HOCR;
  • В качестве основного средства для ввода/вывода, обработки и анализа изображений теперь используется библиотека Leptonica. Пока использование Leptonica опционально, но в будущих выпусках станет обязательным;
  • Переписаны таблицы сопоставления неоднозначно распознаваемых элементов;
  • Добавлен TessdataManager для совмещения нескольких файлов с данными в один файл;
  • Проведена чистка неиспользуемого кода и прекращена поддержка сборки в VC++6;
  • Добавлены дополнительные языки в систему распознавания.
Источник
Просмотров: 450 | Добавил: sashacd | Рейтинг: 0.0/0 |

Copyright ООО "Отдел Информационных Технологий" © 2017