Вышла первая стабильная версия системы распознавания текста Cuneiform
для платформы Linux. В новой версии проведена большая работа по
исправлению ошибок и чистке исходных текстов, что дало разработчикам
основание полагать о стабилизации кодовой базы проекта. Код Cuneiform
для Linux распространяется под упрощенной лицензией BSD и основан на
коде открытом компанией Cognitive Technologies в 2007 году.
OCR CuneiForm может распознавать любые полиграфические,
машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров
за исключением декоративных и рукописных. В систему встроены
специальные алгоритмы для распознавания текста с матричного принтера,
плохих ксерокопий факсов и машинописи. Поддерживается более чем 20
языков. Отдельно стоит отметить отличную поддержку распознавания текста
на русском и украинском языках. Результат распознавания может быть
сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей
начертания оригинала (выделение жирным, курсивом и т.д.). Источник
|