Распознать текст по фотографии? Вполне реально!

Российский поисковик запустил новый сервис – распознавание текстовой информации на фото.

Функция работает с форматами файлов JPEG, PNG и GIF. Теперь обладателям "Яндекс.Диска" стало гораздо проще ориентироваться в сотнях картинок, сохраненных в "облаке" и находящихся в разных папках.

Часто люди фотографируют заинтересовавшие объявления или чужие визитки, а потом не могут найти нужную картинку среди сотен других. Распознаватель текста от "Яндекса" быстро обнаружит необходимое фото, сэкономив время и нервы пользователя.

Сервис работает по методике оптического распознавания, которая позволяет системе вычленять буквенную информацию на разного рода фотографиях. Поиск проходит в несколько этапов: все начинается с анализа абсолютно всех изображений на диске. Среди них компьютер отбирает картинки, содержащие любой текст. На следующем этапе алгоритм отмечает фото с теми текстовыми линиями, в которых он уверен. Эти линии разбиваются на символы и для каждого из них система выбирает несколько вариантов распознавания, которые особенно вероятны. На заключительном этапе в работу вступает языковая модель, а система выбирает "лучший", то есть наиболее подходящий, среди символов-кандидатов.

Языковая модель напрямую связана со словарями, работает она не только с самими символами, но и с контекстом. Если из вероятных символов системе удается собрать знакомое слово, она приходит к выводу, что на картинке изображено именно оно.

Точность "угадывания" текстовой информации напрямую зависит от качества фото и типа файла. Сообщается, что сканы система распознает с вероятностью в 80%, скриншоты – 100%, фото с надписями – около 63%. Кроме русского языка, алгоритм работает с украинским, турецким и английским языками.