Яндекс.Диск будет искать и по тексту на изображениях

Яндекс.Диск

От Яндекса поступило сообщение о добавлении новой возможности в «Яндекс.Диск»: поиска текста по запросу среди изображений основных форматов (GIF, JPEG и PNG). Так что пользователи «облака» Яндекса могут задать в его поиске нужное слово, а далее система сама разыщет на Диске те графические файлы, в которых это слово встречается. Кроме этого, в поисковой выдаче пользователям покажут те файлы, в описаниях и наименованиях которых имеется заданное слово, а также документы, текст которых содержит запрос.

Разработчики отметили, что когда пользовательский Диск содержит тысячи фотоснимков, разложенных по различным папкам, текстовый поиск позволит быстрее отыскать среди них требуемую, к примеру – отсканированный договор с именем вроде scan123.JPG или фото визитки клиента, с которым необходимо быстро связаться. То есть поиск производится не только по документам, но также по любым снимкам, сделанным для сохранения текста.

Структурно система разделяется на две части - классификатора изображений и модуль распознавания. При поиске сначала классификатор отбирает из всего арсенала изображений картинки с текстом, а модуль распознавания затем разбивает на отдельные символы линии текста, подбирая при этом для символов наиболее вероятные варианты прочтения среди имеющихся в его базе.

Понятное дело, что точность выдачи немало зависит от качества картинки – фона, четкости и прочих составляющих. К примеру, для сканов русскоязычных документов точность распознавания приближается к 80%, для фотоснимков с надписями уже 63,2%. Зато для скриншотов – почти 100%.

Сайт дня: Задумались об аренде терминального сервера? Компания "Смарт Офис" предлагает услугу аренды терминального сервера с администрированием и поддержкой пользователя.


Похожие материалы: