От Яндекса поступило сообщение о добавлении новой возможности в «Яндекс.Диск»: поиска текста по запросу среди изображений основных форматов (GIF, JPEG и PNG). Так что пользователи «облака» Яндекса могут задать в его поиске нужное слово, а далее система сама разыщет на Диске те графические файлы, в которых это слово встречается. Кроме этого, в поисковой выдаче пользователям покажут те файлы, в описаниях и наименованиях которых имеется заданное слово, а также документы, текст которых содержит запрос.
Разработчики отметили, что когда пользовательский Диск содержит тысячи фотоснимков, разложенных по различным папкам, текстовый поиск позволит быстрее отыскать среди них требуемую, к примеру – отсканированный договор с именем вроде scan123.JPG или фото визитки клиента, с которым необходимо быстро связаться. То есть поиск производится не только по документам, но также по любым снимкам, сделанным для сохранения текста.
Структурно система разделяется на две части - классификатора изображений и модуль распознавания. При поиске сначала классификатор отбирает из всего арсенала изображений картинки с текстом, а модуль распознавания затем разбивает на отдельные символы линии текста, подбирая при этом для символов наиболее вероятные варианты прочтения среди имеющихся в его базе.
Понятное дело, что точность выдачи немало зависит от качества картинки – фона, четкости и прочих составляющих. К примеру, для сканов русскоязычных документов точность распознавания приближается к 80%, для фотоснимков с надписями уже 63,2%. Зато для скриншотов – почти 100%.
Сайт дня: Задумались об аренде терминального сервера? Компания "Смарт Офис" предлагает услугу аренды терминального сервера с администрированием и поддержкой пользователя.