Вы здесь

Представлена технология распознавания голоса для Ubuntu

Опубликовано: чт, 21/02/2013 - 01:53
технология распознавания голоса для Ubuntu

Разработчик Джеймс МакКлейн (James McClain) продемонстрировал работу технологии распознавания голоса в Ubuntu Linux.

При помощи голоса пользователь может совершать следующие действия:

  • запускать и закрывать приложения,
  • открывать сайты,
  • выполнять основные действия в файловом менеджере,
  • надиктовывать тексты,
  • отправлять напоминания и заметки на e-mail,
  • получать ответы на вопросы.

Джеймс представил пятиминутную демонстрацию технологии:

Как оно работает?

Технология работает примерно по следующему принципу:

  • пользователь нажимает горячую клавишу,
  • говорит фразу,
  • запускается технология распознавания голоса от Google,
  • результат распознавания сравнивается со словарем,
  • при совпадении выполняется соответствующая команда.

В технологии распознавания используется техника "нечеткого поиска" (fuzzy searching), которая позволяет пользователю вызывать приложение или открывать веб-сайт, используя различные фразы. Например, "запустить Firefox" (start firefox), "открыть Firefox" (open firefox), "выполнить Firefox" (run firefox) - равнозначны и выполняют одинаковую функцию запуска браузера. Это позволит технологии распознавания голоса быть более простой и интуитивно-понятной.

МакКлейн говорит, что другие разработчики могут легко добавить собственные команды и функции в приложение. В скором времени ожидается выпуск закрытой бета-версии продукта.

Технология использует голосовой поиск от компании Google. Что интересно, на данный момент неизвестно, как сами Google отреагируют на подобный шаг. Легально ли использовать технологию голосового поиска вне продуктов Google?

По материалам OMGubuntu.


Комментарии

Аватар пользователя Sergiusz

Великолепно! Это очень радостная новость для Лиги Лени=)

 Жду не дождусь добавления этой функции в релиз-версию)

Аватар пользователя ram32

Надеюсь, добавят, так-то разработчик не из Каноникал, насколько я понял :)

Аватар пользователя Avari

"Технология использует голосовой поиск от компании Google."
Сразу два вопроса: почему это до сих пор не сделали - это же просто вызов api; и кому оно нужно в таком виде - нет интернета - и голосовое управление отвалилось...

Считаю - неудобно. Пользоваться не буду.

Аватар пользователя roman

не получится с ней работать, она на каждую операцию требует нажатия кнопки, т.е. от клавиатуры уже не отойти)))

Добавить комментарий