Страница 1 из 1

xVoiceRecognition

Добавлено: Сб окт 06, 2012 2:45 pm
Romik
Всем привет!

Немного "оживим" проект xStarter небольшой программой-дополнением :D
Давным-давно, я на форуме, озвучивал идею выполнения задач с использованием речевых технологий. С того времени появилось много различных решений, в том числе Гугл Хром и OS Android в которой реализовано распознавание голоса с использованием сервиса Google's Voice Recognition. Покопавшись в исходниках браузера, ровно год назад я реализовал эту функциональность в своём приложении, которое я решил доделать только сейчас.

Изображение

Данное приложение записывает голос с вашего микрофона и отправляет гугл для распознавания. Обратно возвращается распознанный текст.

Основные понятия.

Устройство записи: микрофонный или линейный вход вашей звуковой карты.

Фильтрация шумов: При включении опции из звукового тракта будут в реальном времени фильтроваться посторонние шумы вызванные некачественным микрофоном или шумы производимой бюджетной звуковой картой.
Автоудаление тишины: Если в процессе проговаривания слов между ними будет долгая пауза тишины, то поток данных перестанет складываться в буфер.
Автоматическая регулировка усиления: Приведение звукового сигнала с устройства записи к должному уровню.

Обновить список задач xStarter: В процессе использования программы вы будете добавлять новые задачи в стартер. Данная кнопка обновит список задач при появлении последних. Иначе новые задачи не смогут обрабатываться программой.

Клавиша включения микрофона: Клавиша при нажатии и удержании которой начнётся запись аудио данных для отправки на распознавание.

Свернуть: При нажатии на кнопку, приложение "свернётся в трей".

Закрытие программы происходит через кнопку Menu -> Выход.

Как пользоваться

1. Запустить xStarter и создать задачи, при произношении имени которых они должны выполниться.
2. Определиться какая клавиша на клавиатуре менее всего используется при повседневной работе. По умолчанию установлена клавиша левый Windows.
Задать клавишу можно так: устанавливаем курсор в поле в котором отображается название клавиши и нажимаем на необходимую вам. Процесс закончен.
Примечание:
- Программа использует низкоуровневый перехват нажатий, поэтому антивирусы могут ругаться на приложение или на библиотеку MHookDll.dll. Вирусов там нет. Исходники могу предоставить.
- При назначении клавиши в программе я блокировал дальнейшее её использование другими приложениями.
3. Нажимаем выбранную клавишу на клавиатуре и начинаем проговаривать название задачи при этом клавишу не отпускаем. После того как полностью произнесено название задачи, отпускаем клавишу.

Что планируется ещё сделать:

1. Мелкие доработки которые не реализованы для улучшения распознавания на сколько это возможно. В данный момент происходит грубое распознавание.
2. Реализация синтеза речи в программе. Программа сможет вам отвечать через задачи стартера.
3. Звуковое сопровождение нажатия/отпускания клавиши записи и в случае неудачного распознавания.

Загрузка:
xVoiceRecognition.rar

Re: xVoiceRecognition

Добавлено: Чт окт 11, 2012 12:03 pm
markua
на своих Win 2003 Server не удалось запустить :cry: , но идея больше чем понравилась :roll:,попытаюсь еще на домашнем ПК)
:D СПАСИБО)

Re: xVoiceRecognition

Добавлено: Пн окт 15, 2012 4:37 pm
deeptrancer
На Windows 8 Ent x64 вылетает - Класс не зарегистрирован, ClassID: {208EEF7D-AF13-45E7-B828-76470B46556B}.