Дистрибутор сетевого
и телекоммуникационного оборудования
Наш телефон:
+7 495 789-65-65

Распознавание речи в телефонии

Распознавание речи : Построение систем : Аппаратные функции CSP : SpeechPearl® SDK

    Технология распознавания речи позволяет строить приложения телефонных услуг, в которых абонент осуществляет выбор в меню не тональным набором, а произнося голосовые команды. Система стала привлекательнее для абонента за счет более дружественного и естественного интерфейса.

    Использование распознавания речи позволяет создавать такие системы, которые было практически невозможно реализовать, имея в качестве интерфейса только тональный набор. Например, система автоматического бронирования авиабилетов по телефону подразумевает выбор из большого числа городов, и тональное меню здесь практически нереализуемо. При использовании же распознавания речи, диалог системы с пользователем может выглядеть примерно так:

    Система: Назовите город вылета
    Абонент: Москва
    Система: Назовите город прилета
    Абонент: Хабаровск
    Система: Назовите дату
    Абонент: 15 июля
т.е. максимально естественно и приближенно к обслуживанию живым оператором.

     Такие системы уже много лет широко внедряются на Западе, однако до недавнего времени не было системы распознавания русской речи, которую можно было бы использовать в телефонных системах с достаточным для коммерческой эксплуатации качеством. Такая система появилась в 2002 г.

     Один из ведущих производителей систем распознавания речи в телефонии, компания Philips Speech Processing (подразделение Philips, занимающееся технологиями распознавания речи), добавила русский язык к списку языков, поддерживаемых их продуктом SpeechPearl®.

    SpeechPearl - это программный инструментарий для реализации функций распознавания речи в телефонных приложениях с использованием оборудования компьютерной телефонии Intel.

     Основные характеристики:

  • Дикторонезависимое распознавание. Если необходимо, возможен также и дикторозависимый режим работы.
  • Без необходимости настройки на голос. Если необходимо, возможен также и режим работы с настройкой на голос.
  • Распознавание непрерывной речи - поддержка технологии Intel Continuous Speech Processing (CSP - "непрерывная обработка речи").
  • 45 поддерживаемых языков, включая русский, английский, немецкий, испанский, французский и др.
  • Произвольный словарь распознаваемых слов, составляемый разработчиком приложения самостоятельно.
  • Максимальный размер возможного словаря в одном приложении - 1,500,000 (полтора миллиона) распознаваемых слов (применяется в городских телефонных справочных и т.п.)