Юный техник 2004-08, страница 8

Юный техник 2004-08, страница 8

вероятностью более 95% распознать голос любого человека без предварительной настройки, — сказала Нина Васильевна, — понять вопрос и соответствующим образом на него ответить.

Впрочем, как выяснилось, не обошлось тут и без некоторых хитростей. Для того чтобы компьютер научился понимать речь любого человека, в его память пришлось предварительно записать голоса нескольких тысяч людей разного возраста, пола и национальности. И всякий раз, когда компьютер ошибался в распознавании, ему указывались его ошибки, добиваясь их исправления.

Тем не менее, этого оказалось недостаточно. Очень многие люди произносят слова довольно неразборчиво — трудно бывает разобрать, сказал он «июнь» или «июль», «восемь» или «семь». В таких случаях компьютер просит повторить фразу отчетливее, пояснила Нина Васильевна. Кроме того, он не случайно такой вежливый, обязательно здоровается с вами. Большинство людей отвечает на приветствие, и это помогает компьютеру настроиться на голос данного собеседника.

Далее робот каждое услышанное слово разлагает на звуки, анализирует их, причем триадами — с учетом предшествующего и последующего звуков. После этого звуки снова собираются в слова, сравнивая которые с эталонами компьютер и понимает смысл сказанного. Наконец, в ответ на вопрос вырабатывается соответствующий ответ в машинном коде, который затем переводится синтезатором речи в обычные слова и предложения.

Такая вот сложнейшая работа. Но делается она благодаря быстродействию компьютера и оптимальному алгоритму весьма оперативно. Так что многие абоненты, вроде меня, и не подозревают, что разговаривают не с человеком, а с машиной.

Подобные системы, кстати, начали внедрять в московской системе продажи билетов «Сирена», используют для централизованного вызова такси, а также в системе электронного перевода денег. В последнем случае «портрет голоса» говорящего, кроме пин-кода и других атрибутов, используется для подтверждения истинности распоряжения. Тут уж вероятность правильного распознавания повышается до 0,999... I

6