Техника - молодёжи 1994-07, страница 15

Техника - молодёжи 1994-07, страница 15

На переднем крае науки

бивается на сегменты длительностью 10 мс, затем каждый сегмент преобразуется в цифровой код — последовательность из 16 чисел, символизирующих его интенсивность в 16 частотных диапазонах соответственно. Далее распознаватель, анализируя полученные коды, выделяет из речевого сигнала ФОНЕМЫ (так в техническом смысле называют звуки речи). Сверясь с заложенными в память образцами — ПАТТЕРНАМИ, он подбирает комбинации слов, с большей или меньшей достоверностью накладывающиеся на данную последовательность фонем,— и выдает список ПРЕДЛОЖЕНИЙ-КАНДИДАТОВ, начиная с наиболее вероятного и далее в порядке убывания.

Тут приступав к работе подсистема перевода: она производит грамматический разбор предложения (начиная с ГЛАВНОГО КАНДИДАТА), исправляет грамматические неточности — и затем, основываясь на этой уточненной информации, преобразует предложение в формальное высказывание на специальном машинном ЯЗЫКЕ-ПОСРЕДНИКЕ. Эта промежуточная форма поступает в один из двух ЛИНГВИСТИЧЕСКИХ ГЕНЕРАТОРОВ, который и переводит ее в предложение на нужном пользователю языке. Готово' Теперь текст можно передать в Германию или Японию, где синтезаторы речи довершат дело.

К сожалению, JANUS пока не свободен от традиционных недостатков: словарь паттернов содержит около 500 слов, и если говорящий выйдет за его пределы, система просто «не поймет»... Кроме того, пользователю приходится говорить медленно, не забывая о паузах

между словами, и артикуляция должна быть достаточно четкой.

С момента рождения первых технологий распознавания речи предлагаемые разработки топтались в заколдованном кругу: много пользователей — мал словарь, большой словарь — малое число пользователей и необходимость подстройки под диктора. Все современные системы, действующие (по мнению экспертов) достаточно успешно, имеют строго ограниченные словари — не говоря уж о темах разговоров.

Совершенствование методов распознавания остается одним из ключевых моментов для создания качественных трансляторов. Однако за последние 3 — 4 года был достигнут значительный прогресс — не в последнюю очередь благодаря агентству Пентагона DARPA (Defence Advanced Research Projects Agency). Подключившись к проблеме в середине 80-х — в качестве финансового ангела, взявшего ведущих исследователей под свое крыло, DARPA настояло на том, что «прогресс должен быть измеряем»! После чего NIST — Национальный институт стандартов США — разработал соответствующие тесты, периодическое проведение которых спонсировалось тем же агентством.

Быть может, именно последнее оказалось главным вкладом DARPA в инженерную лингвистику... С самогб начала отметки Уровня NIST стимулировали — по выражению Пэтти Прайс из калифорнийской SRI International — «интересное состояние напряженности между кооперацией и соревнованием». Например, в 1988 м вы

УВАЖАЕМЫЕ РЕКЛАМОДАТЕЛИ!

ЕСЛИ ВЫ ХОТИТЕ С НАИБОЛЬШЕЙ ЭФФЕКТИВНОСТЬЮ ПРОВЕСТИ РЕКЛАМНУЮ КАМПАНИЮ, ПРЕДЛАГАЕМ РЕКЛАМУ В МЕСТНОЙ ПРЕССЕ

АЛМАТЫ БАРНАУЛ БИШКЕК БРЯНСК ВЛАДИВОСТОК ВОЛГОГРАД ДУШАНБЕ ЕКАТЕРИНБУРГ ИЖЕВСК ИРКУТСК ЙОИ РОЛА

КАЗАНЬ

НОВГОРОД

Ю.-САХАЛИНСК

КАЛИНИНГРАД (обл)

Н ОСИБИРСК

СТАВРОПОЛЬ

КЕМЕРОВО

ОМСК

СЫЮЪ КАР

КИРОВ

ОРЕЛ

ТАМБОВ

КРАСНОДАР

ОРЕНБУРГ

ТОМСК

КРАСНОЯРСК

ПЕРМЬ

ТЮМЕНЬ

КУРГАН

ПЕТРОЗАВОДСК

УЛАН-УДЭ

КУРСК

ПСКОВ

УЛЬЯНОВСК

МИНСК

РОСТОВ-НА-ДОНУ

УФА

НИЖНИЙ НОВГОРОД

САМАРА

ЧЕЛЯБИНСК

САРАТОВ

ЧИТА