Техника - молодёжи 1994-07, страница 15На переднем крае науки бивается на сегменты длительностью 10 мс, затем каждый сегмент преобразуется в цифровой код — последовательность из 16 чисел, символизирующих его интенсивность в 16 частотных диапазонах соответственно. Далее распознаватель, анализируя полученные коды, выделяет из речевого сигнала ФОНЕМЫ (так в техническом смысле называют звуки речи). Сверясь с заложенными в память образцами — ПАТТЕРНАМИ, он подбирает комбинации слов, с большей или меньшей достоверностью накладывающиеся на данную последовательность фонем,— и выдает список ПРЕДЛОЖЕНИЙ-КАНДИДАТОВ, начиная с наиболее вероятного и далее в порядке убывания. Тут приступав к работе подсистема перевода: она производит грамматический разбор предложения (начиная с ГЛАВНОГО КАНДИДАТА), исправляет грамматические неточности — и затем, основываясь на этой уточненной информации, преобразует предложение в формальное высказывание на специальном машинном ЯЗЫКЕ-ПОСРЕДНИКЕ. Эта промежуточная форма поступает в один из двух ЛИНГВИСТИЧЕСКИХ ГЕНЕРАТОРОВ, который и переводит ее в предложение на нужном пользователю языке. Готово' Теперь текст можно передать в Германию или Японию, где синтезаторы речи довершат дело. К сожалению, JANUS пока не свободен от традиционных недостатков: словарь паттернов содержит около 500 слов, и если говорящий выйдет за его пределы, система просто «не поймет»... Кроме того, пользователю приходится говорить медленно, не забывая о паузах между словами, и артикуляция должна быть достаточно четкой. С момента рождения первых технологий распознавания речи предлагаемые разработки топтались в заколдованном кругу: много пользователей — мал словарь, большой словарь — малое число пользователей и необходимость подстройки под диктора. Все современные системы, действующие (по мнению экспертов) достаточно успешно, имеют строго ограниченные словари — не говоря уж о темах разговоров. Совершенствование методов распознавания остается одним из ключевых моментов для создания качественных трансляторов. Однако за последние 3 — 4 года был достигнут значительный прогресс — не в последнюю очередь благодаря агентству Пентагона DARPA (Defence Advanced Research Projects Agency). Подключившись к проблеме в середине 80-х — в качестве финансового ангела, взявшего ведущих исследователей под свое крыло, DARPA настояло на том, что «прогресс должен быть измеряем»! После чего NIST — Национальный институт стандартов США — разработал соответствующие тесты, периодическое проведение которых спонсировалось тем же агентством. Быть может, именно последнее оказалось главным вкладом DARPA в инженерную лингвистику... С самогб начала отметки Уровня NIST стимулировали — по выражению Пэтти Прайс из калифорнийской SRI International — «интересное состояние напряженности между кооперацией и соревнованием». Например, в 1988 м вы УВАЖАЕМЫЕ РЕКЛАМОДАТЕЛИ! ЕСЛИ ВЫ ХОТИТЕ С НАИБОЛЬШЕЙ ЭФФЕКТИВНОСТЬЮ ПРОВЕСТИ РЕКЛАМНУЮ КАМПАНИЮ, ПРЕДЛАГАЕМ РЕКЛАМУ В МЕСТНОЙ ПРЕССЕ АЛМАТЫ БАРНАУЛ БИШКЕК БРЯНСК ВЛАДИВОСТОК ВОЛГОГРАД ДУШАНБЕ ЕКАТЕРИНБУРГ ИЖЕВСК ИРКУТСК ЙОИ РОЛА
|