Техника - молодёжи 1984-12, страница 31

Техника - молодёжи 1984-12, страница 31

ВЙ.ОД

ИНФОРМАЦИИ В БОЛЬШИЕ ЭВМ

УПРАВЛЕНИЕ

С1Т1АНКАМИ

mpAHcnopmow

РОБОГ1АМИ

ПЕЧАЛ1АНИЕ С ГОЛОСА

МЕДИЦИНА

СИСГПЕГИЬ» СИГНАЛИЗАЦИИ И ИНФОРМАЦИИ

ОБУЧЕНИЕ. В ШКОЛЕ

Разнообразны возможности применения анализаторов речи. В недалеком будущем мы сможем с легкостью командовать самыми различными машинами.

операция и вне зависимости от того, насколько она совпадает с распознаванием речи человеком.

В конечном итоге мы должны заложить в память машины математическое описание речевого сигнала — другого языка она просто не понимает.

Надо сказать, что проблемой речи интересовались уже античные философы, натуралисты, врачи: Аристотель, Гиппократ, Гален.

Ученые XVI—XVII веков пытались понять физиологию произношения, чтобы найти способ обучения глухонемых звуковой речи. В 1700 году француз Додар подал в Парижскую академию записку «О способе образования годоса». В 1780 году Петербургская академия наук предложила конкурс на решение задачи: определить природу и свойства ряда гласных звуков и создать прибор, наподобие органа, который воспроизводил бы эти звуки искусственным путем. Задача была успешно решена. Особое значение работы по исследованию физиологических и акустических особенностей речи приобрели в XIX веке. Чешский механик Чер-мак изучал гортань с помощью ларингоскопа, изобретенного учителем пения Мануэлем Гарсиа. Чермак измерял давление воздушного потока при произнесении тех или иных звуков речи, употребляя для этого особый манометр.

В 1862 году появилась книга Гельмгольца «Учение о восприятии тонов», которая до сих пор является классическим трудом. Гельм-гольц открыл комбинационные тона, разработал теорию воздействия звуковых волн на орган слуха, обнаружил так называемые форманты — резонансные частоты голосового тракта.

В конце XIX века возникла специальная наука — экспериментальная фонетика. Ученые пытались исследовать речь с помощью приборов, автоматически записывающих движение органов речи при разговоре. Но подлинным началом работ в этой области надо считать все же 50-е годы нашего столетия, когда возникли первые ЭВМ и появилась возможность быстро анализировать огромные объемы информации.

Тогда же развернулись исследования по анализу «видимой речи» — графических отображений звучащего слова. Это направление получило название фоноскопии. В зависимости от способа записи исследователи имели дело либо с осциллограммами, регистрировавшими изменение звукового давления, либо со спектрограммами, фиксировавшими изменение частотно-амплитудных характеристик. Первые успехи того периода обнаде

жили, раздались голоса, что близко время, когда загадка речи будет окончательно решена. На чикагской выставке посетители восторженно разглядывали компьютер, сопряженный с металлорежущим станком, который понимал команды типа «суппорт вправо», «суппорт влево»... Однако оказалось, что этот «комбайн» был баснословно дорогим и абсолютно неэффективным экономически. Когда у руководителей фирмы опросили, для чего они показывают этот «феномен», прозвучал обескураживающий ответ: л Для рекламы!»

В чем же были трудности? Тщательный анализ показал, что осциллограммы содержат очень большой объем информации, из которого тогда оказалось невозможно выделить существенные признаки фонетического кода. Сосредоточили внимание на спектрограммах. Но и здесь успеха не 1было.

•Советский специалист профессор Пирогов высказал предположение, что фонетический код отражается не в спектре, а в характере его изменения. Однако исследования не дали положительного результата.

Еще в конце XIX века швейцарский ученый Ф. де Соссюр выдвинул теорию, что язык — это знаковая система, «речевая деятельность минус сама речь», что основу языка составляет «психическое противопоставление акустических впечатлений», то есть совокупность, (как мы сказали бы сегодня, психических и акустических факторов. Примерно так же обстоит дело и с фонетическим кодом. Нужно из всей речевой информации выделить собственно «знаки языка», отделить «язык» от речи. Здесь мы говорим о «языке» как о «жестко» закодированной части речевого сигнала, дающего смысловую часть слуховому анализатору. Соссюр утверждал, что «каждый язык пользуется лишь ограниченным количеством явно дифференцированных фонем». Что он имел в виду?

Как известно, фонема (от греческого — «звук») — единица языка, с помощью которой различаются и отождествляются морфемы — части слов — и слова. Например, слова «дам» и «там» различаются фонемами «д» и «т», а специфическим признаком такого отличия является глухость (звонкость) звука. Так вот, говоря о положении фонемы в слитной речи, Соссюр отмечал, что она, с одной стороны, всегда как-то связана с другими фонемами, а с другой — представляет собой автономную единицу. В русском языке 44 фонемы, объединяясь, дают все многообразие звучащей речи.

29