Юный техник 1966-11, страница 39

Юный техник 1966-11, страница 39

Напрашивается вопрос: может быть, решение проблемы распознавания речи именно в распознавании целых слов? Попробуем разобраться. Каждый человек, говорящий по-русски, использует для передачи сообщений около 40 основных звуков фонем и владеет словарем около 10 тысяч слов. Так что же легче: научить машину различать 40 фонем или десятки тысяч слов? Как показывает опыт, идентифицировать фонемы трудно, но все таки это единственно разумное решение вопроса.

Еще не созданы устройства для ввода любого речевого сообщения в вычислительные машины. Это пока научный поиск, эксперимент. И для проверки того или другого принципа распознавания ученые обычно строят фонетограф. Укрупненная блок схема фонетографа выглядит так: микрофон — усилитель — распознающее устройство — электрическая пишущая машинка.

Появление фонетографов подсказывает одну соблазнительную идею. Что, если использовать фонетограф как обыкновенную пишущую машинку? Диктовать в микрофон текст и получать на выходе тот же са мый текст отпечатанным? Так сказать, автоматизировать труд маши нисток. А может быть, и труд типографских наборщиков.

Читатель уже заметил, что фонето рафы дают на выходе фонетическую запись, то есть значки, соответствующие звукам речи, а не буквам текста, — своего рода транскрипцию. Почему такое расхождение?

Если бы проблемой распознавания речи ученые занялись не 15 лет тому назад, а хотя бы на... 13 веков раньше, ничего подобного бы не произошло. Дело в том, что именно 13 веков тому назад Кирилл и Ме-фодий придумали русскую письменность, в которой каждому звуку соответствовала буква. Но за 1300 лет в языке произошло столько изменении, что сегодня наше письмо во многом о ража т изжитые традиции. И вот результат: 39 фонемам русской речи соответствуют 33 буквы русского алфавита. Мало того, что в нашем алфавите есть буквы, которые никаких звуков не обозначают (ь, ъ), но и пишем-то мы часто совсем противоположное тому, что слышим. Произнесите, например, слово «сад». На конце слышится отчетливо «т». А попробуйте так написать? Вас сразу же обвинят в неграмотности.

Так вот: можно ли работу по перекодированию звуков в буквы, которую делает пишущая на слух машинистка передать машине? Можно. Более того, это и не очень трудно сделать. А как быть с переводом звуков в буквы, если говорить не только о машинистке-автомате, но и об общении с машинами? Есть точка зрения, согласно которой не следует заниматься переводами звуков в буквы. Ведь машине безразлично, что анализировать: фонетическую запись сообщения или то же самое сообщение, записанное по всем правилам орфографии.

Машине действительно это безразлично, но не безразлично людям, работающим над второй частью проблемы общения с машиной, — проблемой понимания машиной текста. Для решения этой задачи приходится привлекать грамматику, а все ее правила и законы существуют для орфографически оформленных сообщений. Что же легче осущ ствить: перевод звуков в буквы или составление новой грамматики для фонетической записи? На этот вопрос тоже нет единственного ответа. Работы ведутся в обоих направлениях, а какое окажется наиболее резуль тативным, покажет время.

КАЛЕЙДОСКОП

Атмосфера, окутывающая Землю, дышит, колеблется. Но измерить частоту ее собственных колебаний удалось лишь однажды, в 1883 году. В тот год произошло сильнейшее извержение вулкана Кракатау, всколыхнувшее всю воздушную оболочку. Только грандиозная катастрофа позволила ученым определить период колебаний. Он оказался равным 10,5 часа.

ФИЗИЧЕСКИЙ