Техника - молодёжи 1986-12, страница 6мало, все они весьма сложны и требуют мощных машин с большим объемом памяти. Ведь перед тем как отбросить ту или иную балластную, фоновую клетку изображения, компьютер совершает много вычислений. Судя по тому, как легко нам удается распознавать зрительные образы, вряд ли наш мозг занимается столь тяжелой рутинной работой. Видимо, у живой природы есть патент на какой-то особый способ выделения информативных фрагментов. Совершим небольшой экскурс в физиологию. И у человека и у животных лучи света, преломляясь в хрусталике, попадают на многослойный экран—сетчатку. Расположенные на ее поверхности клетки-фоторецепторы преобразуют оптическое изображение в электрические сигналы, которые доходят до глубинного слоя — ганглиозных клеток. Каждая его клетка — это датчик, настроенный на прием какого-либо одного специального сигнала. У лягушек, например, одни клетки реагируют на изменение освещенности, другие распознают «движущиеся маленькие объекты» (так лягушки представляют себе насекомых), третьи определяют направление движения мухи или комара, четвертые выделяют в контурах предметов линии определенной ориентации. Таким образом, в ганглиозном слое происходит выделение информативных фрагментов изображения. Теперь из всевозможных палочек, закорючек, штришков надо создать целостный зрительный образ. Как же это происходит? В центральной части сетчатки находится небольшое углубление, густо усаженное рецепторами,— фовеальная область. Формируемое тут изображение наиболее четко. Но размеры фове-альной области малы по сравнению со всей поверхностью глазного дна. Поэтому глазу приходится просматривать объект по частям, перемещая взор с одной точки предмета на другую. Это движение ни в коем случае не похоже на строго упорядоченное перемещение электронного луча в кинескопе телевизора. Доказал это советский психофизиолог А. Л. Ярбус с помощью очень простого опыта. К глазу испытуемого прикреплялась небольшая вакуумная присоска с зеркальцем — мишенью для светового луча. Добровольцам, участвовавшим в эксперименте, предъявляли картинку, которую они должны были внимательно рассматривать. При этом глаза начинали совершать быстрые, так называемые саккадические скачки. Отраженный от зеркальца луч точно указывал места фиксации взгляда на изображении. Оказалось, что взгляд направляется только в те места картинки, где расположены информативные фрагменты. Глаз безошибочно находил самые важные точки распознаваемого объекта. Вырисовывается такая картина — глаз выделяет в изображении инфор мативные фрагменты (как он это делает, нам пока не ясно), внимательно просматривает их, а затем головной мозг синтезирует зрительный образ. Все вроде бы встает на свои места, но... Наверняка всем знакома ситуация, когда с одного мимолетного взгляда, брошенного в толпе на прохожего, вы узнаете старого школьного приятеля, которого не видели несколько лет. Причем вы не размышляете, не рассматриваете пристально лицо встречного. Один короткий взгляд — и все. Ученые провели эксперименты, когда изображение освещалось очень короткими вспышками, длительность которых была заведомо меньше времени саккадического скачка. И тем не менее объекты распознавались успешно. Создается впечатление, что в голове человека находится огромная справочная фильмотека, где хранятся зрительные образы всех объектов, которые он ког-да-либо видел. Итак, просмотр информативных фрагментов и синтез образа или сравнение с уже хранящейся в мозгу информацией? Окончательный ответ наука пока не дала. Для создателей зрячих роботов это и плохо, и... хорошо. Ведь открывается простор для фантазии, для смелых гипотез. Вот почему так не похожи пути, по которым идут разработчики машинного зрения. Мы познакомим вас только с двумя работами московских ученых. /А «ЧТОБ ЭПИГРАФЫ РАЗБИРАТЬ...» Буквы, написанные от руки, распознавать сложно. Каждый символ может встречаться в различных, порой весьма непохожих друг на друга начертаниях. Даже хорошо «набившему» глаз читателю не всегда удается справиться с текстом, написанным незнакомым неразборчивым почерком. Но уж если человек испытывает трудности при работе с рукописными текстами, то что говорить о роботах. Впрочем, кое-чему они уже научились. Вот на дисплее возникает слегка неровная, написанная от руки буква. ОКРУС (обучающийся классификатор рукописных символов, созданный в Институте электронных управляющих машин совместно с учеными Института атомной энергии имени И. В. Курчатова и Института проблем передачи информации АН СССР) «впивается глазом», виноват, объективом в изображение. Проходит несколько секунд, и машина выдает ответ. Как же это происходит? Проследим работу системы на примере, скажем, буквы «о». (Она очень сложна для распознавания, ведь в ней есть элементы самых различных ориен-таций.) Щелчок переключателя, изображение смазывается. На экране остаются лишь две слегка изогнутые черточки — «донышко» и «крышечка» буквы. Еще щелчок — и черточки сменяются двумя наклонными штрихами. Так происходит несколько раз. Это вступи Алфавит для голографического робота Принципиальная схема видящего голо-графического робота: 1 — объект распознавания, 2 — система расфокусировки, 3 — сканирующее устройство, 4,12,13,14 — каналы связи, 5 — информативный фрагмент, 6 — размножитель, 7 — линзы, 8 — матрица голографических фильтров, 9 — фотоматрица, 10 — вычислительный блок, 11 — отображающее устройство, 15 — лазер, 16 — делитель света, 17 — оптическая система, 18,19—лучи лазера. 4 |