Как человек распознает объекты! — электронная энциклопедия

С практической точки зрения главная функция восприятия заключается в обеспечении распознавания объектов, т. е. их отнесении к той или иной категории: это — рубашка, это — кошка, это — ромашка и т. д. Аналогично происходит распознавание. Что такое распознавание и каковы его механизмы? По сути, распознавая объекты, мы делаем выводы о множестве скрытых свойств объекта. Например, если это рубашка или костюм, то они сделаны из ткани, они предназначены для того, чтобы их носить. Если это собака, то она может выполнять охранные функции, а следовательно, может наброситься на нас в случае наших неверных действий и т. д. Таким образом, распознавание — это то, что позволяет выйти за пределы чувственного отображения свойств предметов. Какие же свойства объекта необходимы для его распознавания?

Любой объект обладает определенной формой, величиной, цветом и т. д. Все эти свойства важны для его распознания. Тем не менее чашку мы узнаем независимо от того, большая она или маленькая, белая или коричневая, гладкая или с рельефом. Тогда возникает вопрос: как эти свойства используются в распознавании?

В настоящее время принято выделять в процессе распознавания объектов несколько этапов, одни из которых предварительные, другие — завершающие. На предварительных этапах перцептивная система использует информацию с сетчатки глаза и описывает объект на языке элементарных составляющих, таких как линии, края и углы. На завершающих этапах система сравнивает это описание с описаниями форм разного рода объектов, хранящихся в зрительной памяти, и выбирает наилучшее ему соответствие. Причем при распознавании большая часть обработки информации как на предварительных, так и на завершающих этапах распознавания недоступна сознанию. Рассмотрим предварительные этапы, на которых составляется описание формы объекта. Многое из того, что на сегодня известно об элементарных признаках объекта восприятия, было получено в биологических экспериментах над животными с применением регистрации активности отдельных клеток зрительной коры. В этих исследованиях изучалась чувствительность специфических нейронов коры во время предъявления различных стимулов на те участки сетчатки глаза, которые связаны с этими нейронами; такой участок сетчатки принято называть рецептивным полем кортикального нейрона.

Первые исследования с регистрацией активности отдельных клеток зрительной коры были проведены Хьюбелем и Визелем в 1968 г. Они выделили в зрительной коре три типа клеток, различающихся по признакам, на которые они реагируют. Простые клетки реагируют, когда глазу предъявляют стимул в виде линии (тонкой полоски или прямой грани между темным и светлым участками), имеющей определенную ориентацию и положение в рецептивном поле. Другие простые клетки настроены на другие ориентации и положения.

Сложные клетки тоже реагируют на полоску или край определенной ориентации, но для них не обязательно, чтобы стимул находился в определенном месте рецептивного поля. Они реагируют на стимул, находящийся в любом месте их рецептивного поля, и реагируют непрерывно, пока стимул перемещается по их рецептивному полю.

Сверхсложные клетки реагируют на стимул не только определенной ориентации, но и определенной длины. Если длина стимула выходит за пределы оптимальной, реакция ослабляется и может совсем прекратиться. Позднее были обнаружены клетки, реагирующие на другие формы стимулов, помимо полосок и краев. Например, были обнаружены сверхсложные клетки, реагирующие на углы и кривые линии определенной длины.

Все вышеописанные типы клеток называются детекторами признаков. Поскольку края, полоски, углы и изломы, на которые реагируют эти детекторы, могут использоваться для аппроксимации множества форм, есть основание рассматривать детекторы признаков как кирпичики, из которых строится воспринимаемая форма.

Однако получаемая детекторами информация в дальнейшем проходит сложную систему обработки. В настоящее время нет единой точки зрения на то, как это происходит. Одна из гипотез основывается на предположении о том, что данные клетки образуют целые сети. Каждый элемент этой сети отражает какую-то определенную характеристику воспринимаемого объекта (линию, кривую, угол и т.д.). В результате возникает целостный образ объекта. Конечно, это весьма упрощенное понимание данной концепции. Вероятно, эти сети сложны по своей структуре, но пока мы знаем о них еще слишком мало.

Вместе с тем имеющиеся экспериментальные данные позволяют говорить о том, что форма естественных объектов (например, лицо человека) состоит из более сложных признаков, чем линии и кривые, и скорее напоминает простые геометрические фигуры. Эти признаки таковы, что их комбинация позволяет создать форму любого узнаваемого объекта.

Одно из предположений заключалось в том, что в состав признаков объектов входят некоторые геометрические фигуры, такие как цилиндры, конусы, параллелепипеды и клинья. Такие признаки можно назвать геонами (неологизм от «геометрические ионы»). Это предположение было высказано Бидерманом в 1987 г. Он считает, что набора из 36 геонов в сочетании с небольшим набором пространственных отношений будет достаточно для описания формы всех объектов, которые человек способен опознать. Заметьте, что всего из двух геонов можно составить 36 х 36 различных объектов (сформировать объект можно из любых двух геонов, а из трех геонов — 36 х 36 х 36 объектов. Эти числа дают в сумме уже около 30 000, а еще надо учесть возможные объекты из четырех и более геонов. Кроме того, геоны, показанные на рис. 1, различаются только своими простейшими признаками. Например, геон 2 (куб) отличается от геона 3 (цилиндра) тем, что у куба прямые края, а у цилиндра — изогнутые; прямые и изогнутые линии являются простыми признаками.

То, что геоны являются опознавательными признаками объектов, подтвердилось в экспериментах, в которых испытуемым предлагали распознать нарисованные объекты, предъявляемые на короткое время. Общий результат был таков, что объект распознается настолько хорошо, насколько хорошо воспринимаются его геоны.

Имеется значительно больше информации о принципах осуществления процесса распознавания. В частности, известно,что распознавание естественных объектов осуществляется по принципу «сверху—вниз», а также известно, что контекст, в котором мы воспринимаем объект, существенно влияет на характер его распознания. Почему это происходит именно так?

Как человек распознает объекты!

Рис. 1. Объяснение в тексте

Дело в том, что в восприятии есть принципиальное различие между процессами обработки, протекающими «снизу-вверх» или «сверху-вниз». Процессы «снизу-вверх» управляются только входными сигналами, а процессы «сверху—вниз»— знаниями и ожиданиями человека. Например, когда на основе только геонного описания объекта последний узнается как лампа, то здесь участвуют только процессы «снизу—вверх»; все начинается с появления на входе простых признаков этого объекта, далее определяется геонная конфигурация входных данных, и затем это описание сравнивается с хранящимися в памяти описаниями форм. Наоборот, если мы узнаем в некотором объекте лампу отчасти потому, что она находится на ночном столике рядом с кроватью, то в этом участвуют процессы «сверху-вниз»; здесь привлекается не только та информация, которая поступила на сенсорный вход, но и контекст, в котором воспринимается тот или иной объект.

Именно принцип обработки «сверху-вниз» обусловливает сильное влияние контекста на наше восприятие предметов и людей. Примером такого механизма являются двойственные изображения. Этот эффект временного контекста виден на примере изображений, представленных на рис. 2. Смотрите на них, как при чтении рассказа в картинках — слева направо и сверху вниз. Картинки в середине этой последовательности неоднозначны. Если вы смотрели на эти изображения в предложенной последовательности, то скорее всего увидели в них мужское лицо. Если вы посмотрите на них в обратном порядке, то в двойственных картинках скорее всего увидите молодую женщину.

Как человек распознает объекты!