Влияние кажущегося движения на распознавание эмоциональных экспрессий лица

Разделы психологии: 
Высшее учебное заведение: 

Влияние кажущегося движения на распознавание эмоциональных экспрессий лица // Мышление и речь: подходы, проблемы, решения: Материалы XV Международных чтений памяти Л.С. Выготского. - 2014. - Т.1.

Влияние кажущегося движения на распознавание эмоциональных экспрессий лица[1]

В.А. Барабанщиков О.А. Королькова Е.А. Лободинская Московский институт психоанализа Россия, Москва

Введение

Обладая высокой лабильностью, эмоции возникают в течение долей секунды, моментально проявляясь в выражениях лица. Столь же быстро они оказываются предметом внимания стороннего наблюдателя либо собеседника. Несмотря на то, что эмоции развернуты во времени и имеют собственную динамику, их Восприятие, как правило, изучается на материале итоговых аффективных образований, представленных в статичной форме. Правомерность подобной процедуры оправдывается как скоротечностью экспрессий, так и категориальностью самого восприятия, которое всегда вносит, обобщенный и опосредованный характер. Однако вопрос о роли динамики выразительных движений в распознавании эмоций остается открытым. Немногочисленные исследования восприятия динамики лица показывают, что она несет функционально иной тип информации по сравнению со статичными признаками, а влияние непрерывных мимических изменений на Восприятие выражения лица вызвано временной структурой движений (Ambadar, Schooler, Cohn, 2005; Bould, Morris, Wink, 2008; Cunningham, Wallraven, 2009; Fiorentini, Viviani, 2011).

Данная работа посвящена анализу роли кажущегося (стробоскопического) движения в распознавании экспрессий лица, выражающего базовые эмоции. Имеется ввиду быстрая смена экспозиций статических срезов экспрессий, которая при определенном временном режиме вызывает впечатление непрерывного изменения эмоционального состояния натурщика. В подобных условиях реализуется простейшая временная структура экспозиции экспрессий и моделируется преобразование одного статичного состояния в другое, подобное линейному пространственному морфингу лица (Барабанщиков, 2009; Calder, et al., 1996).

В выполненном исследовании авторы попытались ответить на следующие вопросы. Влияет ли стробоскопическая экспозиция экспрессий на точность их распознавания? Если влияет, то как? Отличается ли эффективность распознавания модальности эмоции при кажущейся динамике экспрессий от распознавания срезов экспрессивных состояний?

Метод исследования

Гипотеза. При быстром предъявлении последовательности статичных изображений «нейтральное лицо - экспрессия - нейтральное лицо» у наблюдателей возникает впечатление динамической микроэкспрессии, длящееся доли секунды. По сравнению со статичными «срезами», а тем более по сравнению с изображениями лица, подверженными маскировке, распознавание эмоций благодаря кажущимся изменениям лица может быть более эффективным.

В выполненном исследовании сопоставлялась точность распознавания эмоций в условиях (1) кажущегося движения, (2) маскировки и (3) контрольной экспозиции фотоизображений экспрессий. В условиях кажущегося движения на короткое время экспонировалась статичная экспрессия, до и после которой предъявлялись изображения спокойного лица. В условиях маскировки спокойное лицо заменялось «маской», созданной путем случайного перемешивания частей нейтрального изображения; возникновения кажущегося движения в этом случае не ожидалось. Наконец, в контрольном условии фотографии экспрессивного лица предъявлялись без каких-либо дополнительных изображений. Согласно гипотезе, доля верно распознанных эмоций в условиях кажущегося движения значимо выше, чем во время маскировки и, возможно, в контрольной экспозиции статичного лица.

Стимульный материал. В качестве стимульного материала использованы цветные фотоизображения высокого разрешения (1024×681 пикселей) лиц натурщиков анфас (трех мужчин и трех женщин), выражающих шесть базовых эмоциональных экспрессий (радость, гнев, страх, удивление, отвращение, печаль), а также спокойное (нейтральное) лицо. Изображения отобраны из валидизированной базы RaFD (Langner et al., 2010) и кадрированы до размера 450×564 пикселей. Рандомизированные лица, которые использовались при маскировке, получали следующим образом. Изображения нейтральных экспрессий разрезали на 13 частей по вертикали и 15 частей по горизонтали, затем полученные прямоугольники (размером 35×38 пикселей) в случайном порядке меняли местами.

Оборудование. Стимульные изображения предъявлялись на экране ЭЛТ–монитора (ViewSonic G90f, частота 100 Гц), подключенного к ПК, в условиях нормальной освещенности. Испытуемые располагались на расстоянии 60 см от экрана и смотрели на изображения бинокулярно. Размеры экспонируемых изображений составляли 450×564 пикселей, или около 16×20°.

Испытуемые. В исследовании участвовали 53 человека (37 женщин, 16 мужчин; возраст 17-53 года, медиана - 19 лет) с нормальным или скорректированным до нормального зрением.

Процедура. Исследование включало три экспериментальные серии, отличающиеся друг от друга содержанием контекста - изображений, предъявляемых до и после тестовых. В первой серии в качестве контекста использовались изображения нейтрального лица того же натурщика, экспрессия которого демонстрировалась в данной пробе. Во второй серии контекстом служили рандомизированные лица, в третьей - светло–серый фон пустого экрана.

Перед началом каждой серии испытуемому предлагалось внимательно рассматривать тестовые изображения лица и выбирать из предъявленного списка название той эмоции, которая максимально соответствует увиденной экспрессии. Всего проведено 7 тренировочных проб, в каждой из которых тестовое изображение представляло одну из 7 экспрессий, выраженную одним из 6 натурщиков. Порядок проб был случайным. Временная организация стимульного материала подбиралась опытным путем на основе данных, полученных в других исследованиях (Braddick, 1980; Kolers, 1972; Michaels, Turvey, 1979). Тестовые изображения предъявлялись на время, равное 50, 100 либо 200 мс. Основная серия включала 3 времени экспозиции × 7 экспрессий × 6 натурщиков × 7 повторов = 882 пробы. Порядок предъявления стимульного материала в каждом блоке был случайным.

Результаты исследования

феноменология восприятия. Несмотря на общность временной организации стимульных паттернов в трех сериях, их Восприятие зависит от содержательного контекста, в который включалось тестовое фотоизображение. Если оно просто демонстрируется на светло–сером фоне экрана, наблюдатели воспринимают неподвижное лицо само по себе. Если фотографии экспрессии лица предшествует и следует за ней изображение этого же натурщика в спокойном состоянии, воспринимается кажущееся движение - быстрое непрерывное изменение выражения лица, при этом само лицо как бы приближается к наблюдателю. Наконец, в тех случаях, когда появление тест–объекта ограничивается рандомизированными изображениями, наблюдатель видит статичное изображение экспрессии с наложенными на него масками. Три содержательно различные ситуации, реализованные в соответствующих экспериментальных сериях, обозначим как «кажущееся движение» (серия 1), «маскировка» (серия 2) и «изолированное лицо» (серия 3).

Точность распознавания экспрессий лица. В ходе анализа мы пытались установить, зависит ли относительная частота проб, в которых выбранная испытуемым эмоция совпадала с экспрессией, выраженной натурщиком («верные ответы»), от условий восприятия и модальности экспрессии. Ответы, не совпадающие с экспрессией натурщика, не учитывались. По результатам рандомизационного теста все три фактора (Время, Экспрессия, Ситуация), а также их взаимодействия первого (Вр × Эксп, Вр × Сит, Эксп × Сит) и второго (Вр × Эксп × Сит) уровней оказались значимыми (p = 0,001).

Согласно полученным данным, средние по всем экспрессиям и временам экспозиции частоты верных ответов в сериях 1 и 2 значимо не различаются (p=0,423). Ответы в серии 3 (изолированное предъявление лица) значимо отличны от соответствующих ответов в сериях 1 и 2 (кажущееся движение и маскировка) (p<0,001). Отдельно по каждой экспрессии все различия между сериями значимы (p<0,008) за исключением «удивления» и нейтрального лица, для которых результаты оценки в условиях кажущегося движения и изолированного лица не отличаются (p>0,481). Точность ответов в трех сериях значимо различается и по времени экспозиции, кроме серий с кажущимся движением и маскировкой при 100 мс (p=0,374).

Обсуждение результатов

Анализ показывает, что все три экспериментальных условия и их сочетания значимо влияют на оценку экспрессий лица. Организация стимульной информации, модальность экспрессии и продолжительность ее экспозиции действительно определяют распознавание мимических выражений. При этом влияние детерминант носит сложный, взаимоопосредованный характер.

Базовый уровень эффективности распознавания экспрессии в микроинтервалах времени зафиксирован при экспозиции изолированного лица и зависит от модальности эмоции. Этот результат хорошо согласуется с ранее полученными данными в условиях затрудненного восприятия экспрессий при их зашумлении, повороте относительно наблюдателя, и т.п. (Барабанщиков, 2009, 2012). Так, точнее всего распознается экспрессия радости, а также спокойное, удивленное и печальное лицо. Экспрессии гнева, отвращения и страха распознаются менее точно.

В отсутствие содержательного контекста длительность экспозиции (50, 100 или 200 мс.) на эффективность распознавания не влияет. При маскировке экспрессии и ее кажущемся движении с уменьшением времени экспозиции уровень распознавания снижается. Аналогичные результаты получены и на экспрессиях большого числа натурщиков из базы KDEF (Calvo, Lundqvist, 2008). При уменьшении времени экспозиции (в отсутствие маскировки) имеет место тенденция к снижению точности распознавания эмоций, однако для выражений радости и спокойного лица эти различия невелики (радость распознается на максимально высоком уровне уже при времени 50 мс.), тогда как для других экспрессий точность оценок снижается.

Основной результат нашего исследования заключается в том, что по сравнению со статической экспозицией кажущееся движе‑ ние не приводит к увеличению точности распознавания базовых эмоций. В зависимости от модальности экспрессии его влияние на эффективность восприятия оказывается различным. Средние значения точности распознавания экспрессий в условиях кажущегося движения и маскировки практически совпадают, указывая на принципиальное сходство стимульных ситуаций. Соответственно кажущееся движение предполагает момент маскировки, а прямая и обратная зрительная маскировка - возможность кажущихся изменений. С увеличением длительности экспозиции экспрессии до 200 мс негативное влияние и маскировки, и кажущегося изменения выражения лица снижается.

Выводы

Стробоскопическая экспозиция действительно влияет на эффективность распознавания экспрессий лица, но не так, как ожидалось. При экспозиции экспрессии в течение 200 мс точность распознавания мимических паттернов в условиях кажущегося движения не превышает точности распознавания отдельных статических изображений, а при более коротких экспозициях - 100 мс и, особенно, 50 мс - значимо снижена. В коротком диапазоне длительностей стробоскопическая стимуляция сдерживает развитие перцептогенеза и по существу маскирует эмоциональные экспрессии. Несмотря на то, что средние тенденции динамики точности восприятия в условиях кажущегося движения и маскировки рандомизированными паттернами совпадают, на уровне отдельных экспрессий их различия, как правило, значимы и носят разнонаправленный характер. Как и реальное, кажущееся движение обладает особым качеством, соответствующим временной структуре экспозиции.

Литература

  1. Барабанщиков В.А. Восприятие выражений лица. М.: Изд–во «Институт психологии РАН», 2009.
  2. Барабанщиков В.А. Экспрессии лица и их Восприятие. М.: Изд– во «Институт психологии РАН», 2012.
  3. Ambadar Z., Schooler J., Cohn J. Deciphering the enigmatic face: The importance of facial dynamics in interpreting subtle facial expressions // Psychological Science. 2005. Vol. 16. P.403–410.
  4. Bould E., Morris N., Wink B. Recognizing subtle emotional expressions: The role of facial movements // Cognition & Emotion. 2008. Vol. 22. P.1569–1587.
  5. Braddick O.J. Low–level and high–level processes in apparent motion // Philosophical Transactions of the Royal Society of London. B, Biological Sciences. 1980. Vol. 290. №.1038. P.137–151.
  6. Calder A.J., Young A.W., Perrett D.I.,Etcoff N.L., Rowland D. Categorical perception of morfed facial expressions // Visual Cognition, 1996, Vol. 2. P.81–117.
  7. Calvo M.G., Lundqvist D. Facial expressions of emotion (KDEF): Identification under different display–duration conditions // Behaviour Research Methods. 2008. V. 40. №1. P.109–115.
  8. Cunningham D. W., Wallraven C. Dynamic information for the recognition of conversational expressions // Journal of Vision. 2009. Vol. 9. P.1–17.
  9. Fiorentini C., Viviani P. Is there a dynamic advantage for facial expressions? // Journal of Vision. 2011. Vol.11. №3. P.1–15.
  10. Kolers P.A. Aspects of motion perception. Oxford: Pergamon Press, 1972.
  11. Langner O., Dotsch R., Bijlstra G., Wigboldus D. H. J., Hawk S.T., van Knippenberg A. Presentation and validation of the Radboud Faces Database // Cognition & Emotion. 2010. Vol. 24. №8. P.1377–1388.
  12. Michaels C.F., Turvey M. T. Central sources of visual masking: Indexing structures supporting seeing at a single, brief glance // Psychological Research. 1979. Vol. 41. №1. P.1–61.

[1]Исследование выполнено за счет гранта Российского научного фонда (проект № 14–18–03350 «Когнитивные механизмы невербальной коммуникации»)

CAPTCHA на основе изображений
Введите код с картинки