Тест Салли-Энн

Тест Салли-Энн — это психологический тест , используемый в психологии развития для измерения социальных когнитивных способностей человека приписывать ложные убеждения другим. ^[1] На основе более раннего новаторского исследования Уиммера и Пернера (1983), ^[2] тест Салли-Энн был назван так Саймоном Бароном-Коэном , Аланом М. Лесли и Утой Фрит (1985), которые разработали тест Салли- Энн. тестируйте дальше; ^[3] в 1988 году Лесли и Фрит повторили эксперимент с актерами-людьми (а не с куклами) и получили аналогичные результаты. ^[4]

Описание теста

Чтобы разработать эффективный тест, Baron-Cohen et al. модифицировал парадигму кукольной игры Уиммера и Пернера (1983), в которой куклы представляют собой осязаемых персонажей истории, а не гипотетических персонажей чистого повествования.

В процессе тестирования после знакомства с куклами ребенку задается контрольный вопрос на запоминание их названий ( Вопрос на называние ). Затем разыгрывается короткая сценка; Салли берет шарик и прячет его в корзину. Затем она «выходит» из комнаты и идет на прогулку. Пока ее нет, Энн достает шарик из корзины Салли и кладет его в свою коробку. Затем снова представляют Салли и ребенку задают ключевой вопрос, вопрос убеждения : «Где Салли будет искать свой шарик?» ^[3]

В исследовании теории разума при аутизме Барона-Коэна, Лесли и Фрита 61 ребенок — 20 из которых был диагностирован аутизмом по установленным критериям, 14 — с синдромом Дауна и 27 из которых были определены как клинически здоровые — были протестированы с помощью «Салли " и "Анна". ^[3]

Результаты

Чтобы участник прошел этот тест, он должен правильно ответить на вопрос об убеждениях, указав, что Салли считает, что шарик находится в ее собственной корзине. Этот ответ соответствует точке зрения Салли, но не соответствует точке зрения самого участника. Если участник не может принять альтернативную точку зрения, он укажет, что у Салли есть основания полагать, как и участник, что шарик сдвинулся. Таким образом, прохождение теста рассматривается как проявление понимания участником того, что у Салли есть свои собственные убеждения, которые могут не коррелировать с реальностью; это основное требование теории разума . ^[5]

В деле Барона-Коэна и др. (1985) 23 из 27 клинически здоровых детей (85%) и 12 из 14 детей с синдромом Дауна (86%) правильно ответили на вопрос об убеждениях . Однако только четверо из 20 детей с аутизмом (20%) ответили правильно. В целом, дети в возрасте до четырех лет, как и большинство детей-аутистов (старшего возраста), ответили на вопрос убеждения «коробкой Анны», по-видимому, не подозревая, что Салли не знает, что ее шарик был перемещен. ^[3]

Критика

Хотя данные Барона-Коэна и др. предположительно указывают на отсутствие теории разума у аутичных детей, существуют и другие возможные факторы, влияющие на них. Например, аутисты могут выполнить когнитивно более простое задание на запоминание, но языковые проблемы как у аутичных детей, так и у глухих контрольных детей, как правило, искажают результаты. ^[6]

Раффман, Гарнэм и Райдаут (2001) дополнительно исследовали связь между тестом Салли-Энн и аутизмом с точки зрения взгляда в глаза как социальной коммуникативной функции. Они добавили третье возможное место для шарика: карман сыщика. Когда дети с аутизмом и дети с умеренными нарушениями обучаемости были протестированы в этом формате, они обнаружили, что обе группы одинаково хорошо ответили на вопрос об убеждениях; однако участники с умеренными нарушениями обучаемости надежно смотрели на правильное расположение шарика, а участники с аутизмом - нет, даже если участник с аутизмом отвечал на вопрос правильно. ^[7] Эти результаты могут быть выражением социальных недостатков, связанных с аутизмом.

Тагер-Флюсберг (2007) утверждает, что, несмотря на эмпирические результаты, полученные при выполнении задачи Салли-Энн, среди ученых растет неуверенность в важности лежащей в основе гипотезы теории разума об аутизме. Во всех проведенных исследованиях некоторые дети с аутизмом выполняют задания, основанные на ложных убеждениях, такие как Салли-Энн. ^[8]

У других гоминидов

Отслеживание глаз шимпанзе, бонобо и орангутанов предполагает, что все трое предвидят ложные убеждения субъекта в костюме Кинг-Конга и проходят тест Салли-Энн. ^[9]^[10]

Искусственный интеллект

Исследователи искусственного интеллекта и вычислительной когнитивной науки уже давно пытаются с помощью вычислений смоделировать способность человека рассуждать о (ложных) убеждениях других в таких задачах, как тест Салли-Энн. Для воспроизведения этой способности в компьютерах было использовано множество подходов, включая подходы нейронных сетей, ^[11] распознавание эпистемических планов, ^[12] и байесовскую теорию разума. ^[13] Эти подходы обычно моделируют агентов как рационально выбирающих действия на основе своих убеждений и желаний, что можно использовать либо для прогнозирования их будущих действий (как в тесте Салли-Энн), либо для вывода их текущих убеждений и желаний. В ограниченных настройках эти модели способны воспроизводить человеческое поведение при выполнении задач, подобных тесту Салли-Энн, при условии, что задачи представлены в машиночитаемом формате .

22 марта 2023 года исследовательская группа Microsoft опубликовала документ, показывающий, что система искусственного интеллекта GPT-4 на основе LLM может пройти тест Салли-Энн, который авторы интерпретируют как «предполагающее, что GPT-4 имеет очень продвинутый уровень теории разума». ^[14] Однако общность этого вывода оспаривается несколькими другими статьями, в которых указывается, что способность GPT-4 рассуждать о убеждениях других агентов остается ограниченной (точность 59% по тесту ToMi) ^[15] и не устойчив к «состязательным» изменениям теста Салли-Энн, с которым люди гибко справляются. ^[16]^[17] Хотя некоторые авторы утверждают, что производительность GPT-4 при выполнении задач, подобных Салли-Энн, можно увеличить до 100% за счет улучшенных стратегий подсказок, ^[18] этот подход, по-видимому, повышает точность только до 73% на больший набор данных ToMi. ^[16] В смежной работе исследователи обнаружили, что LLM не демонстрируют человеческое интуитивное представление о целях, которых достигают другие агенты, ^[19] и что они не делают достоверных выводов о целях других агентов на основе наблюдаемых действий. ^[20] Таким образом, степень, в которой LLM, такие как GPT-4, могут выполнять социальное мышление, остается активной областью исследований.

Тест Салли-Энн

Описание теста

Результаты

Критика

У других гоминидов

Искусственный интеллект

Рекомендации