stringtranslate.com

Тест Салли-Энн

Оригинальный мультфильм Салли-Энн, использованный в тесте Бароном-Коэном, Лесли и Фритом (1985).

Тест Салли-Энн — это психологический тест , используемый в психологии развития для измерения социальных когнитивных способностей человека приписывать ложные убеждения другим. [1] На основе более раннего новаторского исследования Уиммера и Пернера (1983), [2] тест Салли-Энн был назван так Саймоном Бароном-Коэном , Аланом М. Лесли и Утой Фрит (1985), которые разработали тест Салли- Энн. тестируйте дальше; [3] в 1988 году Лесли и Фрит повторили эксперимент с актерами-людьми (а не с куклами) и получили аналогичные результаты. [4]

Описание теста

Чтобы разработать эффективный тест, Baron-Cohen et al. модифицировал парадигму кукольной игры Уиммера и Пернера (1983), в которой куклы представляют собой осязаемых персонажей истории, а не гипотетических персонажей чистого повествования.

В процессе тестирования после знакомства с куклами ребенку задается контрольный вопрос на запоминание их названий ( Вопрос на называние ). Затем разыгрывается короткая сценка; Салли берет шарик и прячет его в корзину. Затем она «выходит» из комнаты и идет на прогулку. Пока ее нет, Энн достает шарик из корзины Салли и кладет его в свою коробку. Затем снова представляют Салли и ребенку задают ключевой вопрос, вопрос убеждения : «Где Салли будет искать свой шарик?» [3]

В исследовании теории разума при аутизме Барона-Коэна, Лесли и Фрита 61 ребенок — 20 из которых был диагностирован аутизмом по установленным критериям, 14 — с синдромом Дауна и 27 из которых были определены как клинически здоровые — были протестированы с помощью «Салли " и "Анна". [3]

Результаты

Чтобы участник прошел этот тест, он должен правильно ответить на вопрос об убеждениях, указав, что Салли считает, что шарик находится в ее собственной корзине. Этот ответ соответствует точке зрения Салли, но не соответствует точке зрения самого участника. Если участник не может принять альтернативную точку зрения, он укажет, что у Салли есть основания полагать, как и участник, что шарик сдвинулся. Таким образом, прохождение теста рассматривается как проявление понимания участником того, что у Салли есть свои собственные убеждения, которые могут не коррелировать с реальностью; это основное требование теории разума . [5]

В деле Барона-Коэна и др. (1985) 23 из 27 клинически здоровых детей (85%) и 12 из 14 детей с синдромом Дауна (86%) правильно ответили на вопрос об убеждениях . Однако только четверо из 20 детей с аутизмом (20%) ответили правильно. В целом, дети в возрасте до четырех лет, как и большинство детей-аутистов (старшего возраста), ответили на вопрос убеждения «коробкой Анны», по-видимому, не подозревая, что Салли не знает, что ее шарик был перемещен. [3]

Критика

Хотя данные Барона-Коэна и др. предположительно указывают на отсутствие теории разума у ​​аутичных детей, существуют и другие возможные факторы, влияющие на них. Например, аутисты могут выполнить когнитивно более простое задание на запоминание, но языковые проблемы как у аутичных детей, так и у глухих контрольных детей, как правило, искажают результаты. [6]

Раффман, Гарнэм и Райдаут (2001) дополнительно исследовали связь между тестом Салли-Энн и аутизмом с точки зрения взгляда в глаза как социальной коммуникативной функции. Они добавили третье возможное место для шарика: карман сыщика. Когда дети с аутизмом и дети с умеренными нарушениями обучаемости были протестированы в этом формате, они обнаружили, что обе группы одинаково хорошо ответили на вопрос об убеждениях; однако участники с умеренными нарушениями обучаемости надежно смотрели на правильное расположение шарика, а участники с аутизмом - нет, даже если участник с аутизмом отвечал на вопрос правильно. [7] Эти результаты могут быть выражением социальных недостатков, связанных с аутизмом.

Тагер-Флюсберг (2007) утверждает, что, несмотря на эмпирические результаты, полученные при выполнении задачи Салли-Энн, среди ученых растет неуверенность в важности лежащей в основе гипотезы теории разума об аутизме. Во всех проведенных исследованиях некоторые дети с аутизмом выполняют задания, основанные на ложных убеждениях, такие как Салли-Энн. [8]

У других гоминидов

Отслеживание глаз шимпанзе, бонобо и орангутанов предполагает, что все трое предвидят ложные убеждения субъекта в костюме Кинг-Конга и проходят тест Салли-Энн. [9] [10]

Искусственный интеллект

Исследователи искусственного интеллекта и вычислительной когнитивной науки уже давно пытаются с помощью вычислений смоделировать способность человека рассуждать о (ложных) убеждениях других в таких задачах, как тест Салли-Энн. Для воспроизведения этой способности в компьютерах было использовано множество подходов, включая подходы нейронных сетей, [11] распознавание эпистемических планов, [12] и байесовскую теорию разума. [13] Эти подходы обычно моделируют агентов как рационально выбирающих действия на основе своих убеждений и желаний, что можно использовать либо для прогнозирования их будущих действий (как в тесте Салли-Энн), либо для вывода их текущих убеждений и желаний. В ограниченных настройках эти модели способны воспроизводить человеческое поведение при выполнении задач, подобных тесту Салли-Энн, при условии, что задачи представлены в машиночитаемом формате .

22 марта 2023 года исследовательская группа Microsoft опубликовала документ, показывающий, что система искусственного интеллекта GPT-4 на основе LLM может пройти тест Салли-Энн, который авторы интерпретируют как «предполагающее, что GPT-4 имеет очень продвинутый уровень теории разума». [14] Однако общность этого вывода оспаривается несколькими другими статьями, в которых указывается, что способность GPT-4 рассуждать о убеждениях других агентов остается ограниченной (точность 59% по тесту ToMi) [15] и не устойчив к «состязательным» изменениям теста Салли-Энн, с которым люди гибко справляются. [16] [17] Хотя некоторые авторы утверждают, что производительность GPT-4 при выполнении задач, подобных Салли-Энн, можно увеличить до 100% за счет улучшенных стратегий подсказок, [18] этот подход, по-видимому, повышает точность только до 73% на больший набор данных ToMi. [16] В смежной работе исследователи обнаружили, что LLM не демонстрируют человеческое интуитивное представление о целях, которых достигают другие агенты, [19] и что они не делают достоверных выводов о целях других агентов на основе наблюдаемых действий. [20] Таким образом, степень, в которой LLM, такие как GPT-4, могут выполнять социальное мышление, остается активной областью исследований.

Рекомендации

  1. ^ Виммер, Хайнц; Пернер, Йозеф (январь 1983 г.). «Убеждения об убеждениях: репрезентация и ограничивающая функция неправильных убеждений в понимании обмана детьми младшего возраста». Познание . 13 (1): 103–128. дои : 10.1016/0010-0277(83)90004-5. PMID  6681741. S2CID  17014009.
  2. ^ Виммер и Пернер (1983). «Убеждения об убеждениях: репрезентация и ограничивающая функция неправильных убеждений в понимании обмана детьми младшего возраста. Познание, 13, 103-128».{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  3. ^ abcd Барон-Коэн, Саймон; Лесли, Алан М.; Фрит, Юта (октябрь 1985 г.). «Есть ли у аутичного ребенка «теория разума»?». Познание . 21 (1): 37–46. дои : 10.1016/0010-0277(85)90022-8. PMID  2934210. S2CID  14955234.PDF.
  4. ^ Лесли, Алан М.; Фрит, Юта (ноябрь 1988 г.). «Понимание аутичными детьми видения, знания и веры». Британский журнал психологии развития . 6 (4): 315–324. doi :10.1111/j.2044-835X.1988.tb01104.x.
  5. ^ Премак, Дэвид; Вудрафф, Гай (декабрь 1978 г.). «Есть ли у шимпанзе теория разума?». Поведенческие и мозговые науки . 1 (4): 515–526. дои : 10.1017/S0140525X00076512 .
  6. ^ «Аутизм и теория разума: теория в переходном периоде». www.jeramyt.org . Проверено 9 октября 2016 г.
  7. ^ Раффман, Тед; Гарнем, Венди; Райдаут, Пол (ноябрь 2001 г.). «Социальное понимание при аутизме: взгляд как мера основных идей». Журнал детской психологии и психиатрии . 42 (8): 1083–1094. дои : 10.1111/1469-7610.00807. ПМИД  11806690.
  8. ^ Тагер-Флюсберг, Хелен (декабрь 2007 г.). «Оценка гипотезы теории разума об аутизме». Современные направления психологической науки . 16 (6): 311–315. дои : 10.1111/j.1467-8721.2007.00527.x. S2CID  16474678.
  9. ^ Крупенье, Кристофер; Кано, Фумихиро; Хирата, Сатоши; Позвони, Жозеп; Томаселло, Майкл (07 октября 2016 г.). «Обезьяны ожидают, что другие люди будут действовать в соответствии с ложными убеждениями». Наука . 354 (6308): 110–114. Бибкод : 2016Sci...354..110K. doi : 10.1126/science.aaf8110 . hdl : 10161/13632 . ISSN  0036-8075. ПМИД  27846501.
  10. ^ Девлин, Ханна (06 октября 2016 г.). «Обезьяны могут угадывать, о чем думают другие, так же, как и люди, показывают исследования». Хранитель . ISSN  0261-3077 . Проверено 9 октября 2016 г.
  11. ^ Рабиновиц, Нил; Пербет, Фрэнк; Сонг, Фрэнсис; Чжан, Чиюань; Эслами, С.М. Али; Ботвиник, Мэтью (3 июля 2018 г.). «Машинная теория разума». Материалы 35-й Международной конференции по машинному обучению . ПМЛР: 4218–4227.
  12. ^ Шво, Мааян; Классен, Торин К.; Сохраби, Ширин; Макилрайт, Шейла А. (13 мая 2020 г.). «Распознавание эпистемического плана». Материалы 19-й Международной конференции по автономным агентам и мультиагентным системам . ААМАС '20. Ричленд, Южная Каролина: Международный фонд автономных агентов и мультиагентных систем: 1251–1259. ISBN 978-1-4503-7518-4.
  13. ^ Бейкер, Крис Л.; Хара-Эттингер, Джулиан; Сакс, Ребекка; Тененбаум, Джошуа Б. (13 марта 2017 г.). «Рациональная количественная атрибуция убеждений, желаний и восприятий в ментализации человека». Природа человеческого поведения . 1 (4): 1–10. дои : 10.1038/s41562-017-0064. ISSN  2397-3374. S2CID  3338320.
  14. ^ Бубек, Себастьян; Чандрасекаран, Варун; Эльдан, Ронен; Герке, Йоханнес; Хорвиц, Эрик; Камар, Эдже; Ли, Питер; Ли, Инь Тат; Ли, Юаньчжи; Лундберг, Скотт; Нори, Харша; Паланги, Хамид; Рибейро, Марко Тулио; Чжан, И (2023). «Искры общего искусственного интеллекта: ранние эксперименты с GPT-4». arXiv : 2303.12712v5 [cs.CL].
  15. ^ Сап, Мартен; ЛеБрас, Ронан; Фрид, Дэниел; Чой, Еджин (2022). «Нейронная теория разума? О пределах социального интеллекта в больших LM». arXiv : 2210.13312 [cs.CL].
  16. ^ аб Шапира, Натали; Леви, Мош; Алави, Сейед Хосейн; Чжоу, Сюйхуэй; Чой, Еджин; Гольдберг, Йоав; Сап, Мартен; Шварц, Веред (2023). «Умный Ганс или нейронная теория разума? Стресс-тестирование социальных рассуждений в больших языковых моделях». arXiv : 2305.14763 [cs.CL].
  17. ^ Ульман, Томер (2023). «Большие языковые модели не справляются с тривиальными изменениями в задачах теории разума». arXiv : 2302.08399 [cs.AI].
  18. ^ Могаддам, Шима Рахими; Дорогая, Кристофер Дж. (2023). «Повышение производительности теории разума в больших языковых моделях с помощью подсказок». arXiv : 2304.11490 [cs.AI].
  19. ^ Руис, Лаура; Финдейс, Ардуин; Брэдли, Херби; Рахмани, Хосейн А.; Чхве, Кён Ван; Грефенштетт, Эдвард; Роктешель, Тим (29 июня 2023 г.). «Кодирует ли LLM выборочно цель достижения агента?». {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  20. ^ Инь, Лэнс; Коллинз, Кэтрин М.; Вэй, Меган; Чжан, Седегао Э.; Чжи-Сюань, Тан; Веллер, Адриан; Тененбаум, Джошуа Б.; Вонг, Лайонел (2023). «Нейро-символическая машина обратного планирования (NIPE): моделирование вероятностных социальных выводов на основе лингвистических входных данных». arXiv : 2306.14325 [cs.AI].