Джон Кендалл Крушке — американский психолог и статистик, известный своими работами в области коннекционистских моделей человеческого обучения [1] и байесовского статистического анализа. [2] Он является почетным проректором [3] [4] на кафедре психологических и мозговых наук в Индианском университете в Блумингтоне . Он получил премию Troland Research Award от Национальной академии наук в 2002 году. [5]
Популярный учебник Крушке, Doing Bayesian Data Analysis [ 2] , был примечателен своей доступностью и уникальным каркасом концепций. В первой половине книги использовался простейший тип данных (т. е. дихотомические значения) для представления всех основных концепций байесовского анализа, включая обобщенный байесовский анализ мощности и планирование размера выборки. Во второй половине книги использовалась обобщенная линейная модель в качестве основы для объяснения приложений к спектру других типов данных.
Крушке написал множество учебных статей о байесовском анализе данных, включая статью с открытым доступом, в которой байесовские и частотные концепции объясняются бок о бок. [6] Существует сопутствующее онлайн-приложение, которое интерактивно выполняет частотный и байесовский анализ одновременно. Крушке выступил с пленарным докладом на эту тему на конференции США по преподаванию статистики (USCOTS).
Байесовский анализ данных становится все более популярным, но все еще остается относительно новым во многих областях, и руководящие принципы для представления байесовского анализа полезны для исследователей, рецензентов и студентов. Руководящие принципы отчетности по байесовскому анализу (BARG) [7] с открытым доступом от Крушке предоставляют пошаговый список с пояснениями. Например, BARG рекомендует, чтобы если аналитик использует проверку байесовских гипотез, то отчет должен включать не только фактор Байеса, но и минимальную априорную вероятность модели для того, чтобы апостериорная вероятность модели превысила критерий принятия решения.
Крушке предложил процедуру принятия решения для оценки нулевых значений параметров, основанную на неопределенности апостериорной оценки параметра. [8] Этот подход контрастирует с байесовской проверкой гипотез как сравнением моделей. [9]
Лидделл и Крушке [10] показали, что распространенная практика обработки порядковых данных (таких как субъективные оценки) как если бы они были метрическими значениями, может систематически приводить к ошибкам интерпретации, даже инверсии средних значений. Проблемы были решены путем обработки порядковых данных с помощью порядковых моделей, в частности, модели упорядоченного пробита. Частотные методы также могут использовать модели упорядоченного пробита, но авторы отдали предпочтение байесовским методам за их надежность.
Обзор моделей обучения с помощью внимания Крушке до 2010 года представлен в ссылке. [11] Эта ссылка суммирует многочисленные результаты человеческого обучения, которые предполагают обучение с помощью внимания. Эта ссылка также суммирует ряд моделей обучения Крушке в рамках общей структуры.
Сети обратного распространения — это тип модели коннекционизма, лежащей в основе нейронных сетей глубокого обучения. Ранняя работа Крушке с сетями обратного распространения создала алгоритмы для расширения или сокращения размерности скрытых слоев в сети, тем самым влияя на то, как сеть обобщается от обучающих случаев к проверочным случаям. [12] Алгоритмы также улучшили скорость обучения. [13]
Модель ассоциативного обучения ALCOVE [1] использовала градиентный спуск по ошибке, как в сетях обратного распространения, чтобы узнать, какие измерения стимула следует учитывать или игнорировать. Модель ALCOVE была получена из обобщенной контекстной модели [14] RM Nosofsky. Эти модели математически представляют стимулы в многомерном пространстве на основе воспринимаемых человеком измерений (таких как цвет, размер и т. д.) и предполагают, что обучающие примеры хранятся в памяти как полные образцы (то есть как комбинации значений измерений). Модель ALCOVE обучается с парами вход-выход и постепенно связывает образцы с обученными выходами, одновременно переключая внимание на релевантные измерения и отвлекая от нерелевантных измерений.
Усовершенствование модели ALCOVE, названное RASHNL, предоставило математически последовательный механизм градиентного спуска с ограниченной емкостью внимания. [15] Модель RASHNL предполагала, что внимание быстро переключается при предъявлении стимула, в то время как обучение вниманию в ходе испытаний происходит более постепенно.
Эти модели были подогнаны под эмпирические данные многочисленных экспериментов по обучению людей и дали хорошие отчеты об относительных трудностях обучения различным типам ассоциаций и точности отдельных стимулов во время обучения и обобщения. Эти модели не могут объяснить все аспекты обучения; например, для учета скорости обучения человека обратному сдвигу (то есть то, что было «A», теперь «B» и наоборот) требовался дополнительный механизм. [16]
Когда люди учатся последовательно категоризировать комбинации дискретных признаков в течение сеанса обучения, они будут стремиться узнать об отличительных признаках элементов, изученных позже, вместо того, чтобы узнать об их полной комбинации признаков. Это внимание к отличительным признакам элементов, изученных позже, называется «эффектом выделения» и вытекает из более раннего открытия, известного как «обратный эффект базовой скорости». [17]
Крушке провел обширную серию новых экспериментов по обучению с участием людей и разработал две модели коннекционизма для объяснения результатов. Модель ADIT [18] научилась обращать внимание на отличительные черты, а модель EXIT [19] использовала быстрые переключения внимания в каждом испытании. Канонический эксперимент по выделению и обзор результатов были представлены в ссылке. [20]
Люди могут научиться классифицировать стимулы в соответствии с правилами, такими как «контейнер для жидкостей, который шире своей высоты, называется миской», а также исключениями из правила, такими как «если только это не тот конкретный случай, который называется кружкой». Серия экспериментов продемонстрировала, что люди склонны классифицировать новые предметы, которые относительно близки к исключительному случаю, в соответствии с правилом больше, чем можно было бы предсказать с помощью моделей, основанных на образцах. Для учета данных Эриксон и Крушке разработали гибридные модели, которые смещали внимание между представлением, основанным на правилах, и представлением, основанным на образцах. [21] [22] [23]
Люди также могут изучать непрерывные отношения между переменными, называемыми функциями, например, «высота страницы примерно в 1,5 раза больше ее ширины». Когда люди обучаются на примерах функций, имеющих исключительные случаи, данные учитываются гибридными моделями, которые объединяют локально применимые функциональные правила. [24]
Крушке также исследовал байесовские модели результатов обучения человека, которые рассматривались его моделями коннекционизма. Эффекты последовательного или преемственного обучения (такие как выделение, упомянутое выше) могут быть особенно сложными для байесовских моделей, которые обычно предполагают независимость порядка. Вместо того чтобы предполагать, что вся система обучения является глобально байесовской, Крушке разработал модели, в которых слои системы являются локально байесовскими. [25] Это «локально байесовское обучение» учитывало комбинации явлений, которые сложны для небайесовских моделей обучения или для глобально-байесовских моделей обучения.
Еще одним преимуществом байесовских представлений является то, что они по своей сути представляют неопределенность значений параметров, в отличие от типичных коннекционистских моделей, которые сохраняют только одно значение для каждого параметра. Представление неопределенности может использоваться для руководства активным обучением, в котором обучающийся решает, какие случаи было бы наиболее полезно изучить следующими. [26]
В 1989 году Крушке присоединился к преподавательскому составу кафедры психологических и мозговых наук Индианского университета в Блумингтоне в качестве лектора. Он оставался в Университете Индианы до выхода на пенсию в должности почетного проректора в 2022 году.
В 1983 году Крушке получил степень бакалавра по математике с отличием по специальности «Общая стипендия» в Калифорнийском университете в Беркли. В 1990 году он получил степень доктора философии по психологии также в Калифорнийском университете в Беркли.
Крушке посетил летнюю научную программу 1978 года в The Thacher School в Охае, штат Калифорния, которая была сосредоточена на астрофизике и небесной механике. Он посетил летнюю школу Connectionist Models 1988 года [27] в Университете Карнеги-Меллона.