SAT ( / ˌ ɛ s ˌ eɪ ˈ t iː / ess-ay- TEE ) — стандартизированный тест , широко используемый при поступлении в колледжи в США . С момента своего дебюта в 1926 году его название и оценка менялись несколько раз. На протяжении большей части своей истории он назывался « Тест школьной оценки» и состоял из двух компонентов: вербального и математического, каждый из которых оценивался в диапазоне от 200 до 800. Позже он назывался « Тест оценки школьных способностей» , затем SAT I: «Рассуждение». Тест , затем SAT Reasoning Test , затем просто SAT .
SAT полностью принадлежит, разрабатывается и публикуется College Board , частной некоммерческой организацией в США. Его администрирует от имени Совета колледжей Служба образовательного тестирования [5] , которая незадолго до редизайна SAT в 2016 году разработала тест, а также поддерживала хранилище заданий (тестовых вопросов). [6] Тест предназначен для оценки готовности студентов к поступлению в колледж. Первоначально разработанный для того, чтобы не соответствовать учебным программам средней школы, [7] в версию SAT, представленную в 2016 году, было внесено несколько изменений. Президент совета колледжа Дэвид Коулман добавил, что он хотел, чтобы тест более точно отражал то, что учащиеся изучают в средней школе. с новыми стандартами Common Core [8] , которые были приняты округом Колумбия и многими штатами.
Начиная с 2015–16 учебного года Совет колледжа начал работать с Академией Хана над обеспечением бесплатной подготовки к SAT. [9] 19 января 2021 года Совет колледжа объявил о прекращении проведения факультативного раздела эссе, а также предметных тестов SAT после июня 2021 года . [10] [11] В январе 2022 года Совет колледжа объявил, что тест будет переходить в цифровой формат. Это изменение уже произошло в марте 2023 года для международных тестируемых и начнется в марте 2024 года для тестируемых из США. [12]
Несмотря на то, что по SAT было проведено значительное количество исследований, остается много вопросов и заблуждений. [13] [14] Помимо поступления в колледжи, SAT также используется исследователями, изучающими человеческий интеллект в целом и интеллектуальную развитость в частности, [15] [16] [17] , а также некоторыми работодателями в процессе набора персонала. [18] [19] [20]
SAT обычно сдают учащиеся младших и старших классов средней школы . [21] Совет колледжа заявляет, что тест SAT предназначен для измерения навыков грамотности, счета и письма, которые необходимы для академической успеваемости в колледже . Они заявляют, что SAT оценивает, насколько хорошо тестируемые анализируют и решают проблемы — навыки, которые они приобрели в школе и которые понадобятся им в колледже.
Совет колледжей также утверждает, что SAT в сочетании со средним баллом средней школы (GPA) обеспечивает лучший показатель успешности в колледже, чем одни только оценки в средней школе, измеряемые средним баллом первокурсника колледжа. Различные исследования, проведенные за время существования SAT, показывают статистически значимое увеличение корреляции между оценками средней школы и оценками первокурсников колледжа, когда учитывается SAT. [22] Прогностическая достоверность и сила SAT являются темами активных и дискуссионных исследований в психометрия. [13]
SAT — это стандартизированный тест , предназначенный для получения баллов, которые соответствуют колоколообразной кривой распределения среди тестируемых. Чтобы добиться такого распределения, разработчики тестов включают сложные вопросы с несколькими вариантами ответов и правдоподобными, но неправильными вариантами, известные как «отвлекающие факторы», исключают вопросы, на которые большинство студентов отвечают правильно, и налагают жесткие временные ограничения во время экзамена. [23]
Между средними школами США существуют существенные различия в финансировании, учебных программах, оценках и трудностях из-за федерализма США , местного контроля и преобладания учащихся с частным, дистанционным и домашним обучением . Баллы SAT (и ACT ) призваны дополнить показатели средней школы и помочь сотрудникам приемной комиссии представить местные данные, такие как курсовая работа, оценки и классный разряд, в общенациональной перспективе. [24]
Исторически сложилось так, что SAT более широко использовался студентами, живущими в прибрежных штатах, а ACT более широко использовался студентами на Среднем Западе и Юге; однако в последние годы все большее число студентов на восточном и западном побережьях сдают ACT. [25] [26] С 2007 года все четырехгодичные колледжи и университеты в Соединенных Штатах, в которых при подаче заявления на поступление требуется сдача теста, будут принимать либо SAT, либо ACT, а по состоянию на осень 2022 года более 1400 четырехлетних курсов. Колледжи и университеты вообще не требуют результатов стандартизированных тестов для поступления, хотя некоторые из них применяют эту политику лишь временно из-за пандемии коронавируса. [27] [28]
Проведение SAT занимает три часа, а по состоянию на 2022 год [update]его стоимость составляет 60 долларов США, без учета штрафов за просрочку платежа, с дополнительными сборами за обработку, если SAT сдается за пределами Соединенных Штатов. [29] Баллы по SAT варьируются от 400 до 1600, объединяя результаты тестов по двум разделам от 200 до 800 баллов: разделу «Математика» и разделу «Доказательное чтение и письмо». Хотя сдача SAT или его конкурента ACT необходима для поступления первокурсников во многие колледжи и университеты США, [30] в конце 2010-х годов многие учебные заведения сделали эти вступительные экзамены необязательными, [31] [32] [33 ] ], но это не помешало ученикам попытаться добиться высоких баллов [34] , поскольку они и их родители скептически относятся к тому, что означает «необязательно» в данном контексте. [35] [36] Фактически, число сдающих тесты постоянно росло. [37] И хотя это могло привести к долгосрочному снижению оценок, [37] [38] [39] эксперты предостерегают от использования этого показателя для оценки уровня образования всего населения США. [39]
SAT состоит из двух основных разделов: «Чтение и письмо на основе фактических данных» (EBRW, обычно известное как «английская» часть теста) и раздел «Математика». Оба они разбиты на четыре раздела: чтение, письмо и язык, математика (без калькулятора) и математика (калькулятор разрешен). До лета 2021 года испытуемый также по желанию мог написать эссе, которое в данном случае является пятым разделом теста. (Эссе было исключено после июня 2021 года, за исключением нескольких штатов и школьных округов. [40] ) Общее время для оцениваемой части SAT составляет три часа (или три часа и пятьдесят минут, если был пройден дополнительный раздел эссе). . У некоторых участников теста, которые не сдают эссе, также может быть пятый раздел, который используется, по крайней мере частично, для предварительного тестирования вопросов, которые могут возникнуть при будущих сдачах SAT. (Эти вопросы не включены в расчет балла SAT.)
В результате сдачи SAT получаются оценки по двум разделам: « Чтение и письмо на основе фактических данных » и «Математика» . Оценки по разделам выставляются по шкале от 200 до 800, причем баллы по каждому разделу кратны десяти. Общий балл по SAT рассчитывается путем сложения баллов по двум разделам, в результате чего общая сумма баллов варьируется от 400 до 1600. В дополнение к баллам по двум разделам сообщаются три «тестовых» балла по шкале от 10 до 40: один для каждого из Чтение, Письмо и Язык и Математика с приращением 1 для Чтения/Письма и Языка и 0,5 для Математики. Есть также два перекрестных теста, каждый из которых варьируется от 10 до 40 баллов: «Анализ по истории/социальным исследованиям» и «Анализ в науке». [41] Эссе, если оно было принято, оценивалось отдельно от двух разделов. [42] Два человека оценивают каждое эссе, присуждая от 1 до 4 баллов в каждой из трех категорий: чтение, анализ и письмо. [43] Эти две оценки разных экзаменаторов затем объединяются, чтобы получить общую оценку от 2 до 8 баллов по каждой категории. Хотя иногда люди указывают свои баллы за эссе из 24, Совет колледжей сам не объединяет разные категории для выставления одной оценки за эссе, а вместо этого выставляет баллы по каждой категории.
За угадывание на SAT не налагается штраф или отрицательная оценка: баллы основаны на количестве правильных ответов на вопросы. Последний раз необязательное эссе было представлено администрации в июне 2021 года. [10] [11] Совет колледжа заявил, что прекратил выпуск раздела эссе, потому что «у студентов есть другие способы продемонстрировать свое мастерство написания эссе», включая часть теста по чтению и письму. [10] [11] Он также признал, что пандемия COVID-19 сыграла свою роль в изменениях, ускорив «уже идущий процесс». [11]
Тест по чтению SAT состоит из одного раздела из 52 вопросов и ограничен по времени 65 минутами. [42] Все вопросы с несколькими вариантами ответов и основаны на прочтении отрывков. Некоторые отрывки могут сопровождаться таблицами, графиками и диаграммами, но для правильного ответа на соответствующие вопросы не требуется никаких математических знаний. Тест по чтению состоит из пяти отрывков (до двух из которых могут быть парой небольших отрывков) и десяти или одиннадцати вопросов на каждый отрывок или пару отрывков. Отрывки SAT Reading взяты из трех основных областей: истории, социальных наук и естественных наук. Каждый тест SAT Reading всегда включает: один отрывок из американской или мировой литературы; один отрывок из учредительного документа США или связанного с ним текста; один отрывок об экономике, психологии, социологии или другой социальной науке; и два научных отрывка. Ответы на все вопросы основаны только на содержании, изложенном или подразумеваемом отрывком или парой отрывков. [44]
Тест по чтению (вместе с тестом по письму и языку) дает два дополнительных балла, каждый из которых варьируется от 1 до 15 баллов: [41]
Тест SAT по письму и языку состоит из одного раздела с 44 вопросами с несколькими вариантами ответов и продолжительностью 35 минут. [42] Как и в случае с тестом по чтению, все вопросы основаны на отрывках для чтения, которые могут сопровождаться таблицами, графиками и диаграммами. Экзаменующемуся будет предложено прочитать отрывки и предложить исправления или улучшения подчеркнутого содержания. Чтение отрывков в этом тесте варьируется по содержанию: от тематических аргументов до научно-популярных повествований по различным предметам. Оцениваемые навыки включают: повышение ясности аргументации; улучшение выбора слов; улучшение анализа тем социальных исследований и естественных наук; изменение структуры предложений или слов для повышения организационного качества и воздействия письма; а также исправление или улучшение структуры предложения, использования слов и пунктуации. [45]
Тест по письму и языку включает две подоценки, каждая из которых варьируется от 1 до 15 баллов: [41]
Математическая часть SAT разделена на два раздела: тест по математике – без калькулятора и тест по математике – калькулятор . В общей сложности тест SAT по математике длится 80 минут и включает 58 вопросов: 45 вопросов с несколькими вариантами ответов и 13 вопросов с сеткой. [46] Вопросы с множественным выбором имеют четыре возможных ответа; вопросы в виде сетки представляют собой свободный ответ и требуют от тестируемого ответа.
За тест по математике испытуемый получает несколько баллов. Дополнительный балл (по шкале от 1 до 15) присваивается каждой из трех категорий математического содержания:
Оценка за тест по математике указывается по шкале от 10 до 40 с шагом 0,5, а оценка по разделу (равная результату теста, умноженному на 20) указывается по шкале от 200 до 800. [47] [48] [49]
Все научные и большинство графических калькуляторов , включая калькуляторы системы компьютерной алгебры (CAS), разрешено использовать только в разделе SAT Math — Calculator. Разрешены также все четырехфункциональные калькуляторы; однако использование этих устройств не рекомендуется. Все калькуляторы мобильных телефонов и смартфонов, калькуляторы с клавиатурой типа пишущей машинки ( QWERTY ), ноутбуки и другие портативные компьютеры, а также калькуляторы с доступом в Интернет запрещены. [50]
Совет колледжей провел исследование с целью изучить влияние использования калькулятора на результаты теста SAT I: Reasoning Test по математике. Исследование показало, что успеваемость по математическому разделу была связана со степенью использования калькулятора: те, кто использовал калькуляторы примерно от одной трети до половины предметов, получали в среднем более высокие баллы, чем те, кто использовал калькуляторы более или менее часто. Однако эффект «скорее всего был результатом того, что способные учащиеся использовали калькуляторы иначе, чем менее способные учащиеся, а не использования калькулятора как такового». [51] Есть некоторые свидетельства того, что частое использование калькулятора в школе вне ситуации тестирования оказывает положительное влияние на успеваемость по сравнению с теми, кто не использует калькуляторы в школе. [52]
Большинство вопросов SAT, за исключением ответов по математике, имеют множественный выбор ; все вопросы с несколькими вариантами ответов имеют четыре варианта ответа, один из которых правильный. Тринадцать вопросов математической части SAT (около 22% всех вопросов по математике) не имеют множественного выбора. [53] Вместо этого они требуют, чтобы испытуемый ввел число в сетке из четырех столбцов.
Все вопросы по каждому разделу SAT имеют одинаковый вес. За каждый правильный ответ добавляется один необработанный балл. [54] За неправильные ответы баллы не снимаются. Окончательный балл выводится из исходного балла; Точная таблица преобразования варьируется в зависимости от администрации тестирования.
В США экзамен SAT предлагается семь раз в год: в августе, октябре, ноябре, декабре, марте, мае и июне. Иностранным студентам SAT предлагается четыре раза в год: в октябре, декабре, марте и мае (исключение 2020 года: для покрытия отмены мая во всем мире был введен дополнительный сентябрьский экзамен, а август также был доступен для международных тестируемых). Для администраций октября, ноября, декабря, мая и июня тест обычно предлагается в первую субботу месяца. [55] [56] Тест прошли 1 913 742 выпускника средней школы в классе 2023 года. [3]
Кандидаты, желающие пройти тест, могут зарегистрироваться онлайн на веб-сайте Совета колледжей или по почте не позднее, чем за три недели до даты теста.
По состоянию на 2022 год стоимость SAT составляет 60 долларов США плюс дополнительные сборы при сдаче экзамена за пределами США. [29] Совет колледжей освобождает от платы студентов с низкими доходами. Дополнительная плата взимается за позднюю регистрацию, резервное тестирование, изменение регистрации, оценку по телефону и дополнительные отчеты о результатах (помимо четырех, предоставляемых бесплатно).
Студенты с поддающимися подтверждению инвалидностью, в том числе с физическими недостатками и трудностями в обучении, имеют право сдавать SAT с учетом условий. Стандартное увеличение времени для учащихся, которым требуется дополнительное время из-за неспособности к обучению или физических недостатков, составляет время + 50%; время +100% также предлагается.
В январе 2022 года Совет колледжей объявил, что SAT будет переведен с бумажного формата на цифровой (компьютерный). [12] Международные (за пределами США) центры тестирования начали использовать цифровой формат 11 марта 2023 года. SAT в декабре 2023 года был последним тестом SAT, предложенным на бумаге. Переход на цифровой формат запланирован на 9 марта 2024 года в США. [57] Проведение цифрового SAT занимает примерно на час меньше, чем бумажный тест (два часа против трех). Он, как и прежде, проводится в официальном экзаменационном центре, но студенты используют собственные устройства для тестирования (портативный компьютер или планшет). Если студент не может принести свое собственное устройство, его можно запросить в Совете колледжа. [58] Перед проведением теста приложение College Board «Bluebook» должно быть успешно установлено на тестируемом устройстве. [59]
Новый тест является адаптивным, то есть учащимся предлагается по два модуля на каждый раздел (чтение/письмо и математика), при этом второй модуль адаптируется к продемонстрированному уровню на основе результатов первого модуля. В разделах чтения и письма вопросы будут содержать более короткие отрывки для каждого вопроса. В математических разделах слова «задачи» будут более краткими. У студентов есть десятиминутный перерыв после первых двух модулей английского языка и перед двумя модулями математики. Таймер встроен в программное обеспечение для тестирования и автоматически запустится, как только студент завершит второй модуль английского языка. В новый тест также включены новые инструменты, такие как пометка вопросов, таймер и встроенный графический калькулятор. [60]
Учащиеся получают онлайн-отчеты о результатах примерно через две-три недели после проведения теста (дольше, если результаты по почте отправляются в бумажном виде). [61] В отчет включается общий балл (сумма баллов по двум разделам, каждый из которых оценивается по шкале от 200 до 800) и три дополнительных балла (по чтению, письму и анализу, каждый по шкале 2). –8) для факультативного эссе. [62] За дополнительную плату учащиеся также могут получить различные услуги по проверке результатов, в том числе (для некоторых администраций тестирования) Службу вопросов и ответов, которая предоставляет вопросы теста, ответы учащегося, правильные ответы, а также тип и сложность. каждого вопроса. [63]
Кроме того, учащиеся получают два процентиля , каждый из которых определяется Советом колледжа как процент студентов в группе сравнения с равными или более низкими результатами тестов. Один из процентилей, называемый «Процентиль национальной репрезентативной выборки», использует в качестве группы сравнения всех 11- и 12-классников в Соединенных Штатах, независимо от того, сдавали ли они SAT или нет. Этот процентиль является теоретическим и выводится с использованием методов статистического вывода . Второй процентиль, называемый «Процентиль пользователей SAT», использует фактические баллы сравнительной группы студентов из США, недавно сдавших SAT. Например, в 2019–2020 учебном году процентиль пользователей SAT основывался на результатах тестов учащихся выпускных классов 2018 и 2019 годов, сдавших SAT (в частности, версию 2016 года) в старшей школе. Учащиеся получают оба типа процентилей для общего балла, а также для баллов по разделам. [62]
В следующей таблице приведены исходные процентили, использованные для версии SAT, проводившейся с марта 2005 года по январь 2016 года. В этих процентилях в качестве группы сравнения использовались учащиеся выпускного класса 2006 года. [64] [65]
Средний устный балл составил 461 для студентов, сдавших SAT, и 383 для выборки всех студентов. [67]
Математические оценки за 1969–70 годы были разбиты по полу, а не представлены в целом; средний балл по математике у мальчиков составил 415, у девочек - 378. Различия по математике в национальной выборке населения (не показаны в таблице) были аналогичны различиям в вербальном разделе. [67]
Версия SAT, введенная до апреля 1995 года, имела очень высокий потолок. Например, в 1985–1986 учебном году только 9 учащихся из 1,7 миллиона тестируемых набрали 1600 баллов. [68]
В 2015 году средний балл по выпуску 2015 года составил 1490 из максимальных 2400. Это на 7 баллов ниже показателя предыдущего класса и является самым низким совокупным баллом за последнее десятилетие. [38]
Совет колледжа и компания ACT, Inc. провели совместное исследование студентов, сдавших SAT и ACT в период с сентября 2004 г. (для ACT) или с марта 2005 г. (для SAT) по июнь 2006 г. Были предоставлены таблицы для согласования результатов за экзамены. студенты , сдавшие SAT после января 2005 года и до марта 2016 года . а также таблицы для согласования результатов SAT, используемых с марта 2016 года с ACT. [71]
В 2018 году Совет колледжей в сотрудничестве с ACT представил новую таблицу соответствия, чтобы лучше сравнивать результаты одного теста с другим. [72] В настоящее время это соглашение считается официальным соглашением, которое будет использоваться профессионалами колледжей, и оно заменяет соглашение 2016 года. В новом соглашении больше нет старого SAT (из 2400), а только новый SAT (из 1600) и АСТ (из 36).
По состоянию на 2018 год наиболее подходящий балл SAT для данного балла ACT также показан в таблице ниже. [73]
[74] Подготовка к SAT , впервые предложенная Стэнли Капланом в 1946 году с 64-часовым курсом, стала очень прибыльной областью. [75] Многие компании и организации предлагают подготовку к экзаменам в виде книг, занятий, онлайн-курсов и репетиторства. [76] Индустрия подготовки к экзаменам возникла почти одновременно с введением вступительных экзаменов в университеты в США и с самого начала процветала. [77] Мошенничество при подготовке к экзаменам является настоящей проблемой для родителей и учащихся. [78] В целом, американцы восточноазиатского происхождения, особенно американцы корейского происхождения , чаще всего посещают частные курсы подготовки к SAT, в то время как афроамериканцы предпочитают индивидуальное обучение для корректирующего обучения . [79]
Тем не менее, Совет колледжа утверждает, что SAT по сути не поддается обучению, а исследования Совета колледжей и Национальной ассоциации консультирования при поступлении в колледж показывают, что курсы репетиторства приводят к среднему увеличению примерно на 20 баллов по математическому разделу и на 10 баллов по вербальному разделу. . [80] Действительно, исследователи неоднократно доказывали, что подготовительные курсы, как правило, в лучшем случае предлагают скромный прирост к результатам тестов. [81] [82] [83] Как и показатели IQ, которые являются сильной корреляцией, результаты SAT, как правило, стабильны с течением времени, а это означает, что курсы подготовки к SAT предлагают лишь ограниченное преимущество. [84] Ранний метаанализ (1983 г.) обнаружил аналогичные результаты и отметил, что «размер эффекта коучинга, оцененный на основе сопоставленных или рандомизированных исследований (10 баллов), кажется слишком малым, чтобы иметь практическое значение». [85] Статистики Бен Доминг и Дерек К. Бриггс изучили данные лонгитудинального исследования образования 2002 года и обнаружили, что эффекты коучинга были статистически значимы только для математики; более того, коучинг оказал большее влияние на некоторых студентов, чем на других, особенно на тех, кто прошел строгие курсы, и на тех, кто имеет высокий социально-экономический статус. [86] Систематический обзор литературы 2012 года оценил тренерский эффект в 23 и 32 балла за математические и вербальные тесты соответственно. [77] Метаанализ 2016 года оценил размер эффекта в 0,09 и 0,16 для вербального и математического разделов соответственно, хотя наблюдалась большая степень гетерогенности. [87] Между тем, исследование 2011 года показало, что эффект индивидуального обучения минимален среди всех этнических групп. [79] Непонимание общественностью того, как готовиться к SAT, продолжает эксплуатироваться индустрией подготовки. [13]
Хотя существует связь между семейным прошлым и прохождением курса подготовки к SAT, не все студенты получают равную выгоду от таких инвестиций. Фактически, любой средний прирост баллов SAT благодаря таким курсам в первую очередь обусловлен улучшениями среди американцев Восточной Азии. [88] Когда эта группа будет разбита еще дальше, американцы корейского происхождения с большей вероятностью будут проходить курсы подготовки к SAT, чем американцы китайского происхождения , в полной мере используя преимущества своих церковных общин и этнической экономики. [89]
Совет колледжа объявил о партнерстве с некоммерческой организацией «Академия Хана» с целью предоставления бесплатных материалов для подготовки к экзаменам, начиная с 2015–16 учебного года, чтобы помочь выровнять правила игры для студентов из малообеспеченных семей. [9] [38] Студенты также могут обойти дорогостоящие программы подготовки, используя более доступное официальное руководство от Совета колледжей и имея хорошие учебные привычки. [90]
Есть некоторые свидетельства того, что хотя бы один раз сдача PSAT может помочь учащимся лучше сдать SAT; [91] Более того, как и в случае с SAT, лучшие результаты по PSAT могли получать стипендии. [36] По мнению ученого-когнитивиста Сиан Бейлок , «удушье» или некачественную успеваемость в важных случаях, таких как сдача SAT, можно предотвратить, выполняя множество практических вопросов и контролируя экзамены для улучшения процедурной памяти , а также используя буклет для запишите промежуточные шаги, чтобы избежать перегрузки рабочей памяти, и напишите дневниковую запись о своих тревогах в день экзамена, чтобы повысить самосочувствие и позитивную самооценку. [92] Гигиена сна важна, поскольку качество сна в дни, предшествующие экзамену, может улучшить работоспособность. Более того, было показано, что более позднее время занятий (8:30 утра, а не 7:30 утра), которое лучше соответствует смещенному циркадному ритму подростков, может поднять баллы SAT настолько, что изменится уровень поступления студентов в колледжи и университеты. к. [93] [94]
В 2009 году исследователи образования Ричард К. Аткинсон и Сол Гейзер из системы Калифорнийского университета (UC) утверждали, что средний балл средней школы лучше, чем SAT, при прогнозировании оценок в колледже, независимо от типа или качества средней школы. [95] По словам Уильяма Макгерна из Wall Street Journal , некоторые чиновники Калифорнийского университета надеются увеличить число посещающих его студентов афро- и латиноамериканского происхождения, отказавшись от экзамена SAT или иным образом поставив его под сомнение, что, в свою очередь, позволит уменьшение количества американских студентов азиатского происхождения, которые широко представлены в студенческом сообществе Калифорнийского университета (29,5%), по сравнению с их долей в населении Калифорнии (13,6%). [96] Однако утверждения Аткинсона и Гейзера о лучшей прогностической способности среднего балла средней школы были оспорены академическим сенатом Калифорнийского университета. [96] В своем отчете за 2020 год академический сенат Калифорнийского университета обнаружил, что SAT лучше, чем средний балл средней школы, прогнозирует средний балл первого года обучения и так же хорош, как средний балл средней школы, при прогнозировании среднего балла бакалавриата, удержания студентов на первом курсе и окончания обучения. Было обнаружено, что эта прогностическая достоверность сохраняется во всех демографических группах, при этом в отчете отмечается, что результаты стандартизированных тестов на самом деле были «лучшими предикторами успеха для учащихся, которые являются учащимися из недостаточно представленных меньшинств (URM), которые относятся к первому поколению или чьи семьи имеют низкий доход. ." [97] Ряд отчетов Совета колледжей указывают на аналогичную прогностическую достоверность среди демографических групп. [98] [99] Через месяц после отчета академического сената Калифорнийского университета Сол Гейзер оспорил выводы академического сената Калифорнийского университета, обнаружив, что «заявления Сената являются «ложными» и основаны на фундаментальной ошибке, заключающейся в исключении демографических данных студентов из модели прогнозирования». Показывая, когда средний балл средней школы сочетается с демографическими данными в прогнозе, SAT менее надежен. Ли Цай, профессор Калифорнийского университета в Лос-Анджелесе, который руководит Национальным центром исследований в области оценки, стандартов и тестирования студентов, отметил, что Академический сенат Калифорнийского университета действительно включил демографические данные студентов, «использовав другую, более простую модель для понимания общественности» и что дискриминационный подход Влияние SAT компенсируется в процессе поступления. Джесси Ротштейн, профессор государственной политики и экономики Калифорнийского университета в Беркли, опроверг утверждение Ли, отметив, что академический сенат Калифорнийского университета «многие ошибается в отношении SAT», преувеличивает ценность SAT и «нет оснований для своего вывода о том, что Прием в Калифорнийский университет «компенсирует» разницу в результатах тестов между группами». [100]
SAT коррелирует с интеллектом и, как таковой, оценивает индивидуальные различия. Однако здесь ничего не говорится об «эффективной когнитивной деятельности (то, что делают умные люди)». [13] Он также не измеряет некогнитивные характеристики, связанные с академическими успехами, такие как позитивное отношение или добросовестность . [13] [101] Психометристы Томас Р. Койл и Дэвид Р. Пиллоу показали в 2008 году, что SAT предсказывает средний балл колледжа даже после исключения общего фактора интеллекта ( g ), с которым он сильно коррелирует. [102] Исследование 2009 года показало, что баллы SAT или ACT наряду со средним баллом средней школы являются сильными предикторами совокупного среднего балла университета. В частности, те, у кого результаты стандартизированных тестов были на уровне 50-го процентиля или выше, имели две трети шансов получить совокупный университетский средний балл в верхней половине. [103] [14] Метаанализ 2010 года, проведенный исследователями из Университета Миннесоты, предоставил доказательства того, что стандартизированные вступительные тесты, такие как SAT, предсказывают не только средний балл первокурсника, но и общий средний балл колледжа. [101] [84] Исследование, проведенное в 2012 году в том же университете с использованием межведомственного набора данных, показало, что даже после учета социально-экономического статуса и среднего балла средней школы результаты SAT по-прежнему были способны предсказать средний балл первокурсников среди студентов университетов или колледжей. [104] Исследование, проведенное в 2019 году с размером выборки около четверти миллиона студентов, показывает, что вместе результаты SAT и средний балл средней школы являются отличным предиктором среднего балла первокурсника и удержания студентов на втором курсе. [13] В 2018 году психологи Орен Р. Шевак, Кайл Д. МакНил, Натан Р. Кансел и Пол Р. Сакетт показали, что как средний балл средней школы, так и баллы SAT предсказывают зачисление на университетские курсы продвинутого уровня, даже после контроля за продвинутым курсом. кредиты. [105] [13]
Экономист в области образования Джесси М. Ротштейн отметил в 2005 году, что средние баллы SAT в средней школе лучше прогнозируют средний балл первокурсников университета по сравнению с индивидуальными баллами SAT. Другими словами, результаты SAT учащегося не были столь информативны в отношении будущих успехов в учебе, как средний балл по средней школе. Напротив, средний балл средней школы был лучшим предиктором студенческого успеха, чем средний балл средней школы. [106] [107] Кроме того, сотрудник приемной комиссии, который не принял во внимание средние баллы SAT, рискует переоценить будущую успеваемость учащегося из школы с низкими баллами и недооценить будущую успеваемость учащегося из школы с высокими баллами. [107]
Как и другие стандартизированные тесты, такие как ACT или GRE, SAT является традиционным методом оценки академических способностей учащихся, имеющих совершенно разный образовательный опыт, и поэтому ориентирован на общие материалы, которые, как можно было бы разумно ожидать, будут знать учащиеся. встречались на протяжении всего обучения. Таким образом, раздел математики, например, не содержит материалов выше уровня предварительного исчисления . Психолог Рэймонд Кеттелл назвал это проверкой «исторического», а не «текущего» кристаллизованного интеллекта . [108] Психолог Скотт Барри Кауфман далее отметил, что SAT может только оценить работу человека в определенный момент времени. [109] Психологи-педагоги Джонатан Вай, Дэвид Лубински и Камилла Бенбоу заметили, что один из способов повысить прогностическую достоверность SAT — это оценить способность учащегося к пространственному мышлению , поскольку в настоящее время SAT не содержит вопросов на этот счет. Навыки пространственного мышления важны для успеха в STEM. [110] Исследование 2006 года, проведенное психометристом Робертом Штернбергом, показало, что способность результатов SAT и среднего балла средней школы предсказывать успеваемость в колледже может быть дополнительно улучшена за счет дополнительных оценок аналитического, творческого и практического мышления. [111] [112]
Психолог-экспериментатор Мередит Фрей отметила, что, хотя достижения в области исследований в области образования и нейробиологии могут помочь постепенно улучшить способность прогнозировать успеваемость в будущем, SAT или другие стандартизированные тесты, подобные этому, останутся ценным инструментом для дальнейшего развития. [13] В статье для The New York Times в 2014 году психолог Джон Д. Майер назвал прогностические способности SAT «поразительным достижением» и предостерег от того, чтобы делать его и другие стандартизированные тесты необязательными. [113] [14] Исследования психометристов Дэвида Лубински, Камиллы Бенбоу и их коллег показали, что SAT может даже предсказать результаты жизни за пределами университета. [14]
SAT строго оценивает умственную выносливость учащихся, память, скорость, точность и способность к абстрактному и аналитическому мышлению. [90] Для американских университетов и колледжей результаты стандартизированных тестов являются наиболее важным фактором при поступлении, уступая только средним баллам средней школы. [112] Однако по международным стандартам экзамен SAT не так уж и сложен. [114] Например, тест на академические способности в колледже Южной Кореи ( CSAT ) и вступительный экзамен в Финляндии являются более длительными, жесткими и имеют большее значение для поступления студента в университет. [115] Во многих странах мира экзамены, включая вступительные экзамены в университеты, являются единственным решающим фактором при поступлении; школьные оценки просто не имеют значения. [114] В Китае и Индии успешная сдача экзаменов Gaokao или IIT-JEE соответственно повышает социальный статус студентов и их семей. [116]
В статье 2012 года психолог-педагог Джонатан Вай утверждал, что SAT слишком прост, чтобы быть полезным для наиболее конкурентоспособных колледжей и университетов, абитуриенты которых обычно имеют блестящие средние баллы средней школы и результаты стандартизированных тестов. Поэтому на приемных комиссиях лежала обязанность отличать лучших результатов друг от друга, не зная, действительно ли идеальные или почти идеальные баллы студентов отражают их учебные способности. Он предложил Совету колледжей усложнить тест SAT, что повысит верхний предел измерений и позволит лучшим школам выявить лучших и самых способных абитуриентов. [117] В то время Совет колледжей уже работал над ужесточением SAT. [117] Изменения были объявлены в 2014 году и реализованы в 2016 году. [118]
Осознав, что тест в июне 2018 года оказался проще, чем обычно, Совет колледжей внес изменения, в результате чего результаты оказались ниже ожидаемых, что вызвало жалобы со стороны студентов, хотя некоторые понимали, что это было сделано для обеспечения справедливости. [119] В своем анализе инцидента издание Princeton Review поддержало идею завышения оценок, но отметило, что тест неспособен отличить учащихся с 86-м процентилем (650 баллов) или выше по математике. Журнал Princeton Review также отметил, что эта конкретная кривая необычна тем, что не обеспечивает защиты от ошибок по неосторожности или в последнюю минуту для успешных студентов. [120] The Review опубликовал аналогичную запись в блоге для SAT в августе 2019 года, когда произошел аналогичный инцидент, и Совет колледжа отреагировал таким же образом, отметив: «Студент, который пропустит два вопроса на более простом тесте, не должен получить такой же хороший результат». балл учащегося, который пропустил два вопроса в сложном тесте. Приравнивание решает эту проблему». Он также предостерег студентов от немедленной повторной сдачи SAT, поскольку они могут снова разочароваться, и рекомендовал им вместо этого дать себе некоторую свободу действий, прежде чем пытаться снова. [121]
За пределами США экзамен SAT рассматривается для поступления в университеты в Канаде, Великобритании, Австралии, Сингапуре и Индии, а также в десятках других стран. По состоянию на начало 2022 года около 4000 высших учебных заведений по всему миру принимают SAT. [122]
В исследовании 2000 года психометрист Энн М. Галлахер и ее коллеги обнаружили, что только лучшие студенты использовали интуитивные рассуждения при решении задач, возникающих в математическом разделе SAT. [123] Когнитивные психологи Бренда Хэннон и Мэри Макнотон-Кассил обнаружили, что наличие хорошей рабочей памяти , способности к интеграции знаний и низкого уровня тревожности перед экзаменами предсказывает высокие результаты на SAT. [124]
Фрей и Деттерман (2004) исследовали связь результатов SAT с результатами тестов интеллекта. Используя оценку общих умственных способностей , или g , на основе Батареи профессиональных способностей вооруженных сил , они обнаружили, что баллы SAT сильно коррелируют с g (r = 0,82 в их выборке, 0,857 с поправкой на нелинейность) в их выборке. выборка взята из национального вероятностного исследования 1979 года. Кроме того, они исследовали корреляцию между результатами SAT, используя пересмотренную и обновленную форму теста, и баллами по расширенным прогрессивным матрицам Равена , тесту на подвижный интеллект (рассуждение), на этот раз с использованием неслучайной выборки. Они обнаружили, что корреляция результатов SAT с баллами по расширенной прогрессивной матрице Равена составила 0,483. По их оценкам, эта корреляция составила бы около 0,72, если бы не ограничение диапазона способностей в выборке. Они также отметили, что на баллы Ворона, по-видимому, существовал эффект потолка , который мог подавлять корреляцию. [125] Божан и его коллеги (2006) пришли к выводам, аналогичным выводам Фрея и Деттермана. [126] Поскольку SAT тесно коррелирует с общим интеллектом, его можно использовать в качестве косвенного показателя для измерения интеллекта, особенно когда трудоемкие традиционные методы оценки недоступны. [13]
Психометрист Линда Готфредсон отметила, что SAT эффективен для выявления интеллектуально одаренных студентов, поступающих в колледж. [127]
На протяжении десятилетий многие критики обвиняли разработчиков вербального SAT в культурной предвзятости как объяснении разницы в баллах между более бедными и богатыми тестируемыми [128] , причем самые большие критики исходили из системы Калифорнийского университета. [129] [130] Известным примером этой предполагаемой предвзятости в SAT I был вопрос по аналогии с гребцом и регатой , который больше не является частью экзамена. Целью вопроса было найти пару терминов, отношения которых наиболее похожи на отношения между «бегун» и «марафон». Правильный ответ — «гребец» и «регата». Считалось, что выбор правильного ответа предполагал знакомство студентов с греблей — видом спорта, популярным среди богатых. [131] Однако для психометристов вопросы по аналогии являются полезным инструментом для оценки умственных способностей студентов, поскольку, даже если значение двух слов неясно, студент с достаточно сильными навыками аналитического мышления все равно должен быть в состоянии определить их взаимосвязи. . [129] Вопросы по аналогии были удалены в 2005 году. [132] На их месте появились вопросы, которые предоставляют больше контекстной информации, если учащиеся не знают соответствующего определения слова, что облегчает им угадывание правильного ответа. [133]
В 2010 году физики Стивен Сюй и Джеймс Шомберт из Университета Орегона изучили записи учащихся своей школы за пять лет и обнаружили, что академический статус студентов, специализирующихся по математике или физике (но не по биологии, английскому языку, социологии или истории), сильно изменился. зависит от результатов SAT по математике. Студенты с баллами SAT по математике ниже 600 вряд ли преуспеют по математике или физике. Тем не менее, они не обнаружили таких закономерностей между устным тестом SAT или сочетанием словесного теста SAT и математики и другими вышеупомянутыми предметами. [134] [135]
В 2015 году психолог-педагог Джонатан Вай из Университета Дьюка проанализировал средние результаты экзаменов по генеральному классификационному тесту армии в 1946 году (10 000 студентов), квалификационному тесту колледжа выборочной службы в 1952 году (38 420), проекту «Талант» в начале 1970-х годов (400 000), Экзамены для выпускников в период с 2002 по 2005 год (более 1,2 миллиона) и SAT Math and Verbal в 2014 году (1,6 миллиона). Вай выявил одну закономерность: те, у кого самые высокие результаты тестов, как правило, выбирают физику и инженерное дело в качестве своих специальностей, в то время как те, у кого самые низкие результаты, чаще выбирают образование и сельское хозяйство. (См. рисунок ниже.) [135] [136]
В статье Лоры Х. Ганн и ее коллег за 2020 год, в которой изучались данные из 1389 учебных заведений по всей территории Соединенных Штатов, были обнаружены сильные положительные корреляции между средними процентилями SAT поступающих студентов и долей выпускников, специализирующихся в области STEM и социальных наук. С другой стороны, они обнаружили отрицательную корреляцию между первым и долей выпускников в области психологии, теологии, правоохранительных органов, отдыха и фитнеса. [137]
Различные исследователи установили, что средние баллы SAT или ACT и рейтинг колледжа в US News & World Report тесно связаны – почти 0,9. [13] [138] [83] [b] В период с 1980-х по 2010-е годы население США росло, в то время как университеты и колледжи не расширили свои возможности столь существенно. В результате количество поступающих значительно снизилось, а это означает, что стало труднее поступить в школу, среди выпускников которой есть родители. Кроме того, современные студенты с высокими баллами гораздо чаще покидают свои родные города в поисках высшего образования в престижных учебных заведениях. Следовательно, стандартизированные тесты, такие как SAT, являются более надежным показателем избирательности, чем уровень поступления. Тем не менее, когда Майкл Дж. Петрилли и Педро Энаморадо проанализировали совокупные баллы SAT (математические и вербальные) поступающих первокурсников 1985 и 2016 годов из лучших университетов и гуманитарных колледжей США, они обнаружили, что средние баллы новых студентов увеличился на 93 пункта по своей выборке, с 1216 до 1309. В частности, в четырнадцати учебных заведениях наблюдался рост как минимум на 150 пунктов, в том числе в Университете Нотр-Дам (с 1290 до 1440, или 150 пунктов) и Колледже Илона (с 952 пунктов). до 1192, или 240 очков). [139]
Хотя есть свидетельства того, что частные школы, как правило, выпускают учащихся, которые лучше справляются со стандартизированными тестами, такими как ACT или SAT, Кевен Дункан и Джонатан Сэнди показали, используя данные Национального лонгитюдного опроса молодежи , что, когда характеристики учащихся, такие как поскольку были приняты во внимание возраст, раса и пол (7%), семейное происхождение (45%), качество школы (26%) и другие факторы, преимущество частных школ уменьшилось на 78%. Исследователи пришли к выводу, что учащиеся, посещающие частные школы, уже сами по себе обладают качествами, связанными с высокими баллами. [140]
Исследование системы Калифорнийского университета, опубликованное в 2001 году и анализирующее данные студентов с осени 1996 года по осень 1999 года включительно, показало, что SAT II [c] был единственным лучшим предиктором университетского успеха с точки зрения среднего балла первокурсника, за которым следовал высокий средний балл студентов. -школьный средний балл и, наконец, SAT I. После учета семейного дохода и образования родителей и без того низкая способность SAT измерять способности и готовность к поступлению в колледж резко упала, в то время как более значительные способности и готовность к колледжу измерялись средним баллом средней школы и средним баллом средней школы. SAT II остался неизменным (и даже немного увеличился). Система Калифорнийского университета требовала от поступающих в систему UC сдачи SAT I и SAT II в течение четырех академических лет обучения. [141] Этот анализ широко разрекламирован, но противоречит многим исследованиям. [101]
Есть свидетельства того, что SAT коррелирует с социальными и образовательными результатами, [109] включая завершение четырехлетней университетской программы. [142] В статье 2012 года психологов из Университета Миннесоты, анализирующей межинституциональные наборы данных, предполагается, что SAT сохраняет свою способность прогнозировать успеваемость в колледже даже после контроля социально-экономического статуса (измеряемого сочетанием уровня образования родителей и дохода) и средний балл средней школы. Это означает, что результаты SAT были не просто показателем социально-экономического статуса, пришли к выводу исследователи. [104] [143] Этот вывод был повторен и оказался справедливым для всех расовых или этнических групп и для обоих полов. [13] Более того, исследователи из Миннесоты обнаружили, что распределение социально-экономического статуса учащихся исследованных школ отражает распределение их соответствующих групп абитуриентов. [104] Из-за того, что он измеряет, баллы SAT человека не могут быть отделены от его социально-экономического положения. [109] Однако корреляция между баллами SAT и доходом или социально-экономическим статусом родителей не должна рассматриваться как причинно-следственная связь . Возможно, у людей с высокими показателями умные родители, которые выполняют работу, требующую когнитивных функций, и поэтому получают более высокую зарплату. [144] Кроме того, корреляция значима только между биологическими семьями, а не приемными, что позволяет предположить, что это может быть связано с генетическим наследием , а не с экономическим богатством. [145] [146]
В 2007 году Ребекка Цвик и Дженнифер Грейф Грин заметили, что типичный анализ не принимает во внимание неоднородность средних школ, которые посещают учащиеся, с точки зрения не только социально-экономического статуса учащихся, но и стандартов оценок. Цвик и Грайф Грин показали, что при их учете корреляция между социально-экономическим статусом семьи, оценками и рангами в классе увеличивается, тогда как корреляция между социально-экономическим статусом и баллами SAT снижается. Они пришли к выводу, что школьные оценки и результаты SAT аналогичным образом связаны с доходом семьи. [106]
По данным Совета колледжей, в 2019 году у 56% тестируемых были родители с высшим образованием, у 27% родителей - с дипломом не выше средней школы и около 9% - не окончившими среднюю школу. (8% не ответили на вопрос.) [37]
Одним из предлагаемых частичных объяснений разрыва между азиатскими и европейско-американскими студентами в успеваемости, измеряемом, например, по SAT, является общая тенденция азиатов происходить из стабильных семей с двумя родителями. [147] В своем анализе данных Национального лонгитюдного исследования Бюро статистики труда в 2018 году экономисты Адам Бландин, Кристофер Херрингтон и Аарон Стилман пришли к выводу, что структура семьи играет важную роль в определении результатов обучения в целом и результатов SAT в частности. . Семьи, в которых только один родитель не имеет ученой степени, обозначались как 1L, с двумя родителями, но не имеющими ученой степени, - 2L, а с двумя родителями, имеющими хотя бы одно высшее образование - 2H. Дети из семей 2H имели значительное преимущество перед детьми из семей 1L, и этот разрыв увеличился в период с 1990 по 2010 годы. , разрыв между ними увеличился на 21 пункт, или пятую часть стандартного отклонения. [142]
В беседе с The Wall Street Journal семейный социолог У. Брэдфорд Уилкокс заявил: «В отсутствие результатов SAT, которые могли бы определить детей из трудных семей с большим академическим потенциалом, стабильность семьи, вероятно, будет выглядеть еще более серьезной при определении того, кто выдержит испытание». финишная черта колледжа в Калифорнии [чья система государственных университетов решила прекратить требовать баллы SAT и ACT для поступления в 2020 году]». [96]
В 2013 году Американский совет по тестированию колледжей опубликовал отчет, в котором говорилось, что мальчики превзошли девочек по разделу теста по математике [148] — значительный разрыв, который сохраняется на протяжении более 35 лет. [149] По состоянию на 2015 год мальчики в среднем набирали на 32 балла больше, чем девочки, по разделу SAT по математике. Среди тех, кто набрал 700–800 баллов, соотношение мужчин и женщин составляло 1,6:1. [150] В 2014 году психолог Стивен Сеси и его коллеги обнаружили, что мальчики справляются лучше, чем девочки, во всех процентилях. Например, девочка, вошедшая в 10% лучших представителей своего пола, будет входить только в 20% лучших среди мальчиков. [151] [152] В 2010 году психолог Джонатан Вай и его коллеги, проанализировав данные за три десятилетия с участием 1,6 миллиона интеллектуально одаренных семиклассников из Программы выявления талантов Университета Дьюка (TIP), показали, что в 1980-х годах гендерный разрыв в По математическому разделу SAT среди студентов, набравших верхние 0,01%, соотношение было 13,5:1 в пользу мальчиков, но к 1990-м годам оно упало до 3,8:1. [153] [152] Резкое соотношение полов 1980-х годов повторяет данные другого исследования с использованием выборки из Университета Джонса Хопкинса. [154] Это соотношение аналогично тому, которое наблюдалось для оценок ACT по математике и естественным наукам в период с начала 1990-х до конца 2000-х годов. [153] В конце 2000-х годов оно практически не изменилось. [153] [155] Половые различия в результатах SAT по математике начали проявляться на уровне 400 баллов и выше. [153]
Некоторые исследователи указывают на доказательства в пользу большей вариативности мужских навыков вербального и количественного мышления. [156] В разных культурах была обнаружена большая изменчивость мужского веса, роста и когнитивных способностей, что привело к большему числу мужчин в самых низких и самых высоких распределениях тестирования. [157] Следовательно, большее количество мужчин обнаруживается как в верхних, так и в нижних крайностях распределения результатов математических разделов стандартизированных тестов, таких как SAT, что приводит к наблюдаемому гендерному несоответствию. [158] [152] [159] Парадоксально, но это противоречит тенденции девочек иметь более высокие оценки в классе, чем мальчики, [152] доказывая, что у них нет недостатка в школьных способностях. Однако мальчики, как правило, лучше справляются с вопросами стандартизированных тестов, не связанными напрямую с учебной программой. [156]
С другой стороны, Вай и его коллеги обнаружили, что оба пола в верхних 5% оказались более или менее на равных, когда дело дошло до вербальной части SAT, хотя девочки получили небольшое, но заметное преимущество перед мальчиками, начиная с середина 1980-х годов. [154] Психолог Дэвид Любински, который проводил продольные исследования семиклассников, набравших исключительно высокие баллы по SAT, обнаружил аналогичный результат. У девочек, как правило, были лучшие навыки вербального рассуждения, а у мальчиков - математические способности. [159] Это отражает другие исследования когнитивных способностей населения в целом, а не только людей с 95-м процентилем и выше. [154] [159]
Хотя такие аспекты тестирования, как угроза стереотипов, вызывают беспокойство, исследования прогностической достоверности SAT показали, что он, как правило, является более точным предиктором среднего балла женщин в университете по сравнению со средним баллом мужчин. [160]
Математические задачи SAT можно разделить на две группы: традиционные и нетрадиционные. Обычные проблемы можно решать регулярно с помощью знакомых формул или алгоритмов, в то время как нетрадиционные требуют более творческого мышления, чтобы необычно использовать знакомые методы решения или прийти к конкретным идеям, необходимым для решения этих проблем. В 2000 году психометрист ETS Энн М. Галлахер и ее коллеги проанализировали, как студенты решают раскрытые вопросы математики SAT в самоотчетах. Они обнаружили, что для обоих полов наиболее предпочтительным подходом было использование формул или алгоритмов, изученных в классе. Однако когда это не удалось, мужчины чаще, чем женщины, находили подходящие методы решения. Предыдущие исследования показали, что мужчины с большей вероятностью будут искать необычные пути решения проблемы, тогда как женщины склонны придерживаться того, чему они научились в классе, и что женщины с большей вероятностью найдут подходящие подходы, если для этого не требуется ничего, кроме овладения учебными материалами. [123]
В более старых версиях SAT студентов спрашивали, насколько они уверены в своих математических способностях и способностях к вербальному рассуждению, в частности, верят ли они, что входят в первые 10%. Девин Дж. Поуп проанализировал данные более четырех миллионов тестируемых с конца 1990-х по начало 2000-х годов и обнаружил, что люди с высокими показателями с большей вероятностью были уверены, что входят в 10% лучших, причем те, кто набрал лучшие результаты, сообщили о самом высоком уровне уверенности. Но между полами были заметные различия. Мужчины, как правило, были гораздо более уверены в своих математических способностях, чем женщины. Например, среди тех, кто набрал 700 баллов по математике, 67% мужчин ответили, что считают себя в числе 10% лучших, тогда как только 56% женщин сделали то же самое. Женщины, с другой стороны, были немного более уверены в своих способностях к вербальному рассуждению, чем мужчины. [161]
Когнитивные нейробиологи Ричард Хайер и Камилла Перссон Бенбоу использовали позитронно-эмиссионную томографию ( ПЭТ ) для исследования скорости метаболизма глюкозы среди студентов, сдавших SAT. Они обнаружили, что среди мужчин те, у кого были более высокие оценки по математике по SAT, демонстрировали более высокие показатели метаболизма глюкозы в височных долях , чем те, у кого были более низкие оценки, что противоречит гипотезе эффективности мозга. Эта тенденция, однако, не была обнаружена среди женщин, у которых исследователи не смогли обнаружить какие-либо области коры, связанные с математическим мышлением. Представители обоих полов в среднем набрали одинаковые баллы в выборке и имели в целом одинаковые показатели коркового метаболизма глюкозы. По мнению Хайера и Бенбоу, это свидетельствует о структурных различиях мозга между полами. [162] [16]
Метаанализ результатов 6 246 729 участников, протестированных на когнитивные способности или способности, проведенный в 2001 году , выявил разницу в средних баллах между чернокожими и белыми студентами примерно в 1,0 стандартного отклонения с сопоставимыми результатами для SAT (2,4 миллиона тестируемых). [163] Аналогичным образом, в среднем латиноамериканские и американские студенты успевают по SAT примерно на одно стандартное отклонение ниже, чем белые и азиатские студенты. [164] [165] [166] [167] Кажется, математика — самая трудная часть экзамена. [37] В 1996 году разрыв между черными и белыми в разделе математики составлял 0,91 стандартного отклонения, но к 2020 году он упал до 0,79. [168] В 2013 году американцы азиатского происхождения как группа набрали по математике на 0,38 стандартных отклонения выше, чем белые. [147]
Некоторые исследователи полагают, что разница в баллах тесно связана с общим разрывом в успеваемости в американском обществе между учащимися разных расовых групп. Этот разрыв можно частично объяснить тем фактом, что учащиеся из неблагополучных расовых групп, как правило, ходят в школы с более низким качеством образования. Эта точка зрения подтверждается данными о том, что разрыв между черными и белыми выше в городах и районах, которые более сегрегированы по расовому признаку. [169] Другое исследование указывает на более низкий уровень владения меньшинствами ключевыми курсовыми работами, относящимися к SAT (английский язык и математика), а также давление со стороны сверстников на студентов, которые пытаются сосредоточиться на учебе (« вести себя как белые »). [170] Культурные проблемы также очевидны среди чернокожих студентов из более богатых семей, у которых есть успешные родители. Джон Огбу , нигерийско-американский профессор антропологии, пришел к выводу, что вместо того, чтобы смотреть на своих родителей как на образец для подражания, чернокожая молодежь выбирает других моделей, таких как рэперы, и не прилагает усилий, чтобы хорошо учиться. [171]
В одной серии исследований сообщалось о различном функционировании заданий, а именно о том, что некоторые тестовые вопросы действуют по-разному в зависимости от расовой группы тестируемого, что отражает различия в способности понимать определенные тестовые вопросы или приобретать знания, необходимые для ответа на них, между группами. В 2003 году Фридл опубликовал данные, показывающие, что чернокожие студенты имели небольшое преимущество по устным вопросам, которые на SAT помечены как сложные, тогда как белые и азиатские студенты, как правило, имели небольшое преимущество по вопросам, помеченным как легкие. Фридл утверждал, что эти результаты позволяют предположить, что в «легких» тестовых заданиях используется словарный запас, который легче понять белым учащимся из среднего класса, чем представителям меньшинств, которые часто используют другой язык в домашней обстановке, тогда как в сложных заданиях используется сложный язык, изученный только на лекциях. и учебники, предоставляя обеим группам учащихся равные возможности для их приобретения. [172] [173] [174] Исследование подверглось резкой критике со стороны правления ETS, но результаты были воспроизведены в последующем исследовании Сантелисеса и Уилсона в 2010 году. [175] [176]
Нет никаких доказательств того, что результаты SAT систематически занижают будущую успеваемость учащихся из числа меньшинств. Однако было показано, что прогностическая достоверность SAT зависит от доминирующего этнического и расового состава колледжа. [177] Некоторые исследования также показали, что афроамериканские студенты учатся в колледже хуже, чем их белые сверстники с такими же баллами по SAT; Исследователи утверждают, что это, вероятно, связано с тем, что белые учащиеся, как правило, извлекают выгоду из социальных преимуществ за пределами образовательной среды (например, активное участие родителей в их образовании, включение в учебную деятельность в кампусе, позитивная предвзятость со стороны учителей и сверстников той же расы), что приводит к в более высоких оценках. [178]
Кристофер Дженкс заключает, что афроамериканцы как группа пострадали от введения стандартизированных вступительных экзаменов, таких как SAT. По его словам, это происходит не потому, что сами тесты ошибочны, а из-за предвзятости маркировки и предвзятости отбора; тесты измеряют навыки, которые афроамериканцы с меньшей вероятностью разовьют в процессе социализации, а не те навыки, которые они с большей вероятностью разовьют. Более того, стандартизированные вступительные экзамены часто называют тестами общих способностей, а не определенных аспектов способностей. Таким образом, создается ситуация, в которой способности афроамериканцев постоянно недооцениваются в сфере образования и на рабочем месте, что, в свою очередь, способствует предвзятому отбору в их пользу, что усугубляет неуспеваемость. [178]
Среди основных расовых или этнических групп Соединенных Штатов разрыв в результатах SAT по математике наибольший в хвосте: латиноамериканцы и латиноамериканцы с наибольшей вероятностью наберут самый низкий балл, а американцы азиатского происхождения - самый высокий. Кроме того, есть некоторые данные, свидетельствующие о том, что если бы тест содержал больше вопросов как легкого, так и сложного типа, что увеличило бы вариативность оценок, разрывы были бы еще больше. Например, учитывая распределение азиатов, многие могли бы набрать более 800 баллов, если бы тест позволял им это сделать. (См. рисунок ниже.) [179]
2020 год стал годом, когда образование во всем мире было нарушено пандемией COVID-19 , и действительно, ухудшились результаты учащихся в Соединенных Штатах по стандартизированным тестам, таким как SAT. Однако пробелы сохранялись. [180] По данным Совета колледжей, в 2020 году, хотя 83% азиатских студентов соответствовали критериям готовности к поступлению в колледж по чтению и письму и 80% по математике, только 44% и 21% чернокожих студентов справились с этими соответствующими категориями. Среди белых 79% достигли требуемых показателей по чтению и письму, а 59% занимались математикой. Для латиноамериканцев и латиноамериканцев эти цифры составили 53% и 30% соответственно. (См. рисунок ниже.) [168]
Анализируя данные Национального центра статистики образования, экономисты Эмбер Смит и Ричард Ривз из Брукингского института пришли к выводу, что в период с 2000 по 2020 год количество студентов, сдающих SAT, росло быстрее, чем темпы роста численности населения и выпускников средних школ. особенно заметно увеличение было среди латиноамериканцев и латиноамериканцев. Даже среди белых, число выпускников средних школ которых сокращалось, число сдающих SAT выросло. [168] Например, в 2015 году SAT сдали 1,7 миллиона студентов, [34] по сравнению с 1,6 миллиона в 2013 году . [118] Но в 2019 году экзамен сдали рекордные 2,2 миллиона студентов по сравнению с 2,1 миллионами в 2018 году. , еще один рекордный год. [37] Увеличение числа учащихся, сдающих SAT, отчасти произошло благодаря тому, что многие школьные округа предлагали проводить SAT во время учебных дней, часто без каких-либо дополнительных затрат для учащихся. [37] Некоторые требуют от студентов сдачи SAT независимо от того, собираются они в колледж или нет. [181] Однако в 2021 году из-за пандемии COVID-19 и необязательного статуса SAT во многих колледжах и университетах тест сдали только 1,5 миллиона студентов. [12] Но в 2022 году это число выросло до 1,7 миллиона, поскольку амбициозные студенты сдавали тест, чтобы выделиться среди конкурентов. [182]
Психологи Джин Твендж , В. Кейт Кэмпбелл и Райн А. Шерман проанализировали результаты тестов по словарному запасу в рамках Общего социального опроса США ( ) и обнаружили, что после поправки на образование использование сложной лексики снизилось в период с середины 1970-х до середины 1970-х годов. 2010-е годы на всех уровнях образования, от средней школы до аспирантуры. Однако они предостерегают от использования словесных баллов SAT для отслеживания снижения, поскольку, хотя Совет колледжей сообщил, что вербальные баллы SAT снижаются, эти баллы являются несовершенным показателем уровня словарного запаса нации в целом, потому что сдача тестов демографические изменения изменились, а также потому, что в 2010-х годах SAT сдавало больше студентов, чем в 1970-х, а это означает, что его сдавало больше людей с ограниченными способностями. [39] Однако, поскольку частота чтения ради удовольствия и уровень понимания прочитанного среди американских старшеклассников продолжают снижаться, учащимся, сдающим SAT, может быть трудно добиться хороших результатов, даже если были введены реформы, направленные на сокращение продолжительности обучения. теста и сократить количество вопросов, связанных с данным отрывком в вербальной части теста. [183]
Некоторые общества с высоким IQ , такие как Mensa , Intertel , Общество Прометея и Общество Тройной Девяти , используют результаты определенных лет в качестве одного из вступительных тестов. Например, Intertel принимает результаты (словесные и математические вместе) не менее 1300 баллов на тестах, сданных до января 1994 года; [184] Общество «Тройной девятки» принимает баллы 1450 или выше по тестам SAT, сданным до апреля 1995 года, и баллы не менее 1520 по тестам, сданным в период с апреля 1995 года по февраль 2005 года. [185] Mensa принимает квалификационные баллы SAT, полученные в январе или ранее. 31, 1994.
Поскольку он тесно коррелирует с общим интеллектом, SAT часто используется исследователями в качестве прокси для измерения интеллекта, особенно с 2004 года. [13] В частности, ученые, изучающие математически одаренных людей, используют математический раздел SAT для выявления предметы для своих исследований. [15]
Все больше исследований показывают, что результаты SAT могут предсказать индивидуальный успех на десятилетия вперед, например, с точки зрения дохода и профессиональных достижений. [13] [20] [84] Продольное исследование, опубликованное в 2005 году психологами-педагогами Джонатаном Ваем, Дэвидом Лубински и Камиллой Бенбоу, показывает, что среди интеллектуально развитых (1%) людей с более высокими баллами по разделу математики Студенты SAT в возрасте 12 лет с большей вероятностью могли получить докторскую степень в области STEM , иметь публикацию, зарегистрировать патент или получить должность в университете. [186] [135] Вай далее показал, что академические способности человека, измеряемые средними баллами SAT или ACT в посещаемом учебном заведении, предсказывают индивидуальные различия в доходах, даже среди самых богатых людей из всех, и будучи членом ' Американская элита», а именно руководители компаний из списка Fortune 500, миллиардеры, федеральные судьи и члены Конгресса. [187] [13] Вай пришел к выводу, что американская элита также является когнитивной элитой. [187] Грегори Парк, Любински и Бенбоу привели статистические доказательства того, что интеллектуально одаренные подростки, судя по результатам SAT, могут ожидать в будущем великих творческих подвигов, как в искусстве, так и в STEM. [188] [13]
SAT иногда сдается учащимся в возрасте 12 или 13 лет такими организациями, как Исследование математически не по годам развитой молодежи (SMPY), Центр талантливой молодежи Джонса Хопкинса и Программа выявления талантов Университета Дьюка (TIP) для отбора, обучения и наставничества. студенты с исключительными способностями, то есть входящие в один процент лучших. [16] Среди участников SMPY те, кто входил в верхний квартиль, как указано по совокупному баллу SAT (математика и устная речь), значительно чаще имели докторскую степень, имели хотя бы одну публикацию в STEM, получали доход в 95-й процентиль, иметь хотя бы одну литературную публикацию или зарегистрировать хотя бы один патент, чем те, кто находится в нижнем квартиле. Участники Duke TIP обычно выбирали карьерный путь в STEM, если они были сильнее в математике, о чем свидетельствуют баллы SAT по математике, или в гуманитарных науках, если они обладали более высокими вербальными способностями, о чем свидетельствовали устные баллы SAT. Для сравнения, вероятность получения патента у нижнего квартиля SMPY в пять раз выше, чем у среднего американца. Между тем, по состоянию на 2016 год доля докторских степеней среди участников SMPY составляла 44%, а Duke TIP - 37% по сравнению с двумя процентами среди населения США в целом. [17] Следовательно, представление о том, что после определенного момента различия в когнитивных способностях, измеренные с помощью стандартизированных тестов, таких как SAT, перестают иметь значение, опровергается фактами. [189]
В статье 2010 года, которая показала, что гендерный разрыв в результатах SAT по математике резко сократился в период с начала 1980-х по начало 1990-х годов, но сохранялся в течение следующих двух десятилетий или около того, Вай и его коллеги утверждали, что «половые различия в способностях в крайних случаях правый хвост не следует отбрасывать, поскольку он больше не является частью объяснения нехватки женщин в областях науки с интенсивным использованием математики». [153] [190]
Когнитивные способности коррелируют с результатами профессиональной подготовки и производительностью труда. [101] [19] Таким образом, некоторые работодатели полагаются на результаты SAT для оценки пригодности потенциального сотрудника, [20] особенно если у человека ограниченный опыт работы. [19] В этой практике нет ничего нового. [18] Крупнейшие компании и корпорации потратили огромные суммы на то, чтобы научиться избегать ошибок при приеме на работу, и решили, что результаты стандартизированных тестов являются ценным инструментом при принятии решения о том, подходит ли человек для этой работы. В некоторых случаях компании может потребоваться нанять кого-то для работы с запатентованными материалами собственного производства, такими как компьютерное программное обеспечение. Но поскольку способность работать с такими материалами не может быть оценена посредством внешней сертификации, для такой фирмы имеет смысл полагаться на что-то, что является показателем измерения общего интеллекта. [20] В других случаях фирму может не волновать академическое образование, но ей необходимо оценить способность потенциального сотрудника к количественному мышлению и то, что делает необходимыми результаты стандартизированных тестов. [18] Сообщается , что некоторые компании, особенно те, которые считаются наиболее престижными в таких отраслях, как инвестиционно-банковская деятельность и управленческий консалтинг , такие как Goldman Sachs и McKinsey , спрашивают потенциальных кандидатов на работу об их баллах по SAT. [191] [192] [193] [194] По данным Wall Street Journal , баллы используются аналогично тому, как они используются при поступлении в колледжи: компании утверждают, что они дают представление об интеллектуальных способностях и навыках решения проблем студента. индивидуальный. [191]
Тем не менее, некоторые другие ведущие работодатели, такие как Google , воздерживаются от использования результатов SAT или других стандартизированных тестов, если только потенциальный сотрудник не является недавним выпускником, поскольку для их целей эти результаты «ничего не предсказывают». Психолог-педагог Джонатан Вай предположил, что это может быть связано с неспособностью SAT дифференцировать интеллектуальные способности тех, кто находится на крайнем правом конце распределения интеллекта. Вай рассказал The New York Times : «Сегодня экзамен SAT на самом деле слишком прост, и именно поэтому Google не видит корреляции. Каждый человек, которого они пропускают, имеет очень высокий балл». [20]
В 2002 году обозреватель New York Times Ричард Ротштейн утверждал, что средние показатели по математике в США по тестам SAT и ACT продолжают десятилетие расти по сравнению со средними показателями по вербальным тестам по стране, в то время как средние показатели по вербальным частям в тех же тестах колеблются. [195]
В 1960-х и 1970-х годах возникло движение за снижение показателей успеваемости. Через некоторое время страны, штаты и провинции, которые их вновь ввели, согласились, что академические стандарты упали, студенты стали меньше учиться и менее серьезно относились к учебе. Они вновь ввели эти тесты после того, как исследования пришли к выводу, что выгоды от важных тестов перевешивают затраты. [196]
В своем выступлении перед Американским советом по образованию в 2001 году Ричард К. Аткинсон , президент Калифорнийского университета, призвал отказаться от вступительных тестов, таких как SAT I, но не от тестов успеваемости, таких как SAT II [ c], в качестве вступительных экзаменов в колледж. требование. [197] Критика Аткинсоном прогностической достоверности и полномочий SAT была оспорена академическим сенатом Калифорнийского университета. [96] [97] В апреле 2020 года академический сенат, состоящий из преподавателей, проголосовал 51–0 за восстановление требования о результатах стандартизированных тестов. Однако правящий совет отменил решение сената. Учитывая численность населения Калифорнии, это решение может оказать влияние на высшее образование США в целом; школам, желающим принять калифорнийских студентов, может быть труднее. [112]
По данным FairTest , группы активистов, выступающей против стандартизированных вступительных экзаменов , в 2010-х годах более 1230 американских университетов и колледжей решили отказаться от сдачи SAT и ACT при поступлении . Однако большинство из них были небольшими колледжами, за заметными исключениями системы Калифорнийского университета и Чикагского университета . [198] Также в список включены учреждения, обслуживающие нишевых студентов, такие как религиозные колледжи, художественные и музыкальные консерватории или школы медсестер, а также большинство учебных заведений на северо-востоке США. [33] С одной стороны, если сделать SAT и ACT необязательными для поступления, школы смогут привлечь больше абитуриентов различного социально-экономического происхождения. [32] С другой стороны, рекомендательные письма не являются хорошим индикатором коллегиальной успеваемости, [32] а повышение оценок является настоящей проблемой. [32] [112] [199] Если бы стандартизированные тесты были исключены из поля зрения, школьные оценки стали бы более важными, тем самым стимулируя рост оценок. [200] На самом деле, оценки в американских средних школах значительно выросли из-за давления со стороны родителей, что привело к явному избытку хорошо успевающих учеников, из-за чего действительно хорошо успевающим ученикам трудно выделиться, особенно если они из малообеспеченных семей. семьи. [201] Школы, которые сделали SAT необязательным, потеряли объективную меру академических способностей и готовности, [13] и им придется сформулировать новую методологию приема или разработать свои собственные вступительные экзамены. [198] Учитывая, что избирательность школы, в которую поступает учащийся, коррелирует с ресурсами его или ее средней школы, измеряемыми с точки зрения наличия строгих курсов, таких как классы AP, и социально-экономического статуса учащихся, — Если сделать SAT необязательным, это может усугубить социальное неравенство. Кроме того, поскольку стоимость обучения в высших учебных заведениях в Соединенных Штатах высока, отмена требования SAT может повысить вероятность того, что эти учебные заведения будут принимать неуспевающих студентов, которых, возможно, придется отчислить из-за их низкой академической успеваемости и которые могут быть обременен долгами после посещения. [13] Другая критика в отношении того, чтобы сделать SAT необязательным, заключается в том, что субъективные критерии пригодности заявителя, такие как вступительные эссе, могут стать более важными, что облегчит богатым возможность поступления за счет бедных, поскольку их школьные консультанты более способны писать хорошие рекомендательные письма и могут позволить себе нанять внешнюю помощь для продвижения своих приложений. [200]Именно из-за этих опасений Массачусетский технологический институт (MIT) решил восстановить требования к SAT в 2022 году. [202]
Несмотря на последствия операции «Университетский блюз» , в ходе которой многие богатые родители незаконно вмешивались, чтобы повысить баллы своих детей по стандартизированным тестам, SAT и ACT остаются популярными среди американских родителей и пожилых людей, поступающих в колледж, [203] которые скептически относятся к процессу « целостный прием», потому что они считают, что это довольно непрозрачно, поскольку школы пытаются получить доступ к характеристикам, которые нелегко различить по цифрам, отсюда и рост числа сдающих тесты, пытающихся стать более конкурентоспособными, даже если это происходит параллельно с увеличением количества школ. объявив его необязательным. [34] [35] Хотя целостный прием может показаться правдоподобной альтернативой, процесс подачи заявления может быть довольно напряженным для учащихся и родителей, и многие расстраиваются, когда узнают, что в школу поступил кто-то другой, который отверг их, несмотря на более низкие результаты SAT. баллы и средний балл. [204] [205]
Несмотря на целостный подход к поступлению, когда рассматриваются стипендии, основанные на заслугах, решающим фактором могут быть результаты стандартизированных тестов, поскольку они очень конкурентоспособны. [35] Стипендии и финансовая помощь могут помочь студентам и их родителям значительно сократить расходы на высшее образование, особенно во времена экономических трудностей. [36] Более того, у самых избирательных школ может не быть лучшего выбора, чем использование результатов стандартизированных тестов, чтобы быстро сократить количество заявлений, заслуживающих рассмотрения, поскольку целостный прием требует драгоценного времени и других ресурсов. [112]
После пандемии COVID-19 около 1600 учебных заведений решили отказаться от требований SAT или ACT при поступлении, поскольку было сложно как проводить, так и сдавать эти тесты, что привело к их отмене. [206] Некоторые школы решили сделать их факультативными только на временной основе, либо всего на один год, как в случае Принстонского университета , либо на три года, как в Колледже Уильяма и Мэри . Другие полностью отказались от этого требования. [34] В 2021 году некоторые школы продлили мораторий на стандартизированные вступительные экзамены. [112] Однако это не помешало очень амбициозным ученикам сдавать их, [34] [35] поскольку многие родители и подростки скептически относились к «факультативному» статусу. вступительных экзаменов в университеты [35] и хотели, чтобы их заявления с большей вероятностью привлекали внимание приемных комиссий. [36] Это привело к жалобам на сбой на сайтах регистрации летом 2020 года. [206] С другой стороны, количество студентов, подавших заявления в более конкурентоспособные школы, которые сделали результаты SAT и ACT необязательными, резко возросло, потому что студенты думали, что у них был шанс. [112] [207] [208] В учреждениях «Лиги плюща» наблюдалось двузначное увеличение количества заявлений, достигающее 51% в случае Колумбийского университета , в то время как их показатели приема, уже выражающиеся однозначными числами, упали, например, с В Гарвардском университете этот показатель составит от 4,9% в 2020 году до всего 3,4% в 2021 году . [209] [210] В то же время резко упал интерес к школам с более низким статусом, которые делали то же самое; [208] Процесс подачи заявления в колледж по-прежнему определяется в первую очередь предпочтением элитных школ. [205] 44% студентов, использовавших систему Common Application , принятую более чем в 900 колледжах и университетах по состоянию на 2021 год, сдали результаты SAT или ACT в 2020–2021 годах по сравнению с 77% в 2019–2020 годах. Те, кто предоставил свои результаты тестов, как правило, были выходцами из семей с высоким доходом, имели хотя бы одного родителя с высшим образованием и были белыми или азиатами. [200]
После решения Верховного суда США в 2023 году о запрете приема на обучение по расовому признаку как форме позитивных действий ряд школ заявили о своем намерении продолжать добиваться этнического разнообразия. Одним из способов адаптации к новой правовой реальности для них является отказ от требования стандартизированного тестирования, что затруднит потенциальным истцам (американцам азиатского происхождения в двух делах SFFA против Гарварда и SFFA против UNC ) поиск конкретных доказательств своей правоты. обвинения в дискриминации. [211]
В 2005 году писательский директор Массачусетского технологического института Лес Перельман построил график зависимости длины эссе от оценки по новому SAT на основе опубликованных эссе и обнаружил высокую корреляцию между ними. Изучив более 50 оцениваемых эссе, он обнаружил, что более длинные эссе неизменно дают более высокие оценки. Фактически, он утверждает, что, просто оценив длину эссе, не читая его, можно, скорее всего, правильно определить оценку эссе в 90% случаев. Он также обнаружил, что некоторые из этих эссе полны фактических ошибок; Совет колледжа не претендует на точность оценок.
Перельман вместе с Национальным советом преподавателей английского языка также раскритиковал 25-минутный раздел теста по письму за нарушение стандартов преподавания письма в классе. Они говорят, что преподаватели письма, готовящие своих учеников к экзамену SAT, не будут концентрироваться на повторении, глубине и точности, а вместо этого будут создавать длинные, шаблонные и многословные произведения. [212] «Вы заставляете учителей готовить из учеников плохих писателей», — заключил Перельман. [213]
19 января 2021 года Совет колледжей объявил, что после введения администрации в июне 2021 года SAT больше не будет предлагать дополнительный раздел эссе. [10] [11]
Совет колледжей, некоммерческая организация , владеющая SAT, был организован в начале 20-го века для проведения единых вступительных экзаменов для входящих в его состав колледжей, чьи студенты часто поступали из интернатов и частных дневных школ, расположенных на северо-востоке страны. Соединенные Штаты. Экзамены основывались на эссе, оценивались вручную, и на их сдачу студенту требовалось несколько дней. [214] [215] К началу 1920-х годов растущий интерес к тестам интеллекта как средству отбора убедил Совет колледжей сформировать комиссию для разработки такого теста для целей поступления в колледж. Руководителем комиссии был Карл Бригам , психолог из Принстонского университета, который первоначально увидел ценность подобных тестов через призму евгенической мысли. [214]
23 июня 1926 года первый тест SAT, известный тогда как тест на школьные способности, был сдан 8040 студентам, 60% из которых были мужчинами, многие из которых подавали документы в Йельский университет (26%) и Смит-колледж (27%). . [216] В 1934 году Джеймс Конант и Генри Чонси использовали SAT как средство выявления получателей, помимо выпускников традиционных северо-восточных частных школ, стипендий Гарвардского университета . К 1942 году Совет колледжей приостановил использование экзаменов по эссе, заменив их SAT, отчасти из-за успеха программы SAT Гарварда, а также из-за ограничений, возникших с началом Второй мировой войны . [214] В то время тест SAT был стандартизирован таким образом, чтобы результат теста, полученный студентом за один год, можно было напрямую сравнить с баллом, полученным студентом за другой год. Результаты тестов варьировались от 200 до 800 по каждому из двух разделов теста (вербальному и математическому), и одна и та же референтная группа студентов использовалась для стандартизации SAT до 1995 года. [217]
После войны, из-за нескольких факторов, включая создание Службы образовательного тестирования , [218] использование SAT быстро возросло: к 1951 году было сдано около 80 000 SAT, а в 1971 году их число выросло примерно до 1,5 миллиона. [219] За это время Со временем изменения, внесенные в содержание SAT, были относительно незначительными и включали введение вопросов для завершения предложений и математических вопросов «количественного сравнения», а также изменения во времени проведения теста. Однако в 1994 году тест SAT был существенно изменен в попытке сделать тест более точно отражающим работу учащихся в школе и навыки, которые им понадобятся в колледже. Среди других изменений, вопросы-антонимы были удалены из вербального раздела, а вопросы со свободным ответом были добавлены в математический раздел вместе с использованием калькуляторов. [130] В 1995 году, после почти сорока лет снижения результатов, SAT был перекалиброван путем добавления примерно 100 баллов к каждому баллу, чтобы компенсировать снижение среднего балла.
В 2005 году тест SAT был снова изменен, отчасти из-за критики теста со стороны системы Калифорнийского университета , которая заявила, что тест недостаточно тесно связан с учебной программой средней школы. [132] Наряду с устранением аналогий из вербального раздела и заданий количественного сравнения из математического раздела, [130] был добавлен новый раздел «Письмо» с эссе. [220] Изменения ввели дополнительный балл по разделу, увеличив максимальный балл SAT до 2400. [221]
В начале 2016 года программа SAT снова изменится, чтобы привести ее в соответствие с типичными учебными программами средней школы. [222] [223] Изменения включали в себя создание необязательности эссе (и возврат максимального балла до 1600), изменение всех вопросов с несколькими вариантами ответов с пяти вариантов ответа на четыре, а также отмену штрафа за неправильные ответы (оценка только за права). ). [224] [225] К середине 2021 года эссе было полностью исключено из SAT в целях снижения требований к студентам в условиях пандемии COVID -19 . [206]
С момента своего введения в 1926 году тест SAT несколько раз переименовывался. Первоначально он был известен как тест на школьные способности. [226] [130] В 1990 году комиссия, созданная Советом колледжей для рассмотрения предложенных изменений в программе SAT, рекомендовала изменить значение SAT по инициализму на «Тест академической оценки», поскольку «тест, который объединяет меры достижения, а также развитые способности больше не могут быть точно описаны как проверка способностей». [227] [228] В 1993 году Совет колледжей изменил название теста на SAT I: Тест на рассуждение; в то же время название тестов достижений было изменено на SAT II: Предметные тесты. [226] Тест на рассуждение и тесты по предметам должны были быть вместе известны как тесты на школьную оценку. По словам тогдашнего президента Совета колледжей, изменение названия было призвано «исправить у некоторых людей впечатление, что SAT измеряет нечто врожденное и не поддающееся изменению независимо от усилий или инструкций». [229] Новый SAT дебютировал в марте 1994 года, и крупные новостные организации называли его «Тестом академической оценки». [230] [231] Однако в 1997 году Совет колледжей объявил, что SAT не может правильно называться тестом на школьную оценку, и что буквы SAT ничего не означают . [232] В 2004 году римская цифра в SAT I: Reasoning Test была исключена, в результате чего SAT Reasoning Test стал названием SAT. [226] Часть названия «Тест на рассуждение» была удалена после изменения дизайна экзамена в 2016 году; теперь его называют просто SAT. [233]
Совет колледжа был обвинен в повторном использовании старых документов SAT, ранее сданных в Соединенных Штатах. [234] По словам представителей колледжа, повторное использование вопросов предыдущих экзаменов использовалось для мошенничества на экзаменах и ставило под сомнение достоверность результатов тестов некоторых студентов. Было обнаружено, что компании по подготовке к экзаменам в Азии предоставляют студентам тестовые вопросы в течение нескольких часов после проведения нового экзамена SAT. [235] [236]
25 августа 2018 года выяснилось, что тест SAT, проведенный в Америке, представляет собой переработанный международный тест SAT, проведенный в октябре 2017 года в Китае. Утечка PDF-файла была в Интернете перед экзаменом 25 августа 2018 года. [237]
Он сказал, что он также хотел, чтобы тест более точно отражал то, чем учащиеся занимались в старшей школе, и, что, возможно, самое главное, обуздал интенсивное обучение и обучение тому, как сдавать тест, что часто давало богатым учащимся преимущество.
{{cite book}}
: |website=
игнорируется ( помощь )В Калифорнийском университете результаты тестов в настоящее время лучше предсказывают средний балл первого года обучения, чем средний балл средней школы (HSGPA), и примерно так же эффективны для прогнозирования удержания на первом году обучения, UGPA и окончания обучения.³ Для учащихся в любой группе (HSGPA) , более высокие результаты стандартизированных тестов коррелируют с более высоким UGPA первокурсника, более высоким выпускным UGPA и более высокой вероятностью окончания учебы в течение четырех лет (для перевода) или семи лет (для первокурсников).
Кроме того, с 2007 года увеличилась разница в результатах учащихся, объясняемая результатами тестов, а разница, объясняемая оценками в средней школе, снизилась, хотя в целом не превышает 26%.
Результаты тестов являются прогнозируемыми для всех демографических групп и дисциплин, даже после учета HSGPA.
Фактически, результаты тестов являются лучшим предиктором успеха для учащихся, принадлежащих к недостаточно представленным меньшинствам (URM), которые относятся к первому поколению или чьи семьи имеют низкий доход.
...это грязный секрет, который я узнал в тот год, когда наблюдал, как приемные комиссии рассматривают заявления: большинство из них не знают точно, что они пытаются оценить, когда просят несколько эссе и рекомендаций, а также энциклопедический список занятий.
...все истцы в этих делах о позитивных действиях на протяжении многих лет, начиная с 20-летней давности, начиная с дел в Мичигане, использовали результаты тестов как один набор - одно доказательство того, что они подвергались дискриминации в отношении студентов, которым было отказано в приеме. с 1500 баллами по SAT и другими студентами с 1200 баллами. Что ж, когда у вас нет оценок от всех, обосновать это намного сложнее.