Стандартизированный тест

Стандартизированный тест — это тест , который проводится и оценивается в последовательной, или «стандартной», манере. Стандартизированные тесты разработаны таким образом, что вопросы и интерпретации являются последовательными и проводятся и оцениваются в предопределенной, стандартной манере. ^[1]

Любой тест, в котором один и тот же тест дается одинаково всем сдающим и оценивается одинаково для всех, является стандартизированным тестом. Стандартизированные тесты не обязательно должны быть тестами с высокими ставками , тестами с ограниченным временем, тестами с множественным выбором , академическими тестами или тестами, сдаваемыми большому количеству сдающих. Стандартизированный тест может быть любым типом теста: письменным тестом, устным тестом или тестом на практические навыки . Вопросы могут быть простыми или сложными. Предметом среди учащихся школьного возраста часто являются академические навыки, но стандартизированный тест может быть дан практически по любой теме, включая тесты по вождению , креативность , атлетизм , личность , профессиональную этику или другие атрибуты.

Противоположностью стандартизированного тестирования является нестандартизированное тестирование , при котором либо разным испытуемым предлагаются существенно разные тесты, либо один и тот же тест назначается в существенно разных условиях (например, одной группе дается гораздо меньше времени на выполнение теста, чем другой группе) или оценивается по-разному (например, один и тот же ответ считается правильным для одного студента, но неправильным для другого).

Большинство ежедневных тестов и контрольных работ, которые проходят ученики в школе, соответствуют определению стандартизированного теста: все в классе проходят один и тот же тест, в одно и то же время, при одних и тех же обстоятельствах, и все ученики оцениваются учителем одинаково. Однако термин стандартизированный тест чаще всего используется для обозначения тестов, которые проводятся для больших групп, например, тест, который проходят все взрослые, желающие получить лицензию на определенный вид работы, или все ученики определенного возраста. Большинство стандартизированных тестов являются формами итоговых оценок (оценок, которые измеряют обучение участников в конце учебного блока).

Поскольку все получают один и тот же тест и одну и ту же систему оценок, стандартизированные тесты часто воспринимаются как более справедливые, чем нестандартизированные тесты. Такие тесты часто считаются более справедливыми и объективными, чем система, в которой некоторые студенты получают более легкий тест, а другие — более сложный. Стандартизированные тесты разработаны для обеспечения надежного сравнения результатов всех сдающих тест, поскольку все сдают один и тот же тест. ^[2]

Определение

Определение стандартизированного теста несколько изменилось с течением времени. ^[3] В 1960 году стандартизированные тесты были определены как те, в которых условия и содержание были равны для всех, кто проходил тест, независимо от того, когда, где или кем тест проводился или оценивался. Стандартизированные тесты имеют последовательный, единый метод подсчета баллов. ^[4] Это означает, что все студенты, которые отвечают на вопрос теста одинаково, получат одинаковый балл за этот вопрос. Цель этой стандартизации — убедиться, что баллы надежно указывают на измеряемые способности или навыки, а не на что-то другое, например, на различные инструкции о том, что делать, если испытуемый не знает ответа на вопрос. ^[3]

К началу 21 века фокус сместился от строгого тождества условий к равной справедливости условий тестирования. ^[3] Например, тестируемый со сломанным запястьем может писать медленнее из-за травмы, и было бы более справедливо и давало бы более надежное понимание фактических знаний тестируемого, если бы этому человеку дали несколько минут на то, чтобы записать ответы на ограниченный по времени тест. Изменение условий тестирования таким образом, чтобы улучшить справедливость в отношении постоянной или временной инвалидности, но не подрывая основной смысл оценки, называется приспособлением . Однако, если бы целью теста было увидеть, как быстро может писать студент, то предоставление тестируемому дополнительного времени стало бы модификацией содержания , а не стандартизированным тестом.

История

Китай

Самые ранние свидетельства стандартизированного тестирования были в Китае , во времена династии Хань , ^[5] , где императорские экзамены охватывали Шесть Искусств , которые включали музыку, стрельбу из лука, верховую езду, арифметику, письмо и знание ритуалов и церемоний как государственных, так и частных. Эти экзамены использовались для отбора сотрудников для государственной бюрократии.

Позже в экзамен были добавлены разделы по военным стратегиям, гражданскому праву, доходам и налогообложению, сельскому хозяйству и географии. В таком виде экзамены были институционализированы более чем на тысячелетие.

В настоящее время стандартизированное тестирование по-прежнему широко применяется, наиболее известное в системе Гаокао .

Великобритания

Стандартизированное тестирование было введено в Европе в начале 19 века по образцу экзаменов на звание китайского мандарина ^[6] благодаря поддержке британских колониальных администраторов, самым «настойчивым» из которых был британский консул в Гуанчжоу, Китай , Томас Тейлор Медоуз . ^[6] Медоуз предупреждал о крахе Британской империи, если стандартизированное тестирование не будет немедленно внедрено по всей империи. ^[6]

До их принятия стандартизированное тестирование традиционно не было частью западной педагогики. Основываясь на скептической и открытой традиции дебатов, унаследованной от Древней Греции, западная академия отдавала предпочтение нестандартизированным оценкам с использованием эссе, написанных студентами. Именно из-за этого первое европейское внедрение стандартизированного тестирования произошло не в самой Европе, а в Британской Индии . ^[7] Вдохновленные китайским использованием стандартизированного тестирования, в начале 19 века британские «менеджеры компаний нанимали и продвигали сотрудников на основе конкурсных экзаменов, чтобы предотвратить коррупцию и фаворитизм». ^[7] Эта практика стандартизированного тестирования была позже принята в конце 19 века на материковой части Великобритании. Последовавшие парламентские дебаты содержали множество ссылок на «китайскую мандаринскую систему». ^[6]

Именно из Британии стандартизированное тестирование распространилось не только по всему Британскому Содружеству , но и в Европу, а затем и в Америку. ^[6] Его распространение было обусловлено промышленной революцией . Увеличение числа школьников во время и после промышленной революции в результате законов об обязательном образовании сократило использование открытой оценки, которую было сложнее массово производить и оценивать объективно из-за ее изначально субъективной природы.

Стандартизированные тесты, такие как War Office Selection Boards, были разработаны для британской армии во время Второй мировой войны , чтобы отбирать кандидатов для обучения офицеров и других задач. ^[8] Тесты рассматривали умственные способности солдат, механические навыки, способность работать с другими и другие качества. Предыдущие методы страдали от предвзятости и приводили к выбору не тех солдат для обучения офицеров. ^[8]

Соединенные Штаты

Стандартизированное тестирование является частью системы образования в США с XIX века, однако широкое распространение стандартизированного тестирования в школах США в значительной степени является явлением XX века.

Иммиграция в середине 19 века способствовала росту стандартизированных тестов в Соединенных Штатах. ^[9] Стандартизированные тесты использовались, когда люди впервые въезжали в США, чтобы проверить социальные роли и найти социальную власть и статус. ^[10]

Вступительный экзамен в колледж начал предлагать стандартизированное тестирование для поступления в университеты и колледжи в 1901 году, охватывая девять предметов. Этот тест был реализован с идеей создания стандартизированного приема в северо-восточных элитных университетах США. Первоначально тест также предназначался для лучших школ-интернатов , чтобы согласовать учебную программу между школами. ^[11] Первоначально стандартизированный тест состоял из эссе и не был предназначен для широкого тестирования. ^[11]

Во время Первой мировой войны были разработаны армейские альфа- и бета- тесты, чтобы помочь новобранцам получить соответствующие задания на основе их оцененного уровня интеллекта. ^[12] Первое издание современного стандартизированного теста на IQ , тест на интеллект Стэнфорда-Бине , появилось в 1916 году. Затем в 1926 году Совет колледжей разработал SAT (тест на способности к учебе). Первый тест SAT был основан на армейских тестах IQ с целью определения интеллекта, навыков решения проблем и критического мышления тестируемого . ^[13] В 1959 году Эверетт Линдквист впервые предложил ACT (американское колледжное тестирование). ^[14] По состоянию на 2020 год ACT включает четыре основных раздела с вопросами с несколькими вариантами ответов для проверки английского языка, математики, чтения и естественных наук, а также дополнительный раздел письма. ^[15]

Отдельные штаты начали тестировать большое количество детей и подростков через государственные школьные системы в 1970-х годах. К 1980-м годам американские школы стали проводить оценку на национальном уровне. ^[16] В 2012 году 45 штатов заплатили в среднем 27 долларов за ученика и 669 миллионов долларов в целом за крупномасштабные ежегодные академические тесты. ^[17] Однако косвенные расходы , такие как оплата труда учителей для подготовки учеников к тестам и за время, потраченное классом на проведение тестов, значительно превышают прямые расходы на сам тест. ^[17]

Необходимость для федерального правительства проводить значимые сравнения в рамках высоко децентрализованной (локально контролируемой) системы государственного образования поощряла использование широкомасштабного стандартизированного тестирования. Закон о начальном и среднем образовании 1965 года требовал проведения некоторого стандартизированного тестирования в государственных школах. Закон «Ни один ребенок не останется без внимания» 2001 года еще больше связал некоторые типы финансирования государственных школ с результатами стандартизированного тестирования. Согласно этим федеральным законам, школьная программа по-прежнему устанавливалась каждым штатом, но федеральное правительство требовало от штатов оценивать, насколько хорошо школы и учителя преподают выбранный штатом материал с помощью стандартизированных тестов. ^[18] Результаты учащихся на широкомасштабных стандартизированных тестах использовались для выделения школам средств и других ресурсов, а также для закрытия плохо работающих школ. В конце 2015 года Закон об успеваемости каждого учащегося заменил NCLB. ^[19] К тому моменту эти крупномасштабные стандартизированные тесты стали спорными в Соединенных Штатах не обязательно потому, что все учащиеся сдавали одни и те же тесты и получали одинаковые баллы, а потому, что они стали высокорискованными тестами для школьных систем и учителей. ^[20]

В последние годы многие университеты и колледжи США отказались от требования предоставления абитуриентами результатов стандартизированных тестов. ^[21]

Австралия

Стандартизированное тестирование Австралийской национальной программы оценки – грамотности и счета (NAPLAN) было начато в 2008 году Австралийским управлением по учебным программам, оценке и отчетности, независимым органом, «ответственным за разработку национальной учебной программы, национальной программы оценки и национальной программы сбора и отчетности данных, которая поддерживает обучение в 21 веке для всех австралийских учащихся». ^[22]

Тестирование охватывает всех учеников 3, 5, 7 и 9 классов австралийских школ, которые будут оцениваться с помощью национальных тестов. Предметы, охваченные этими тестами, включают чтение, письмо, языковые нормы (орфография, грамматика и пунктуация) и арифметика.

Программа представляет отчеты на уровне учащихся, разработанные для того, чтобы родители могли видеть прогресс своего ребенка в ходе его школьной жизни и помогать учителям улучшать индивидуальные возможности обучения для своих учеников. Данные на уровне учащихся и школы также предоставляются соответствующей школьной системе с пониманием того, что они могут быть использованы для направления определенной поддержки и ресурсов школам, которые больше всего в них нуждаются. Учителя и школы используют эту информацию в сочетании с другой информацией, чтобы определить, насколько хорошо успевают их ученики, и выявить любые области, требующие помощи.

Концепция тестирования достижений учащихся не нова, хотя можно сказать, что текущий австралийский подход берет свое начало в современных структурах образовательной политики как в США, так и в Великобритании. Существует несколько ключевых различий между австралийским NAPLAN и стратегиями Великобритании и США. Школам, которые будут признаны неэффективными в австралийском контексте, будет предложена финансовая помощь в соответствии с текущей политикой федерального правительства.

Колумбия

В 1968 году был создан Колумбийский институт оценки образования (ICFES) для регулирования высшего образования. Была внедрена предыдущая система государственной оценки для авторизации деятельности и юридического признания учреждений и университетских программ.

В Колумбии есть несколько стандартизированных тестов, которые оценивают уровень образования в стране. Эти экзамены проводятся ICFES.

Учащиеся третьих, пятых и девятых классов сдают экзамен "Saber 3°5°9°". В настоящее время этот тест проводится на компьютере в контролируемых и переписных выборках.

По окончании средней школы ученики представляют «Saber 11», который позволяет им поступать в различные университеты страны. Учащиеся, обучающиеся дома, могут сдать этот экзамен, чтобы окончить среднюю школу и получить сертификат и диплом.

Студенты, заканчивающие университет, должны сдать экзамен «Saber Pro».

Канада

Канада оставляет образование и, как следствие, стандартизированное тестирование под юрисдикцией провинций. Каждая провинция имеет свой собственный режим стандартизированного тестирования, начиная от отсутствия обязательных стандартизированных тестов для учащихся в Саскачеване до экзаменов, составляющих 40% от итоговых оценок средней школы в Ньюфаундленде и Лабрадоре. ^[23]

Дизайн и оценка

Дизайн

Чаще всего основной академический тест включает в себя разделы, оцениваемые как человеком, так и компьютером.

Стандартизированный тест может состоять из вопросов с множественным выбором, вопросов типа «верно-неверно», вопросов-эссе, аутентичных оценок или почти любой другой формы оценки. Вопросы с множественным выбором и вопросы типа «верно-неверно» часто выбираются для тестов, которые проходят тысячи людей, потому что их можно дать и оценить недорого, быстро и надежно с помощью специальных листов ответов, которые можно прочитать на компьютере, или с помощью адаптивного к компьютеру тестирования . Некоторые стандартизированные тесты включают компоненты с кратким ответом или написанием эссе, которым присваивается оценка независимыми оценщиками, которые используют рубрики (правила или руководства) и контрольные работы (примеры работ для каждой возможной оценки) для определения оценки, которая будет дана ответу.

Любая тема

Не все стандартизированные тесты предполагают ответы на вопросы. Подлинная оценка спортивных навыков может принимать форму бега в течение определенного времени или ведения мяча на определенное расстояние. Медицинские работники должны пройти тесты, подтверждающие, что они могут выполнять медицинские процедуры. Кандидаты на водительские права должны пройти стандартизированный тест, подтверждающий, что они могут водить машину. Канадский стандартизированный тест на пригодность использовался в медицинских исследованиях для определения физической подготовки участников теста. ^[24]^[25]

Машинная и человеческая оценка

С конца 20-го века крупномасштабное стандартизированное тестирование было сформировано отчасти простотой и дешевизной оценки тестов с множественным выбором с помощью компьютера. Большинство национальных и международных оценок не полностью оцениваются людьми.

Люди привыкли оценивать те пункты, которые не могут быть легко оценены компьютером (например, эссе). Например, экзамен Graduate Record Exam — это адаптивная к компьютеру оценка, которая не требует оценки людьми, за исключением письменной части. ^[26]

Оценка людьми относительно дорогая и часто изменчива, поэтому предпочтительнее компьютерная оценка, когда это возможно. Например, некоторые критики говорят, что плохо оплачиваемые сотрудники будут оценивать тесты плохо. ^[27] Согласие между оценщиками может варьироваться от 60 до 85 процентов, в зависимости от теста и сеанса оценки. Для масштабных тестов в школах некоторые проверяющие платят за то, чтобы два или более оценщиков прочитали каждую работу; если их оценки не совпадают, то работа передается дополнительным оценщикам. ^[27]

Хотя этот процесс сложнее, чем электронная оценка тестов с множественным выбором, эссе также можно оценивать с помощью компьютера. В других случаях эссе и другие открытые ответы оцениваются в соответствии с заранее определенной рубрикой оценки обученными оценщиками. Например, в Pearson все оценщики эссе имеют четырехлетние университетские степени, и большинство из них являются действующими или бывшими учителями в классе. ^[28]

Использование рубрик для обеспечения справедливости

Использование рубрики призвано повысить справедливость при оценке успеваемости ученика. В стандартизированном тестировании погрешность измерения (постоянная закономерность ошибок и предубеждений при оценке теста) легко определить. Когда оценка зависит от индивидуальных предпочтений оценщиков, то оценки учеников зависят от того, кто оценивает тест.

Стандартизированные тесты также устраняют предвзятость оценщика в оценке. Исследования показывают, что учителя создают своего рода самоисполняющееся пророчество в своей оценке учеников, давая тем, кто, как они ожидают, достигнет более высоких результатов, и давая тем, кто, как они ожидают, не справится, более низкие оценки. ^[29] При нестандартизированной оценке оценщики имеют больше индивидуального усмотрения и, следовательно, более вероятно, что они будут выдавать несправедливые результаты из-за бессознательной предвзятости .

Использование оценок для сравнений

Существует два типа интерпретации результатов теста : интерпретация результатов, основанная на норме , и интерпретация результатов , основанная на критериях . ^[4]

Интерпретации результатов теста, основанные на норме, сравнивают участников теста с выборкой сверстников . ^[4] Цель состоит в том, чтобы ранжировать студентов как лучших или худших, чем другие студенты. Интерпретации результатов теста, основанные на норме, связаны с традиционным образованием . Студенты, которые показывают лучшие результаты, чем другие, сдают тест, а студенты, которые показывают худшие результаты, чем другие, проваливают тест.
Интерпретации баллов, основанные на критериях, сравнивают тестируемых с критерием (формальным определением содержания), независимо от баллов других экзаменуемых. ^[4] Их также можно описать как оценки, основанные на стандартах , поскольку они соответствуют движению за реформу образования, основанного на стандартах . ^[30] Интерпретации баллов, основанные на критериях, касаются исключительно того, является ли ответ данного конкретного студента правильным и полным. В системах, основанных на критериях, все студенты могут сдать тест или все студенты могут его провалить.

Любая из этих систем может использоваться в стандартизированном тестировании. Для стандартизированного тестирования важно, чтобы всем студентам задавались одинаковые вопросы в разумно равных обстоятельствах и чтобы их оценивали в соответствии с одинаковыми стандартами.

Нормативная оценка сравнивает каждого тестируемого с другими тестируемыми. Нормативно-связанный тест (NRT) — это тип теста, оценки или анализа , который дает оценку положения тестируемого в предопределенной популяции. Оценка выводится из анализа результатов тестов и других соответствующих данных из выборки, взятой из популяции. Этот тип теста определяет, сдал ли тестируемый лучше или хуже других студентов, сдававших этот тест.

Сравнение с другими делает стандартизированные тесты, основанные на норме, полезными для целей приема в высшие учебные заведения, где школа пытается сравнить студентов со всей страны или со всего мира. Стандартизация гарантирует, что все студенты проходят одинаковое тестирование, а сопоставление с нормой определяет, кто лучше, а кто хуже. Примерами таких международных контрольных тестов являются Trends in International Mathematics and Science Study ( TIMMS ) и Progress in International Reading Literacy Study ( PIRLS ).

Тест с критерием (CRT) — это стиль теста, который использует результаты теста, чтобы показать, насколько хорошо испытуемые справились с данным заданием, а не насколько хорошо они справились по сравнению с другими испытуемыми. Большинство тестов и контрольных работ, написанных школьными учителями, являются тестами с критерием. В этом случае цель состоит просто в том, чтобы посмотреть, может ли ученик правильно ответить на вопросы. Учитель обычно не пытается сравнить результаты каждого ученика с результатами других учеников.

Стандарты

Соображения валидности и надежности обычно рассматриваются как существенные элементы для определения качества любого стандартизированного теста. Однако профессиональные и практические ассоциации часто помещают эти проблемы в более широкие контексты при разработке стандартов и вынесении общих суждений о качестве любого стандартизированного теста в целом в данном контексте.

Стандарты оценки

В области оценки , и в частности образовательной оценки , Объединенный комитет по стандартам образовательной оценки ^[31] опубликовал три набора стандартов для оценки. Стандарты оценки персонала ^[32] были опубликованы в 1988 году, Стандарты оценки программ (2-е издание) ^[33] были опубликованы в 1994 году, а Стандарты оценки студентов ^[34] были опубликованы в 2003 году.

Каждая публикация представляет и разрабатывает набор стандартов для использования в различных образовательных условиях. Стандарты предоставляют руководящие принципы для разработки, внедрения, оценки и улучшения определенной формы оценки. Каждый из стандартов был помещен в одну из четырех основных категорий для содействия образовательным оценкам, которые являются надлежащими, полезными, осуществимыми и точными. В этих наборах стандартов соображения валидности и надежности рассматриваются в рамках темы точности. Тесты направлены на обеспечение того, чтобы оценки учащихся предоставляли надежную, точную и достоверную информацию об обучении и успеваемости учащихся, однако; стандартизированные тесты предлагают узкую информацию о многих формах интеллекта, и полагаться на них вредит учащимся, поскольку они неточно измеряют потенциал учащегося для успеха. ^[35]

Стандарты тестирования

В области психометрии Стандарты образовательного и психологического тестирования^[36] устанавливают стандарты о валидности и надежности, а также об ошибках измерения и вопросах, связанных с размещением людей с ограниченными возможностями . Третья и последняя основная тема охватывает стандарты, связанные с заявками на тестирование, аттестацией , а также тестированием при оценке программ и государственной политикой .

Статистическая достоверность

Одним из главных преимуществ крупномасштабного стандартизированного тестирования является то, что результаты могут быть эмпирически задокументированы; следовательно, можно показать, что результаты тестов имеют относительную степень достоверности и надежности , а также результаты, которые можно обобщить и воспроизвести. ^[37] Это часто противопоставляют оценкам в школьном транскрипте, которые выставляются отдельными учителями. При рассмотрении индивидуально выставляемых оценок может быть сложно учесть различия в образовательной культуре между школами, сложность заданий данного учителя, различия в стиле преподавания, давление с целью завышения оценок и другие методы и предубеждения, которые влияют на оценивание.

Другим преимуществом является агрегация. Хорошо разработанный стандартизированный тест дает оценку владения человеком определенной областью знаний или навыков, которая на определенном уровне агрегации предоставит полезную информацию. То есть, хотя индивидуальные оценки могут быть недостаточно точными для практических целей, средние баллы классов, школ, филиалов компании или других групп вполне могут предоставить полезную информацию из-за снижения ошибок, достигаемого за счет увеличения размера выборки.

Ежегодные стандартизированные тесты в школе

Стандартизированное тестирование — очень распространенный способ определения прошлых академических достижений учащегося и его будущего потенциала.

Валидность, качество или использование тестов, особенно ежегодных стандартизированных тестов, распространенных в образовании, продолжают широко поддерживаться или критиковаться. Как и сами тесты, поддержка и критика тестов часто различаются и могут исходить из разных источников, таких как родители, тестируемые, инструкторы, бизнес-группы, университеты или правительственные наблюдатели.

Сторонники широкомасштабных стандартизированных тестов в образовании часто приводят следующие причины для продвижения тестирования в образовании:

Обратная связь или диагностика успеваемости тестируемого: ^[38] Стандартизированные тесты позволяют учителям увидеть, как их ученики справляются с учебой по сравнению с другими в стране. Это поможет им пересмотреть свои методы обучения, если это необходимо, чтобы помочь своим ученикам соответствовать стандартам. ^[39] Учащимся предоставляется возможность поразмышлять над своими результатами и увидеть, в чем их сильные и слабые стороны. ^[39] Результаты могут позволить родителям получить представление о том, как их ребенок справляется с учебой. ^[40]
Справедливый и эффективный ^[41]
Способствует подотчетности: ^[38]^[41] Стандартизированное тестирование используется в качестве стратегии государственной политики для установления более жестких мер подотчетности для государственного образования . Идея, лежащая в основе движения за политику стандартизированного тестирования, заключается в том, что тестирование является первым шагом к улучшению школ, практики преподавания и методов образования посредством сбора данных. Сторонники утверждают, что данные, полученные с помощью стандартизированных тестов, действуют как табель успеваемости для сообщества, демонстрируя, насколько хорошо работают местные школы. Критики движения, однако, указывают на различные несоответствия, которые являются результатом текущей практики стандартизированного тестирования в штате, включая проблемы с валидностью и надежностью тестов и ложные корреляции (см. парадокс Симпсона ).
Прогнозирование и выбор ^[38]
Улучшает производительность ^[38]

Критики стандартизированных тестов в образовании часто приводят следующие причины пересмотра или отмены стандартизированных тестов в образовании:

Низкое качество прогнозирования. ^[42]^[43]
Завышение оценок или результатов тестов. ^[44]^[45]^[46]
Культурно или социально-экономически предвзятый. ^[47]^[48]
Психологически разрушительно. ^[49]
Плохой показатель интеллекта или способностей. ^[50]^[51]^[52]^[53]

Более того, успехи ученика отслеживаются по относительной производительности учителя, что делает продвижение учителя в зависимости от успеха учителя в академической производительности ученика. У учителей возникают этические и экономические вопросы, когда они сталкиваются с явно неуспевающими или недостаточно подготовленными учениками и стандартизированным тестом.

В своей книге Now You See It Кэти Дэвидсон критикует стандартизированные тесты. Она описывает молодежь как «детей сборочной линии на сборочной линии», имея в виду использование стандартизированного теста как части универсальной образовательной модели. Она также критикует узость проверяемых навыков и навешивание ярлыков на детей без этих навыков как на неудачников или учеников с ограниченными возможностями. ^[54] Широко распространенное и организованное мошенничество стало растущей культурой. ^[55]

Есть три показателя, по которым оцениваются страны с наилучшими показателями в TIMMS («страны A+»): фокус, согласованность и строгость. Концентрация определяется как количество тем, охваченных в каждом классе; идея заключается в том, что чем меньше тем охвачено в каждом классе, тем больше внимания можно уделить каждой теме. Определение согласованности - это соблюдение последовательности охваченных тем, которая следует естественной прогрессии или логической структуре математики. CCSSM сравнивался как с текущими государственными стандартами, так и со стандартами стран A+. При наибольшем среднем охвате тем текущие государственные стандарты имели наименьшую направленность. ^[56] Стандарты Common Core направлены на устранение этого несоответствия, помогая педагогам сосредоточиться на том, что нужно учащимся изучить, вместо того, чтобы отвлекаться на посторонние темы. Они поощряют учебные материалы переходить от поверхностного освещения широкого спектра тем к освещению нескольких тем гораздо глубже. ^[57]

Время и деньги

Стандартизированные тесты — это способ измерения уровня образования учащихся и школ в широком масштабе. От детского сада до 12-го класса большинство американских учащихся участвуют в ежегодных стандартизированных тестах. В среднем ученик проходит около 10 таких тестов в год (например, один или два теста на понимание прочитанного, один или два теста по математике, тест по письму, тест по естественным наукам и т. д.). ^[58] Средний объем тестирования занимает около 2,3% от общего времени занятий (что эквивалентно примерно четырем учебным дням в году). ^[59]

Стандартизированные тесты дороги в администрировании. Сообщалось, что Соединенные Штаты тратят около 1,7 млрд долларов США ежегодно на эти тесты. ^[60] В 2001 году также сообщалось, что только три компании (Harcourt Educational Measurement, CTB McGraw-Hill и Riverside Publishing) разрабатывают 96% тестов, проводимых на государственном уровне. ^[61]

Образовательные решения

Национальная академия наук рекомендует, чтобы основные образовательные решения не основывались исключительно на единственном результате теста. ^[62] Использование минимальных проходных баллов для поступления или окончания не подразумевает единого стандарта, поскольку результаты тестов почти всегда сочетаются с другими минимальными критериями, такими как количество кредитов, обязательных курсов, посещаемость и т. д. Результаты тестов часто воспринимаются как «единственный критерий» просто потому, что они самые сложные, или выполнение других критериев автоматически предполагается. Одним из исключений из этого правила является GED , который позволил многим людям получить признание своих навыков, даже если они не соответствовали традиционным критериям. ^{[ необходима цитата ]}

Некоторые учителя утверждают, что единый стандартизированный тест измеряет только текущие знания ученика и не отражает прогресс учеников с начала года. ^[63] Результат, созданный лицами, которые не являются частью обычного обучения ученика, а профессионалами, которые определяют, что ученики должны знать в разном возрасте. Кроме того, учителя сходятся во мнении, что лучшим создателем и организатором теста являются они сами. Они утверждают, что они лучше всех знают способности, возможности и потребности учеников, что позволило бы им дольше заниматься предметами или продолжить обычную учебную программу.

Влияние на учащихся из неблагополучных семей

Монти Нил, директор Национального центра честного и открытого тестирования, утверждает, что учащимся, которые говорят на английском как на втором языке, имеют инвалидность или происходят из семей с низким доходом, непропорционально часто отказывают в дипломе из-за результатов теста, что несправедливо и вредно. Например, в конце 1970-х годов, когда в Соединенных Штатах началось выпускное тестирование, в иске утверждалось, что многие чернокожие студенты не имели равных возможностей по материалу, который они тестировали на выпускном тесте, потому что они посещали школы, разделенные законом. «Взаимодействие школ с ограниченными ресурсами и тестированием сильнее всего бьет по цветным студентам», как утверждает Нил, «им непропорционально часто отказывают в дипломах или повышении в классе, а школы, которые они посещают, с наибольшей вероятностью покажут плохие результаты на тестах и столкнутся с санкциями, такими как реструктуризация». ^[64]

В журнале The Progressive Барбара Майнер объясняет недостатки стандартизированного тестирования, анализируя три разные книги. Как пишет содиректор Центра образования в Университете Райса и профессор образования Линда М. Макнил в своей книге « Противоречия школьной реформы: образовательные издержки стандартизированного тестирования »: «Образовательная стандартизация вредит преподаванию и обучению и в долгосрочной перспективе заново стратифицирует образование по расовому и классовому признаку». Макнил считает, что реформа образования на основе тестов устанавливает более высокие стандарты для цветных студентов. По словам Майнер, Макнил «показывает, как реформа образования на основе тестов централизует власть в руках корпоративной и политической элиты — особенно пугающее явление в это время растущего корпоративного и консервативного влияния на реформу образования». Такая реформа на основе тестов привела к снижению качества обучения, особенно для цветных студентов. ^[65]

FairTest утверждает, что негативные последствия неправильного использования тестов включают отчисление учащихся из школ, уход учителей из профессии, а также подрыв вовлеченности учащихся и школьного климата. ^[66]

Использование стандартизированных тестов при поступлении в университеты

Стандартизированные тесты рассматриваются университетами как часть заявки, наряду с другими подтверждающими доказательствами, такими как личные заявления , оценки в средней школе , предыдущие курсовые работы и рекомендательные письма . ^[67] В разных странах существуют разные тесты, такие как SAT в США, Gaokao в Китае и Joint Entrance Examination в Индии.

Натан Кунсель, ученый в области высшего образования, говорит, что вступительные тесты в колледжи и другие стандартизированные тесты «помогают перегруженным сотрудникам приемных комиссий разделить огромное количество абитуриентов на группы для дальнейшей оценки. Высокие баллы не гарантируют поступления куда-либо, а низкие баллы не исключают его, но школы относятся к тестам серьезно». ^[68]

Исследования показывают, что тесты предсказывают больше, чем просто оценки за первый год и уровень курсов, которые, скорее всего, будет изучать студент. Лонгитюдное исследование, проведенное учеными, показывает, что студенты с высокими результатами тестов с большей вероятностью выберут сложный путь в колледже. ^[69] Тесты также могут указывать на результаты студентов за пределами колледжа, включая оценки факультета, научные достижения, получение степени, результаты на комплексных экзаменах и профессиональное лицензирование. ^[70]

Поскольку оценки в разных школах различаются, и даже для двух учеников в одной школе, общая мера, предоставляемая результатами тестов, более полезна для сравнения учеников.

Однако в апреле 1995 года в «метаанализе», опубликованном в Journal of Educational and Psychological Measurement , Тодд Моррисон и Мелани Моррисон изучили два десятка исследований валидности теста, необходимого для поступления практически в любую магистерскую или докторскую программу в Америке: экзаменов на получение диплома выпускника (GRE). Это исследование охватило более 5000 человек, сдававших тест за последние 30 лет. Авторы обнаружили, что баллы GRE составляли всего 6 процентов от вариации оценок в аспирантуре. GRE, по-видимому, «практически бесполезен с точки зрения прогнозирования», написали авторы. Повторные исследования теста на поступление в юридическую школу (LSAT) обнаружили то же самое.

Ведутся споры о том, покажет ли тест долгосрочный успех в работе и жизни, поскольку существует множество других факторов, но такие фундаментальные навыки, как чтение, письмо и математика, связаны с производительностью труда.

Лонгитюдное исследование 2007 года показало, что основные жизненные достижения, такие как публикация романа или патентование технологии, также связаны с результатами тестов, даже с учетом образовательных возможностей. Существует даже значительный объем доказательств того, что эти навыки связаны с эффективным лидерством и творческими достижениями на работе. Умение читать тексты и понимать их, а также наличие сильного количественного мышления имеют решающее значение в современной информационной экономике . ^[70]

Многие аргументы говорят о том, что навыки, полученные в ходе тестов, полезны, но лишь до определенного момента.

Однако в замечательном лонгитюдном исследовании, опубликованном в 2008 году в журнале Psychological Science, изучались учащиеся, которые в возрасте 13 лет вошли в 1% лучших. Двадцать лет спустя они, в среднем, были очень успешными, с высокими доходами, крупными наградами и карьерными достижениями, которые заставили бы гордиться любого родителя. ^[71]

Существует корреляция между результатами тестов и социальным классом, но успехи в стандартизированных тестах и в колледже зависят не только от класса. Исследования показывают, что «тесты были валидны даже при учете социально-экономического класса. Независимо от их семейного происхождения, студенты с хорошими результатами тестов и оценками в средней школе лучше учатся в колледже, чем студенты с более низкими баллами и слабыми стенограммами». ^[72]

Еще одна критика, касающаяся социального класса и стандартизированного тестирования, заключается в том, что только состоятельные люди получают подготовку к тесту и коучинг. Однако, «исследователи провели смесь экспериментальных исследований и контролируемых полевых исследований, чтобы проверить этот вопрос. Они в целом пришли к выводу, что выгоды от подготовки к тесту составляют скорее от 5 до 20 баллов, а не от 100 до 200 баллов, как заявляют некоторые компании по подготовке к тесту». ^[73]

Что еще важнее, многие люди придерживаются мнения, что тесты препятствуют разнообразию при поступлении, поскольку меньшинства имеют более низкие баллы на тестах по сравнению с другими представленными группами. ^[74] Исследование 2012 года изучало школы, где вступительные тесты являются необязательными для абитуриентов, и сравнивало их со школами, которые используют тесты, и результат показывает, что «последние исследования показывают, что школы, в которых тестирование необязательно, принимают все более разнообразный состав учащихся. Но то же самое относится и к школам, которые требуют тестирования». ^[75]

Противники утверждают, что стандартизированные тесты используются неправильно и являются некритическими суждениями об интеллекте и производительности, но сторонники утверждают, что это не недостатки стандартизированных тестов, а критика плохо разработанных режимов тестирования. Они утверждают, что тестирование должно и действительно фокусирует образовательные ресурсы на самых важных аспектах образования — придавая предопределенный набор знаний и навыков — и что другие аспекты либо менее важны, либо должны быть добавлены в схему тестирования.

Факты показывают, что чернокожие и испаноязычные студенты в среднем набирают меньше баллов, чем белые и азиаты. Поэтому стандартные тесты по математике и чтению, такие как SAT, подвергаются все более частым нападкам со стороны прогрессистов. Однако исчерпывающий отчет сената факультета Калифорнийского университета, подготовленный по заказу Джанет Наполитано и опубликованный в 2020 году, показал, что тесты не являются дискриминационными и играют важную роль в защите качества образования. ^[76]

В отчете предполагается, что усугубляющаяся инфляция оценок , особенно в богатых средних школах, делает стандартную оценку особенно важной. ^[76]

Что касается намерения школ Калифорнийского университета отказаться от стандартных тестов, таких как SAT и ACT, при поступлении в колледж, субъективные и индивидуальные тесты, такие как эссе и внеклассные занятия, могут быть легко адаптированы и нанести вред студентам, которые не знакомы с процессом. Прием без тестирования может быть еще более смещен в пользу хорошо связанных. ^[77]

В январе 2020 года сенат факультета Калифорнийского университета рекомендовал системе UC сохранить стандартизированные тесты в качестве требований к поступлению. ^[76] В отчете говорится, что стандартизированные тесты по математике и чтению полезны для прогнозирования успеваемости в колледже. На основе данных студентов в системе UC в отчете делается вывод, что «результаты тестов в настоящее время являются лучшими предикторами среднего балла аттестата за первый год, чем средний балл успеваемости в старшей школе». ^[76] В отчете продолжается: баллы также хороши для прогнозирования общего среднего балла аттестата в колледже и вероятности того, что студент окончит учебу. В то время как «предсказательная сила результатов тестов возросла», добавляется в отчете, «предсказательная сила оценок в старшей школе снизилась». ^[76]

Результаты тестов позволяют школам Калифорнийского университета «выбирать тех студентов из недостаточно представленных групп , которые с большей вероятностью получат более высокие оценки и закончат учебу вовремя». ^[76] «Первоначальная цель SAT заключалась в выявлении студентов, которые пришли из-за пределов относительно привилегированных кругов и которые могли бы иметь потенциал для успеха в университете», — говорится в отчете. ^[76] Создатель SAT, Служба образовательного тестирования (ETS), теперь утверждает, что SAT — это не тест на «способности», а скорее оценка «развитых способностей». ^[78]

Проблемы тестирования, не характерные для стандартизации

Большинство тестов можно классифицировать по нескольким категориям. Например, тест может быть как стандартизированным, так и тестом с высокими ставками, или стандартизированным и тестом с множественным выбором. Жалобы на «стандартизированные тесты» (все сдающие тест проходят один и тот же тест в достаточно схожих условиях, оцениваются одинаково) часто сосредоточены на проблемах, не связанных со стандартизацией, и в равной степени относятся к нестандартизированным тестам. Например, критик может жаловаться, что «все стандартизированные тесты ограничены по времени», но фокус критики сосредоточен на ограничении по времени, а не на том, что все сдают один и тот же тест и их ответы оцениваются одинаково.

Тесты с высокими ставками

Тест с высокими ставками — это тест с желаемой наградой за хорошую работу. ^[4] Некоторые стандартизированные тесты, включая многие тесты, используемые для поступления в университеты по всему миру, являются тестами с высокими ставками. Большинство стандартизированных тестов, таких как обычные аудиторные тесты, являются тестами с низкими ставками. ^[4]

Сильная зависимость от высокоуровневых стандартизированных тестов для принятия решений часто является спорной. Распространенной проблемой высокоуровневых тестов является то, что они измеряют производительность во время одного события, тогда как критики считают, что более целостная оценка была бы уместной. Критики часто предлагают подчеркивать кумулятивные или даже нечисловые меры, такие как оценки в классе или краткие индивидуальные оценки (написанные в прозе) от учителей. Сторонники утверждают, что результаты тестов обеспечивают четкий, объективный стандарт, который служит ценной проверкой инфляции оценок . ^[79]

Тесты, соответствующие нормам

Тест, основанный на норме, — это тест, который разработан и оценивается таким образом, что некоторые участники теста получают более высокий или более низкий рейтинг, чем другие. ^[4] Рейтинг предоставляет информацию об относительном рейтинге, что полезно, когда цель состоит в том, чтобы определить, кто является лучшим (например, при поступлении в элитный университет). ^[4]

Несогласие с образовательными стандартами

Тест , основанный на критериях, более распространен и практичен, когда цель состоит в том, чтобы узнать, усвоили ли испытуемые требуемый материал. ^[4]

Однако некоторые критики возражают против «стандартизированных тестов» не потому, что они возражают против предоставления студентам одного и того же теста в разумно схожих условиях и оценивания ответов одинаковым образом, а потому, что они возражают против типа материала, который обычно проверяется школами. Хотя существуют стандартизированные тесты для неакадемических атрибутов, такие как тесты Торренса по творческому мышлению , школы редко предлагают стандартизированные тесты для измерения «инициативы, креативности, воображения... любопытства... доброй воли, этических размышлений или множества других ценных предрасположенностей и качеств». ^[80]^[81] Вместо этого тесты, проводимые школами, как правило, меньше фокусируются на развитии морали или характера и больше на индивидуальных идентифицируемых академических навыках, таких как понимание прочитанного и арифметика .

В своей книге «Позор нации » Джонатан Козол утверждает, что ученики, прошедшие стандартизированное тестирование, являются жертвами «когнитивного обезглавливания». Козол приходит к такому выводу после разговора со многими детьми в школах внутренних городов, у которых нет пространственной памяти о времени, временных периодах и исторических событиях. Это особенно касается школ, где из-за нехватки финансирования и строгой политики подотчетности школы отказались от таких предметов, как искусство, история и география, чтобы сосредоточиться на содержании обязательных тестов. ^[82]

Тестовая тревожность

Некоторые люди начинают нервничать во время прохождения теста. Это явление чаще встречается в тестах с высокими ставками, чем в тестах с низкими ставками. Тесты с высокими ставками (стандартизированные или нестандартизированные) могут вызывать беспокойство.

Сами студенты критикуют, что тесты, хотя и стандартизированы, несправедливы по отношению к каждому студенту. Некоторые студенты утверждают, что они «плохие сдающие тесты», то есть нервничают и не могут сосредоточиться на тестах. Поэтому, хотя тест стандартный и должен давать справедливые результаты, сдающие тест утверждают, что они находятся в невыгодном положении и не имеют возможности доказать свои знания, поскольку нет другой альтернативы тестированию, которая позволила бы студентам доказать свои знания и навыки решения проблем.

У некоторых учеников есть тревожность перед тестами . От десяти до сорока процентов учеников испытывают этот тип тревожности. ^[83] Дети, живущие в бедности, больше всего страдают от тревожности перед тестами. ^[84] Тревожность перед тестами касается как стандартизированных, так и нестандартизированных тестов.

Тесты с множественным выбором и форматы тестов

Тест с множественным выбором предоставляет тестируемому вопросы, сопряженные с заранее определенным списком возможных ответов. Это тип закрытого вопроса . Тестируемый выбирает правильный ответ из списка.

Многие критики стандартизированного тестирования возражают против формата с множественным выбором, который обычно используется для недорогого, масштабного тестирования и который не подходит для некоторых целей, например, для проверки того, может ли испытуемый написать абзац. Однако стандартизированное тестирование может использовать любой формат теста, включая открытые вопросы , при условии, что все испытуемые проходят один и тот же тест в разумно схожих условиях и оцениваются так же, как это стандартизированный тест.

Обучение для проверки

Обучение к тесту — это процесс преднамеренного сужения инструкции, чтобы сосредоточиться только на материале, который будет оцениваться в тесте. Например, если учитель знает, что предстоящий тест по истории не будет включать никаких вопросов по истории музыки или искусства, то учитель может «учить к тесту», пропуская материал в учебнике о музыке и искусстве. Критики также заявляют, что стандартизированные тесты поощряют « обучение к тесту » за счет творчества и глубокого охвата предметов, не входящих в тест. Критики говорят, что обучение к тесту не благоприятствует обучению более высокого порядка; оно трансформирует то, что учителям разрешено преподавать, и существенно ограничивает объем другой информации, которую учащиеся изучают на протяжении многих лет. ^[85] Хотя можно использовать стандартизированный тест, не позволяя его содержанию определять учебную программу и обучение, часто то, что не проверяется, не преподается, и то, как проверяется предмет, часто становится моделью для того, как преподавать предмет.

Внешние тесты, такие как тесты, созданные департаментом образования для студентов в их районе, побуждают учителей сузить формат учебной программы и обучать в соответствии с тестом. ^[86]

Оплата на основе результатов — это идея, что учителям следует платить больше, если ученики хорошо справляются с тестами, и меньше, если они плохо справляются. ^[85] Когда учителей или школы вознаграждают за лучшую успеваемость на тестах, то эти вознаграждения побуждают учителей « учить по тесту » вместо того, чтобы предоставлять богатую и широкую учебную программу. В 2007 году качественное исследование, проведенное О Уэйном, показало, что стандартизированное тестирование сужает учебную программу и поощряет обучение, ориентированное на учителя, вместо обучения, ориентированного на учеников . ^[87] Губернатор Нью-Джерси Крис Кристи предложил образовательную реформу в Нью-Джерси, которая заставляет учителей не только «учить по тесту», но и заставлять своих учеников работать за счет потенциальной потери их зарплаты и гарантий занятости. Реформа предусматривала оплату на основе результатов, которая зависит от успеваемости учеников на стандартизированных тестах и их образовательных достижений. ^[88]

Критики утверждают, что чрезмерное и неправильное использование этих тестов вредит преподаванию и обучению, сужая учебную программу. По данным группы FairTest , когда стандартизированные тесты являются основным фактором подотчетности, школы используют тесты, чтобы сузить учебную программу и сосредоточить обучение. Подотчетность создает огромное давление, требующее выполнения, и это может привести к неправильному использованию и неверному толкованию стандартизированных тестов. ^[66]

Смотрите также

Основные темы

Тест на успеваемость
Инвентаризация концепций – Инструмент оценки знаний
Образовательная оценка – Метод образовательной оценки
Оценка – систематическое определение заслуг, ценности и значимости субъекта.
Список стандартизированных тестов в США
Психометрия – Теория и методика психологических измерений
- Теория ответов на вопросы – парадигма для разработки, анализа и оценки тестов
Оценка на основе стандартов – Оценка на основе указанных стандартов
Тест (оценка) – Образовательная оценка

Другие темы

Альтернативная оценка
Закон Кэмпбелла – Поговорка о порочных стимулах
Выпускной экзамен в средней школе – выпускной экзамен в средней школе
IBM 805 Test Scoring Machine – электромеханическая машина для подсчета результатов тестов, представленная IBM в 1937 году.
Реформа образования на основе стандартов – Образовательная система, основанная на желаемых целях
Эффект Вольво – Термин для критики стандартизированного тестирования.

Ссылки

^ Попхэм, У. Дж. (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.
^ Фелпс, Ричард П. «Роль и важность тестирования». nonpartisaneducation.org . Получено 17 мая 2016 г.
^ abc Olson, Amy M.; Sabers, Darrell (октябрь 2008 г.). «Стандартизированные тесты». В Good, Thomas L. (ред.). 21st Century Education: A Reference Handbook . SAGE Publications. стр. 423–430. doi :10.4135/9781412964012.n46. ISBN 9781452265995. S2CID 241229809.
^ abcdefghi Аллен, Г. Дональд; Росс, Аманда (2017-11-10). «Тесты и метки с низкими ставками». Педагогика и содержание в средней и старшей школе математики . Springer. ISBN 978-94-6351-137-7.
^ "Китайская государственная служба". Encyclopaedia Britannica . Получено 2 мая 2015 г.
^ abcde Марк и Бойер (1996), 9–10.
^ ab Казин, Эдвардс и Ротман (2010), 142.
^ ab Trahair, Richard (2015-06-01). Поведение, технология и организационное развитие: Эрик Трист и Тавистокский институт. Transaction Publishers. ISBN 9781412855495.
^ Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. SAGE Publications, INC. 2010. 853–856.Web.
^ Гаррисон, Марк Дж. Мера неудачи: политические истоки стандартизированного тестирования. Олбани: Государственный университет Нью-Йорка, 2009. Печать.
^ ab Moller, Stephanie; Potochnick, Stephanie (2008). "Стандартизированные тесты". В Darity, William Jr. (ред.). Международная энциклопедия социальных наук . Gale Cengage Learning .
↑ Гулд, С. Дж., «Нация идиотов», New Scientist (6 мая 1982 г.), 349–352.
^ Дарити, Уильям младший. «Международная энциклопедия социальных наук». Энциклопедии для справочной информации . Gale Cengage Learning . Получено 25 января 2017 г.
^ Флетчер, Дэн. «Стандартизированное тестирование». Time. Time Inc., 11 декабря 2009 г. Веб. 9 марта 2014 г.
^ "Что на ACT". Разделы теста ACT. Np, nd Web. 05 мая 2014 г.
^ Стиггинс, Ричард (2002). «Кризис оценки: отсутствие оценки для обучения» (PDF) . Phi Delta Kappan . 83 (10): 758–765. doi :10.1177/003172170208301010. S2CID 145683785.
^ ab Strauss, Valerie (11 марта 2015 г.). «Пять причин, по которым стандартизированное тестирование не собирается уступать». The Washington Post . The Washington Post . Получено 26 января 2017 г. .
^ «История и предпосылки движения No Child Left Behind». Bright Hub Education, 9 июня 2015 г. Веб-сайт. 12 октября 2015 г. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
^ «Закон об успехе каждого студента (ESSA) | Министерство образования США».
^ Клейборн, Чарльз. «Тестирование с высокими ставками». Энциклопедия одаренности, креативности и таланта. SAGE Publications, 2009. 9 апреля 2014 г.
↑ Валери, Штраус (21 июня 2020 г.). «Похоже, это начало конца одержимости Америки стандартизированными тестами для учащихся». The Washington Post .
^ "Главная – Австралийская учебная программа v8.1". www.australiancurriculum.edu.au . Получено 17.05.2016 .
^ Коули, Питер; Макферсон, Пейдж (2022). ТЕСТИРОВАНИЕ КАНАДСКИХ УЧАЩИХСЯ K-12: Региональная изменчивость, возможности для улучшения (PDF) . Институт Фрейзера. ISBN 978-0-88975-694-6. Получено 19 декабря 2023 г. .
^ Горовиц, MR; Монтгомери, DL (январь 1993). «Физиологический профиль пожарных в сравнении с нормами для населения Канады». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN 0008-4263. PMID 8500058.
^ Канадская ассоциация спортивных наук; Программа сертификации и аккредитации оценки физической подготовки; Канадское общество физиологии упражнений; Fitness Canada (1987). Канадский стандартизированный тест на физическую подготовку (CSTF): для людей в возрасте от 15 до 69 лет: руководство по интерпретации и консультированию . Глостер, Онтарио: Канадское общество физиологии упражнений. ISBN 0-662-15736-2. OCLC 16048356.
^ Веб-страница ETS. Архивировано 18 июня 2009 г. на Wayback Machine. О подведении итогов GRE.
^ ab Houtz, Jolayne (27 августа 2000 г.) «Временные сотрудники тратят всего несколько минут на прохождение государственного теста. Математическая задача WASL может занять 20 секунд; эссе, 2.mw-parser-output .frac{white-space:nowrap}.mw-parser-output .frac .num,.mw-parser-output .frac .den{font-size:80%;line-height:0;vertical-align:super}.mw-parser-output .frac .den{vertical-align:sub}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);clip-path:polygon(0px 0px,0px 0px,0px 0px);height:1px;margin:-1px;overflow:hidden;padding:0;position:absolute;width:1px}1⁄2 минут" Архивировано 10.03.2007 в Wayback Machine . Seattle Times "За считанные минуты временный сотрудник с зарплатой 10 долларов в час выставляет оценку за тест вашего ребенка"
^ Рич, Мотоко (22.06.2015). «Оценка Common Core: опыт преподавания не требуется». The New York Times . ISSN 0362-4331 . Получено 06.10.2015 .
^ Ли, Джассим (1989). «Ожидания учителей: самоисполняющиеся пророчества, предвзятость восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. doi :10.1037/0022-3514.57.3.469.
^ Где мы находимся: Оценка на основе стандартов и подотчетность (Американская федерация учителей) [1] Архивировано 24 августа 2006 г. на Wayback Machine
^ "Объединенный комитет по стандартам оценки образования". Архивировано из оригинала 15 октября 2009 года . Получено 2 мая 2015 года .
^ Объединенный комитет по стандартам оценки образования. (1988). Стандарты оценки персонала: как оценивать системы для оценки педагогов. Архивировано 12 декабря 2005 г. в Wayback Machine , Ньюбери-Парк, Калифорния: Sage Publications.
^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ, 2-е издание. Архивировано 22 февраля 2006 г. в Wayback Machine, Ньюбери-Парк, Калифорния: Sage Publications.
^ Комитет по стандартам образовательной оценки. (2003). Стандарты оценки учащихся: как улучшить оценку учащихся. Архивировано 24 мая 2006 г. в Wayback Machine Newbury Park, CA: Corwin Press.
^ Морган, Хани (2016). «Опираться на стандартизированные тесты с высокими ставками для оценки школ и учителей: плохая идея». The Clearing House: Журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. doi :10.1080/00098655.2016.1156628. S2CID 148015644.
^ "Стандарты образовательного и психологического тестирования". www.apa.org . Получено 2 мая 2015 г.
^ Кунсель, NR; Хезлетт, SA (2007). «ОЦЕНКА: стандартизированные тесты предсказывают успех аспирантов». Science . 315 (5815): 1080–81. doi :10.1126/science.1136618. PMID 17322046. S2CID 143260128.
^ abcd Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Psychology Press. ISBN 978-0-8058-4912-7.
^ ab "Плюсы и минусы стандартизированных тестов". Oxford Learning . 2014-10-29 . Получено 2018-02-19 .
^ "За и против стандартизированного тестирования" (PDF) . Колумбийский университет . Весна 2013 г. Архивировано из оригинала (PDF) 2018-01-27 . Получено 19 февраля 2018 г. .
^ ab Hirsch, Eric Jr. (1999). Школы, которые нам нужны: и почему у нас их нет . Нью-Йорк: Anchor. ISBN 978-0-385-49524-0.
^ "Критика SAT со стороны FairTest". fairtest.org. 20 августа 2007 г.
^ «Стандартизированные тесты не всегда являются лучшим показателем успеха». 20 августа 2007 г.
^ Paton, Graeme (6 июля 2010 г.). «Университеты критикуют «инфляцию оценок» на экзаменах» . The Daily Telegraph . Лондон. Архивировано из оригинала 2022-01-12.
^ Васагар, Дживан (2 августа 2010 г.). «Опасения за учащихся государственных школ, поскольку ведущие университеты настаивают на A* на уровне A-level». The Guardian . Лондон.
^ Финч, Джулия (10 марта 2010 г.). «Они не умеют читать, не умеют писать, не следят за временем и не соблюдают порядок: вердикт директора Tesco выпускникам школ». The Guardian . Лондон.
^ Хеджес, Ларри В.; Лейн, Ричард Д.; Гринвальд, Роб (1994). "Хеджес Л. В. (1994) Обмен: Часть I*: Имеют ли деньги значение? Метаанализ исследований влияния дифференцированного школьного вклада на результаты учащихся". Educational Researcher . 23 (3): 5–14. doi :10.3102/0013189X023003005. S2CID 36771659.
↑ Кофлан, Шон. «Умные бедняки» «сдерживались десятилетиями», BBC , 16 октября 2013 г. Получено 17 октября 2013 г.
^ «Нейробиология стандартизированного тестирования».
^ «Стандартизированные тесты не показывают, что знают дети». 10 июля 2017 г.
^ «Стандартизированные тесты не являются хорошим показателем подвижного интеллекта согласно новому исследованию». 11 января 2014 г.
^ «Стандартизированные тесты не измеряют интеллект или способности». 27 сентября 2016 г.
^ «Наблюдения: результаты стандартизированных тестов не отражают способностей учащихся».
^ Дэвидсон, Кэти (2011). Теперь вы это видите: как наука о мозге и внимании изменит наш образ жизни, работы и обучения . Нью-Йорк: Viking.
^ US News (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли дублера для сдачи экзаменов на сертификацию». NBC News . Получено 2 мая 2015 г.
^ Шмидт, Уильям Х.; Хуанг, Ричард Т. (2012). «Учебная согласованность и общие стандарты обучения по математике». Educational Researcher . 41 (8): 294–308. doi :10.3102/0013189x12464517. S2CID 121779439.
^ Портер, А.; МакМейкен, Дж.; Хванг, Дж.; Янг, Р. (2011). «Стандарты общих базовых предметов: новая предполагаемая учебная программа США». Educational Researcher . 40 (7): 103–116. doi :10.3102/0013189x11405038. S2CID 51453603.
^ Лейтон, Линдси (24 октября 2015 г.). «Исследование показывает, что стандартизированное тестирование подавляет государственные школы страны». The Washington Post . Получено 26 июля 2015 г.
^ Деринг, Кристофер (25 октября 2015 г.). «План Обамы ограничивает стандартизированное тестирование не более чем 2% учебного времени». USA Today . Получено 26 июля 2016 г.
^ Кучински-Браун, Алекс. «Стандартизированное тестирование обходится государствам в 1,7 миллиарда долларов в год, согласно исследованию». The Huffington Post. TheHuffingtonPost.com, 29 ноября 2012 г. Веб. 7 апреля 2014 г.
^ «Большая четверка индустрии тестирования». PBS Frontline . PBS. 2001. Получено 21.01.2015 .
^ "Просмотреть все темы – The National Academies Press". Архивировано из оригинала 2008-04-18 . Получено 2 мая 2015 .
^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017 г.
^ Нил, Монти (осень 2009). Стандартизированные тесты несправедливы и вредны. Детройт: Фармингтон-Хиллз, Мичиган: Greenhaven Press. стр. 28–35. ISBN 9780737747812. Получено 4 декабря 2016 г.
^ Майнер, Барбара (август 2000 г.). «Стандартизированное мышление: высокая цена американской культуры тестирования и что мы можем сделать, чтобы ее изменить / Противоречия школьной реформы: образовательные издержки стандартизированного тестирования». The Progressive . 64 : 40–43. ProQuest 231959849.
^ ab Holloway, JH (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.
^ Мерфи, Сара С.; Клигер, Дэвид М.; Борнеман, Мэтью Дж.; Кунсель, Натан Р. (2009). «Прогностическая сила личных заявлений при приеме: метаанализ и предостерегающая история». Колледж и университет . 84 : 83–86, 88.
^ Кунсель, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT». The Wall Street Journal .
^ Кунсель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов». Science . 315 (5815): 1080–1. doi :10.1126/science.1136618. PMID 17322046. S2CID 143260128.
^ ab Kuncel, Nathan; Hezlett, Sarah A. (2007). «Стандартизированные тесты предсказывают успех аспирантов». Science . 315 (5815): 1080–1081. doi :10.1126/science.1136618. PMID 17322046. S2CID 143260128.
^ Парк, Грегори; Любински, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия в способностях людей с сопоставимыми степенями имеют значение для научного творчества». Психологическая наука . 19 (10): 957–961. doi :10.1111/j.1467-9280.2008.02182.x. PMID 19000201. S2CID 6443429.
^ Кунсель, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус связь между вступительными тестами и академической успеваемостью после окончания средней школы?». Психологический вестник : 1–22.
^ Коннелли, Брайан С.; Кунсель, Натан (3 ноября 2012 г.). «Балансировка групп лечения и контроля в квазиэкспериментах: введение в оценку склонности». Психология персонала . 66 (2): 407–442. doi :10.1111/peps.12020.
^ Коуч, Майкл; Фрост, Маркиша; Сантьяго, Дж.; Хилтон, Адриэль (09.09.2021). «Переосмысление стандартизированного тестирования с точки зрения доступа, равенства и успеваемости: изменилось ли что-нибудь для афроамериканских студентов?». Журнал исследовательских инициатив . 5 (3). ISSN 2168-9083.
^ Кунсель, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях между оценками SAT и решениями о поступлении в колледж». Психологическая наука . 23 (9): 1000–7. doi :10.1177/0956797612438732. PMID 22858524. S2CID 22703783.
^ abcdefg УНИВЕРСИТЕТ КАЛИФОРНИИ, АКАДЕМИЧЕСКИЙ СЕНАТ (январь 2020 г.). «Отчет целевой группы по стандартизированному тестированию Академического совета Калифорнийского университета» (PDF) .
^ Редакционная коллегия (17 мая 2020 г.). «Калифорния определяет снижение тестирования». The Wall Street Journal .
^ Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка прогностической валидности...» Журнал образовательных и психологических измерений. 1995. Компонентыhttp://epm.sagepub.com/content/55/2/309.abstract.
^ Бакли, Джек; Летукас, Линн; Вилдавски, Бен (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледж, Балтимор: Johns Hopkins University Press, стр. 344, ISBN 9781421424965
^ Кон, Альфи (2000). Дело против стандартизированного тестирования: повышение оценок, разрушение школ . Портсмут, Нью-Гэмпшир: Heinemann. ISBN 978-0325003252.
^ Учить: путь учителя, Уильям Айерс, Teachers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , стр. 116
^ Козол, Джонатан (2005). Позор нации: восстановление апартеидного образования в Америке . Печать: Random House. стр. 118–119. ISBN 9781415924167.
^ Вуд; Харт; Литтл; Филлипс (2016). «Тестовая тревожность и стандартизированный тест на понимание прочитанного с высокими ставками: перспектива поведенческой генетики». Merrill-Palmer Quarterly . 62 (3): 233–251. doi : 10.13110/merrpalmquar1982.62.3.0233. ISSN 0272-930X. PMC 5487000. PMID 28674461 .
^ "Тесты и стрессовая предвзятость". Гарвардская высшая школа образования . 12 февраля 2019 г. Получено 27 октября 2022 г.
^ ab Williams, Mary (2015). «Стандартизированное тестирование вредит обучению студентов». go.galegroup.com . Получено 28 марта 2018 г. .
^ "Госвами У (1991) Испытание: Влияние внешнего тестирования на учителей. Исследователь в области образования 20: 8-11". Архивировано из оригинала 2013-02-02.
^ Au, Wayne (01.06.2007). «Тестирование с высокими ставками и контроль учебной программы: качественный метасинтез». Educational Researcher . 36 (5): 258–267. doi :10.3102/0013189X07306523. ISSN 0013-189X. S2CID 507582.
^ Arco, Matt (12 июня 2015 г.). «Christie Education Speech in Iowa». NJ.com . Получено 25 июля 2016 г. .

95.) Тестируемые 1

96.) Тестируемые 2

Дальнейшее чтение

FairTest, «Что не так со стандартизированными тестами?», архив 18 октября 2019 г. в Wayback Machine Fact Sheet. (Нью-Йорк: Basic Books, 1985), стр. 172–181.
Харрис, Смит и Харрис. Мифы о стандартизированных тестах: почему они не говорят вам того, что вы думаете, они говорят, Rowman & Littlefield 2011* Хаддлстон, Марк В. Бойер, Уильям В. Высшая государственная служба в Соединенных Штатах: поиски реформ . (Издательство Питтсбургского университета, 1996)
Фелпс, Ричард П. Влияние тестирования на успеваемость учащихся, 1910–2010, Международный журнал тестирования, 10(1), 2012.
Фелпс, Ричард П., редактор. Исправление заблуждений об образовательном и психологическом тестировании. (Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008)
Фелпс, Ричард П., Стандартизированное тестирование. (Нью-Йорк, Нью-Йорк: Питер Лэнг, 2007)
Фелпс, Ричард П. Роль и значение стандартизированного тестирования в мире преподавания и обучения
Равич, Диана , «Использование и неправильное использование тестов» Архивировано 18 октября 2017 г. на Wayback Machine , в Школы, которых мы заслуживаем * Штраус, Валери. Подтверждено: стандартизированное тестирование захватило наши школы. Но кто виноват?

Внешние ссылки

Объединенный комитет по стандартам оценки образования
Стандартизированное тестирование в школе
Стандарты образовательного и психологического тестирования
Определение стандартизированного теста от Национального совета по измерениям в образовании