stringtranslate.com

Стандартизированный тест

Молодые люди в Польше сдают экзамены на аттестат зрелости . Экзамен Matura стандартизирован, поэтому университеты могут легко сравнивать результаты студентов по всей стране.

Стандартизированный тест — это тест , который проводится и оценивается последовательным или «стандартным» способом. Стандартизированные тесты разработаны таким образом, чтобы вопросы и интерпретации были единообразными, а их назначение и оценка проводились в заранее установленном стандартном порядке. [1]

Любой тест, в котором один и тот же тест дается всем участникам одинаково и оценивается одинаково для всех, является стандартизированным тестом. Стандартизированные тесты не обязательно должны быть тестами с высокими ставками , ограниченными по времени тестами или тестами с несколькими вариантами ответов . Стандартизированным тестом может быть любой тип теста: письменный тест, устный тест или тест на практические навыки . Вопросы могут быть простыми или сложными. Предметом учащихся школьного возраста часто являются академические навыки, но стандартизированный тест можно сдать практически по любой теме, включая экзамены по вождению , творческие способности, атлетизм , личность , профессиональную этику или другие характеристики.

Противоположностью стандартизированного тестирования является нестандартизированное тестирование , при котором либо разные тесты даются разным участникам теста, либо один и тот же тест назначается в существенно разных условиях (например, одной группе дается гораздо меньше времени для завершения теста, чем другой группе). следующая группа) или оцениваются по-разному (например, один и тот же ответ засчитывается как правильный для одного учащегося, но неправильный для другого).

Большинство повседневных тестов и тестов, сдаваемых учащимися в школе, соответствуют определению стандартизированного теста: все в классе сдают один и тот же тест, в одно и то же время, при одинаковых обстоятельствах, и все учащиеся получают одинаковые оценки от своих учителей. способ. Однако термин «стандартизированный тест» чаще всего используется для обозначения тестов, которые проводятся для более крупных групп, например, тест, который сдают все взрослые, желающие получить лицензию на выполнение определенного вида работы, или все студенты определенного вида работы. возраст. Большинство стандартизированных тестов представляют собой формы суммативного оценивания – оценивания, которые пытаются измерить уровень обучения участников в конце учебного модуля.

Поскольку все получают одинаковый тест и одну и ту же систему оценок, стандартизированные тесты часто считаются более справедливыми, чем нестандартизированные. Такие тесты часто считаются более справедливыми и объективными, чем система, в которой одни учащиеся получают более простой тест, а другие — более сложный. Стандартизированные тесты созданы для того, чтобы обеспечить надежное сравнение результатов всех участников тестирования, поскольку все сдают один и тот же тест. [2] Однако некоторые люди критикуют как тестирование в целом, так и стандартизированное тестирование в частности. Например, некоторые люди считают, что несправедливо задавать всем учащимся одни и те же вопросы, если в школах некоторых учащихся не действуют одинаковые стандарты обучения .

Определение

Двое мужчин выполняют искусственное дыхание кукле для сердечно-лёгочной реанимации
Двое мужчин проходят аутентичный , неписьменный , стандартизированный тест , основанный на критериях . Если они проведут сердечно-легочную реанимацию на манекене с правильной скоростью и давлением, они пройдут этот экзамен.

Определение стандартизированного теста со временем несколько изменилось. [3] В 1960 году стандартизированные тесты определялись как тесты, в которых условия и содержание были равными для всех, сдающих тест, независимо от того, когда, где и кем тест проводился или оценивался. Цель этой стандартизации — убедиться, что баллы достоверно отражают измеряемые способности или навыки, а не другие вещи, такие как различные инструкции о том, что делать, если испытуемый не знает ответа на вопрос. [3]

К началу XXI века акцент сместился от строгого сходства условий к равной справедливости условий. [3] Например, тестируемый со сломанным запястьем мог бы писать медленнее из-за травмы, и это было бы более справедливо и обеспечило бы более надежное понимание фактических знаний тестируемого, если бы этому человеку дали еще несколько минут, чтобы записать ответы на ограниченный по времени тест. Изменение условий тестирования таким образом, чтобы повысить справедливость в отношении постоянной или временной нетрудоспособности, но не подрывая при этом основную суть оценки, называется приспособлением . Однако если бы целью теста было выяснить, насколько быстро студент может писать, то предоставление тестируемому дополнительного времени стало бы модификацией содержания , а не стандартизированным тестом.

История

Китай

Самые ранние свидетельства стандартизированного тестирования были в Китае , во времена династии Хань, [4] где императорские экзамены охватывали шесть искусств , включая музыку, стрельбу из лука, верховую езду, арифметику, письмо и знание ритуалов и церемоний как государственных, так и частных. части. Эти экзамены использовались для отбора сотрудников государственной бюрократии.

Позже к тестированию были добавлены разделы по военной стратегии, гражданскому праву, доходам и налогообложению, сельскому хозяйству и географии. В таком виде экзамены были институционализированы более тысячелетия.

Сегодня стандартизированное тестирование по-прежнему широко используется, особенно в системе Гаокао .

Великобритания

Стандартизированное тестирование было введено в Европу в начале 19-го века по образцу китайских экзаменов по китайскому языку [5] благодаря поддержке британских колониальных администраторов, самым «настойчивым» из которых был британский консул в Гуанчжоу , Китай , Томас Тейлор Медоуз. [5] Медоуз предупредил о крахе Британской империи, если стандартизированное тестирование не будет немедленно внедрено по всей империи. [5]

До их принятия стандартизированное тестирование традиционно не было частью западной педагогики. Основываясь на скептической и открытой традиции дебатов, унаследованной от Древней Греции, западные научные круги отдавали предпочтение нестандартизированным оценкам с использованием эссе, написанных студентами. Именно по этой причине первое европейское внедрение стандартизированного тестирования произошло не в самой Европе, а в Британской Индии . [6] Вдохновленные использованием стандартизированного тестирования в Китае, в начале 19 века британские «менеджеры компаний нанимали и продвигали по службе сотрудников на основе конкурсных экзаменов, чтобы предотвратить коррупцию и фаворитизм». [6] Эта практика стандартизированного тестирования была позже принята в конце 19 века на материковой части Великобритании. В последовавших за этим парламентских дебатах было много упоминаний о «китайской мандариновой системе». [5]

Именно из Британии стандартизированное тестирование распространилось не только по всему Британскому Содружеству , но и в Европе , а затем и в Америке. [5] Его распространение было вызвано промышленной революцией . Увеличение числа школьников во время и после промышленной революции в результате принятия законов об обязательном образовании привело к уменьшению использования открытого оценивания, которое было труднее массово производить и оценивать объективно из-за его по своей сути субъективного характера.

Мужчина сортирует мелкие предметы в деревянный поднос
Британские солдаты проходили стандартизированные тесты во время Второй мировой войны. Этот новичок сортирует механические детали, чтобы проверить свое понимание механизмов. На его униформе нет имени, звания или других знаков, которые могли бы повлиять на оценку его работы.

Стандартизированные тесты, такие как отборочные комиссии военного ведомства, были разработаны для британской армии во время Второй мировой войны для отбора кандидатов для подготовки офицеров и выполнения других задач. [7] В тестах оценивались умственные способности солдат, механические навыки, способность работать с другими и другие качества. Предыдущие методы страдали предвзятостью и приводили к выбору не тех солдат для подготовки офицеров. [7]

Соединенные Штаты

Стандартизированное тестирование является частью образования в США с 19 века, но широкое распространение стандартизированного тестирования в школах США во многом является явлением 20 века.

Иммиграция в середине 19 века способствовала росту стандартизированных тестов в США. [8] Стандартизированные тесты использовались, когда люди впервые приехали в США, чтобы проверить социальные роли и определить социальную власть и статус. [9]

Комиссия по вступительным экзаменам в колледжи не предлагала стандартизированные тесты для поступления в университеты и колледжи до 1900 года. Первые экзамены были проведены в 1901 году по девяти предметам. Этот тест был реализован с целью создания стандартизированного приема в элитные университеты северо-востока США. Первоначально тест также предназначался для лучших школ-интернатов , чтобы стандартизировать учебную программу. [10] Первоначально стандартизированный тест состоял из эссе и не предназначался для широкого тестирования. [ нужна цитата ]

Во время Первой мировой войны были разработаны армейские альфа- и бета- тесты, чтобы помочь новобранцам получить соответствующие задания в зависимости от их оцененного уровня интеллекта. [11] Первое издание современного стандартизированного теста на IQ , тест интеллекта Стэнфорда-Бине , появилось в 1916 году. Затем Совет колледжа разработал SAT (тест способностей ученого) в 1926 году. Первый тест SAT был основан на армейском тесте IQ. тесты с целью определить интеллект тестируемого, навыки решения проблем и критическое мышление . [12] В 1959 году Эверетт Линдквист впервые предложил ACT (Американское тестирование колледжей). [13] По состоянию на 2020 год ACT включает четыре основных раздела с вопросами с несколькими вариантами ответов для проверки английского языка, математики, чтения и естественных наук, а также дополнительный раздел письма. [14]

Отдельные штаты начали тестировать большое количество детей и подростков через системы государственных школ в 1970-х годах. К 1980-м годам американские школы оценивали результаты на национальном уровне. [15] В 2012 году 45 штатов заплатили в среднем 27 долларов США за одного студента и 669 миллионов долларов США в целом за крупномасштабные ежегодные академические тесты. [16] Однако другие расходы, такие как оплата учителям подготовки учащихся к тестам и время, потраченное на проведение тестов, значительно превышают стоимость самого теста. [16]

Необходимость федерального правительства проводить значимые сравнения в высоко децентрализованной (контролируемой на местном уровне) системе государственного образования способствовала использованию крупномасштабного стандартизированного тестирования. Закон о начальном и среднем образовании 1965 года требовал стандартизированного тестирования в государственных школах. Закон 2001 года «Ни один ребенок не останется без внимания» дополнительно привязал некоторые виды финансирования государственных школ к результатам стандартизированного тестирования.

Целью программы «Ни одного ребенка не останется позади» было улучшение системы образования в Соединенных Штатах путем привлечения школ и учителей к ответственности за успеваемость учащихся, включая разрыв в успеваемости между детьми из числа меньшинств и детей, не принадлежащих к меньшинствам, в государственных школах . Дополнительным фактором в системе образования США является социально-экономическое положение тестируемых учащихся. По данным Национального центра помощи детям, живущим в бедности , 41 процент детей в возрасте до 18 лет происходят из семей с низким доходом. [17] Этим учащимся требуется особое внимание, чтобы хорошо учиться в школе и сдавать стандартизированные тесты. [18]

В соответствии с этими федеральными законами школьная программа по-прежнему устанавливалась каждым штатом, но федеральное правительство требовало от штатов оценивать, насколько хорошо школы и учителя преподают выбранный штатом материал с помощью стандартизированных тестов. [19] Результаты учащихся по крупномасштабным стандартизированным тестам использовались для выделения средств и других ресурсов школам, а также для закрытия школ с плохой успеваемостью. Закон «Каждый учащийся преуспевает » заменил NCLB в конце 2015 года. [20] К тому моменту эти крупномасштабные стандартизированные тесты стали спорными в Соединенных Штатах, поскольку они представляли собой тесты с высокими ставками для школьной системы и учителей. [21]

В последние годы многие университеты и колледжи США отказались от требования о проведении стандартизированных тестов абитуриентами. [22]

Австралия

Стандартизированное тестирование Австралийской национальной программы оценки грамотности и счета (NAPLAN) было начато в 2008 году Австралийским органом по учебной программе, оценке и отчетности, независимым органом, «ответственным за разработку национальной учебной программы, национальной программы оценки и национального сбора данных». и программа отчетности, которая поддерживает обучение 21 века для всех австралийских студентов». [23]

В тестировании участвуют все учащиеся 3, 5, 7 и 9 классов австралийских школ, которые будут оцениваться с использованием национальных тестов. В число предметов, охватываемых этими тестами, входят чтение, письмо, правила языка (орфография, грамматика и пунктуация) и умение считать.

Программа представляет отчеты об уровне учащихся, предназначенные для того, чтобы родители могли видеть прогресс своего ребенка в течение школьной жизни и помочь учителям улучшить индивидуальные возможности обучения для своих учеников. Данные об учащихся и уровне школы также предоставляются соответствующей школьной системе при том понимании, что их можно использовать для направления конкретной поддержки и ресурсов школам, которые в них больше всего нуждаются. Учителя и школы используют эту информацию в сочетании с другой информацией, чтобы определить, насколько хорошо учатся их ученики, и выявить любые области, требующие помощи.

Концепция тестирования успеваемости учащихся не нова, хотя можно сказать, что нынешний австралийский подход берет свое начало в нынешних структурах образовательной политики как в США, так и в Великобритании. Существует несколько ключевых отличий между австралийской NAPLAN и стратегиями Великобритании и США. Школам, которые оказались неэффективными в австралийских условиях, будет предложена финансовая помощь в соответствии с текущей политикой федерального правительства.

Колумбия

В 1968 году был создан Колумбийский институт оценки образования (ICFES), призванный регулировать высшее образование. Была внедрена прежняя система общественной оценки для разрешения деятельности и юридического признания учреждений и университетских программ.

В Колумбии существует несколько стандартизированных тестов, оценивающих уровень образования в стране. Эти экзамены проводятся ICFES.

Учащиеся третьего, пятого и девятого классов сдают экзамен «Сабля 3°5°9°». Этот тест в настоящее время представлен на компьютере в контролируемых и переписных выборках.

По окончании школы старшеклассникам вручается «Сабля 11», позволяющая им поступать в разные вузы страны. Студенты, обучающиеся дома, могут сдать этот экзамен, чтобы окончить среднюю школу и получить аттестат и диплом.

Студенты, покидающие университет, должны сдать экзамен «Sabre Pro».

Канада

Канада оставляет образование и, как следствие, стандартизированное тестирование под юрисдикцией провинций. В каждой провинции действует свой собственный стандартизированный режим тестирования, охватывающий всю провинцию: от отсутствия обязательных стандартизированных тестов для учащихся в Саскачеване до экзаменов, составляющих 40% итоговых оценок средней школы в Ньюфаундленде и Лабрадоре. [24]

Дизайн и озвучивание

Дизайн

Чаще всего основной академический тест включает разделы, оцениваемые как человеком, так и компьютером.

Стандартизированный тест может состоять из вопросов с несколькими вариантами ответов, вопросов «верно-неверно», вопросов-эссе, аутентичных оценок или практически любой другой формы оценки. Задания с множественным выбором и «верно-неверно» часто выбираются для тестов, которые сдают тысячи людей, поскольку их можно сдавать и оценивать недорого, быстро и надежно с помощью специальных листов ответов, которые можно прочитать с помощью компьютера или с помощью адаптивных к компьютеру программ . тестирование . Некоторые стандартизированные тесты включают в себя компоненты краткого ответа или написания эссе, которым независимые оценщики присваивают баллы, которые используют рубрики (правила или рекомендации) и контрольные документы (примеры работ для каждого возможного балла) для определения оценки, которая будет присвоена ответу.

Любая тематика

Плакат на стене с указанием требуемого поведения и баллов, которые будут вычитаться за ошибки на английском и китайском языках.
Плакат, показывающий стандарты сдачи экзаменов по вождению на Тайване. Каждый человек, желающий получить водительские права, сдает один и тот же тест и получает одинаковые баллы.

Не все стандартизированные тесты предполагают ответы на вопросы. Настоящая оценка спортивных навыков может принимать форму бега в течение определенного времени или ведения мяча на определенную дистанцию. Медицинские работники должны пройти тесты, доказывающие, что они могут выполнять медицинские процедуры. Кандидаты на получение водительских прав должны пройти стандартный тест, показывающий, что они умеют водить автомобиль. Канадский стандартизированный тест физической подготовки использовался в медицинских исследованиях, чтобы определить, насколько физически подготовлены участники теста. [25] [26]

Машинный и человеческий подсчет

В некоторых стандартизированных тестах используются тесты с несколькими вариантами ответов, оценка которых относительно недорога, но можно использовать любую форму оценивания.

Со второй половины 20-го века крупномасштабное стандартизированное тестирование отчасти формировалось благодаря простоте и дешевизне оценки тестов с несколькими вариантами ответов с помощью компьютера. Большинство национальных и международных оценок не в полной мере оцениваются людьми.

Люди привыкли оценивать предметы, которые сложно оценить с помощью компьютера (например, эссе). Например, выпускной экзамен представляет собой адаптивную к компьютеру оценку, которая не требует от людей выставления оценок, за исключением письменной части. [27]

Оценка, выполняемая человеком, является относительно дорогостоящей и часто варьирующейся, поэтому, когда это возможно, предпочтительнее использовать компьютерную оценку. Например, некоторые критики говорят, что низкооплачиваемые сотрудники будут иметь плохие результаты на тестах. [28] Согласие между оценками может варьироваться от 60 до 85 процентов, в зависимости от теста и сеанса подсчета баллов. При проведении крупномасштабных тестов в школах некоторые тестировщики платят за то, чтобы каждый документ прочитали два или более экспертов; если их оценки не совпадают, то работа передается дополнительным оценщикам. [28]

Хотя этот процесс сложнее, чем электронная оценка тестов с несколькими вариантами ответов, эссе также можно оценивать с помощью компьютера. В других случаях эссе и другие открытые ответы оцениваются в соответствии с заранее установленными критериями оценки обученными оценщиками. Например, в Pearson все оценщики эссе имеют четырехлетнюю университетскую степень, и большинство из них являются нынешними или бывшими классными руководителями. [29]

Использование рубрик для справедливости

Использование критериев призвано повысить справедливость при оценке успеваемости учащегося. При стандартизированном тестировании ошибку измерения (постоянную картину ошибок и систематических ошибок при оценке теста) легко определить. При нестандартизированном оценивании оценщики обладают большей индивидуальной свободой действий и, следовательно, с большей вероятностью будут давать несправедливые результаты из-за неосознанной предвзятости . Когда оценка зависит от индивидуальных предпочтений оценщиков, оценки учащихся зависят от того, кто оценивает тест. Стандартизированные тесты также устраняют предвзятость учителей в оценке. Исследования показывают, что учителя создают своего рода самоисполняющееся пророчество в своей оценке учеников, гарантируя тем, кто, по их ожиданиям, достигнет более высоких результатов, и давая тем, кто, по их ожиданиям, провалится, более низкие оценки. [30]

Использование оценок для сравнения

Существует два типа интерпретации результатов стандартизированных тестов : интерпретация оценок , основанная на нормах , и интерпретация оценок , основанная на критериях .

Любую из этих систем можно использовать при стандартизированном тестировании. Для стандартизированного тестирования важно то, всем ли учащимся задаются одинаковые вопросы, при одинаковых обстоятельствах и получают ли они одинаковые оценки. В стандартизированном тесте, если данный ответ правильный для одного учащегося, он верен для всех учащихся. Оценщики не признают ответ как достаточно хороший для одного учащегося, но отвергают тот же ответ как неадекватный для другого учащегося.

Термин «нормативная оценка» относится к процессу сравнения одного тестируемого с его или ее сверстниками. Нормативно -ориентированный тест (НЗТ) — это тип теста, оценки или оценки , который позволяет оценить положение тестируемого человека в заранее определенной популяции. Оценка получена на основе анализа результатов тестов и других соответствующих данных выборки, составленной из населения. Этот тип теста определяет, показал ли тестируемый результаты лучше или хуже, чем другие учащиеся, сдающие этот тест. Тест на основе критериев (CRT) — это стиль теста, в котором результаты тестов используются для того, чтобы показать, хорошо ли испытуемые справились с данным заданием, а не насколько хорошо они справились с заданием по сравнению с другими участниками теста. Большинство тестов и викторин, написанных школьными учителями, представляют собой тесты, основанные на критериях. В этом случае цель состоит в том, чтобы просто увидеть, сможет ли студент правильно ответить на вопросы. Учитель обычно не пытается сравнить результаты каждого ученика с результатами других учеников.

Это делает стандартизированные тесты полезными для целей поступления в высшие учебные заведения, когда школа пытается сравнить студентов со всей страны или со всего мира. Примеры таких международных эталонных тестов включают «Тенденции в международных исследованиях в области математики и естественных наук» ( TIMMS ) и «Прогресс в международном исследовании читательской грамотности» ( PIRLS ). Предполагается, что результаты на этих экзаменах изменятся в зависимости от того, как стандарты, такие как Common Core State Standards (CCSS), соответствуют стандартам ведущих стран мира.

Поскольку результаты можно сравнивать в разных школах, результаты национального стандартизированного теста можно использовать для определения того, какие области необходимо улучшить. Тесты, которые сдают все желающие, могут помочь правительству определить, какие школы и какие ученики испытывают наибольшие трудности. [32] С помощью этой информации они могут реализовать решения для решения проблемы, позволяя студентам учиться и расти в академической среде. [32]

Стандарты

Соображения валидности и надежности обычно рассматриваются как важные элементы для определения качества любого стандартизированного теста. Однако ассоциации профессионалов и практиков часто помещают эти проблемы в более широкий контекст при разработке стандартов и вынесении общих суждений о качестве любого стандартизированного теста в целом в данном контексте.

Стандарты оценки

В области оценки , и в частности оценки образования , Объединенный комитет по стандартам оценки образования [33] опубликовал три набора стандартов оценки. «Стандарты оценки персонала » [34] были опубликованы в 1988 году, «Стандарты оценки программ» (2-е издание) [35] были опубликованы в 1994 году, а «Стандарты оценки студентов» [36] были опубликованы в 2003 году.

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат рекомендации по разработке, внедрению, оценке и совершенствованию определенной формы оценки. Каждый из стандартов отнесен к одной из четырех основных категорий, чтобы обеспечить правильность, полезность, осуществимость и точность образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в рамках темы точности. Однако цель тестов – гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся; Стандартизированные тесты предоставляют ограниченную информацию о многих формах интеллекта, и использование их вредит учащимся, поскольку неточно измеряет потенциал учащегося на успех. [37]

Стандарты тестирования

В области психометрии Стандарты образовательного и психологического тестирования [38] устанавливают стандарты достоверности и надежности, а также ошибки измерения и вопросы, связанные с размещением людей с ограниченными возможностями . Третья и последняя основная тема охватывает стандарты, связанные с тестированием приложений, аттестацией , а также тестированием при оценке программ и государственной политике .

Статистическая достоверность

Одним из основных преимуществ стандартизированного тестирования является то, что результаты можно документировать эмпирически; следовательно, можно показать, что результаты тестов имеют относительную степень достоверности и надежности , а также являются результатами, которые можно обобщить и воспроизвести. [39] Это часто контрастируют с оценками в школьных ведомостях, которые выставляются отдельными учителями. Может быть трудно объяснить различия в образовательной культуре в разных школах, сложность учебной программы конкретного учителя, различия в стиле преподавания, а также методы и предубеждения, влияющие на выставление оценок.

Еще одним преимуществом является агрегирование. Хорошо разработанный стандартизированный тест обеспечивает оценку владения человеком областью знаний или навыков, которая на определенном уровне агрегирования предоставит полезную информацию. То есть, хотя индивидуальные оценки могут быть недостаточно точными для практических целей, средние баллы классов, школ, филиалов компании или других групп вполне могут предоставить полезную информацию из-за уменьшения ошибки, достигаемой за счет увеличения размера выборки.

Тестируемые

Сами учащиеся критикуют, что тесты, хотя и стандартизированы, несправедливы по отношению к отдельному учащемуся. Некоторые студенты утверждают, что они «плохо сдают тесты», то есть они нервничают и теряют концентрацию на тестах. Таким образом, хотя тест является стандартным и должен давать справедливые результаты, тестируемые утверждают, что они находятся в невыгодном положении и не имеют возможности доказать свои знания иным образом, поскольку не существует другой альтернативы тестированию, которая позволила бы учащимся доказать свои знания и решить проблемы. навыки решения.

Некоторые студенты испытывают тревогу перед экзаменами . От десяти до сорока процентов студентов испытывают этот тип тревоги. [40] На самом деле, дети из бедных семей больше всего страдают от тревоги перед испытанием. [41] Тревога перед тестированием применима и к стандартизированным тестам, когда учащиеся, которые, возможно, не испытывают тревожности перед экзаменами, регулярно испытывают огромное давление, когда ставки настолько высоки. Стандартизированное тестирование с высокими ставками включает в себя такие экзамены, как SAT, PARCC и ACT, хорошая успеваемость по которым необходима для сдачи экзамена или поступления в колледж.

Ежегодные стандартизированные тесты в школе

Стандартизированное тестирование является очень распространенным способом определения прошлых академических достижений учащегося и его будущего потенциала. Однако тесты с высокими ставками (как стандартизированные, так и нестандартизированные) могут вызывать беспокойство. Когда учителей или школы награждают за лучшую успеваемость на тестах, тогда эти награды побуждают учителей «учить по тесту », а не предоставлять насыщенную и обширную учебную программу. В 2007 году качественное исследование, проведенное О Уэйном, продемонстрировало, что стандартизированное тестирование сужает учебную программу и поощряет обучение, ориентированное на учителя, а не обучение, ориентированное на учащихся . [42]

Валидность, качество или использование тестов, особенно ежегодных стандартизированных тестов, распространенных в образовании, по-прежнему широко поддерживаются или критикуются. Как и сами тесты, поддержка и критика тестов часто различаются и могут исходить из разных источников, таких как родители, тестируемые, преподаватели, бизнес-группы, университеты или государственные контролирующие органы.

Сторонники широкомасштабных стандартизированных тестов в образовании часто приводят следующие причины для продвижения тестирования в образовании:

Критики стандартизированных тестов в образовании часто приводят следующие причины для пересмотра или удаления стандартизированных тестов в образовании:

Влияние на школы

Молодые люди в голубой форме сидят за столами с контрольными бумагами и карандашами.
Зачисленные военнослужащие сдают бумажный стандартизированный тест с несколькими вариантами ответов в надежде получить повышение по службе. Все они отвечают на одни и те же вопросы и получают одинаковые оценки.

Стандартизированное тестирование используется в качестве стратегии государственной политики для установления более строгих мер подотчетности в сфере государственного образования . В то время как Национальная оценка прогресса в образовании (NAEP) служила образовательным барометром в течение примерно тридцати лет, проводя стандартизированные тесты на регулярной основе в случайных школах по всей территории Соединенных Штатов, усилия, предпринятые за последнее десятилетие на уровне штатов и федеральном уровне, потребовали ежегодного стандартизированное проведение тестов для всех государственных школ по всей стране. [58]

Идея движения за политику стандартизированного тестирования заключается в том, что тестирование является первым шагом к улучшению школ, практики преподавания и методов обучения посредством сбора данных. Сторонники утверждают, что данные, полученные с помощью стандартизированных тестов, действуют как табель успеваемости для сообщества, демонстрируя, насколько хорошо работают местные школы. Критики движения, однако, указывают на различные несоответствия, возникающие в результате нынешних государственных стандартизированных методов тестирования, включая проблемы с валидностью и надежностью тестов, а также ложные корреляции (см. Парадокс Симпсона ).

Наряду с проведением реальных тестов и выставлением оценок, в некоторых случаях учителя оцениваются по тому, насколько хорошо их ученики справились с тестами. Учителя вынуждены постоянно повышать баллы, чтобы доказать, что они достойны сохранить свою работу. Этот подход подвергся критике, поскольку на успеваемость учащихся влияет множество внешних факторов, таких как домашнее насилие, голод и бездомность среди учащихся. [37]

Оплата по результатам – это идея, согласно которой учителям следует платить больше, если учащиеся хорошо сдают тесты, и меньше, если они показывают плохие результаты. [59] Губернатор Нью-Джерси Крис Кристи предложил образовательную реформу в Нью-Джерси, которая заставляет учителей не только «учить по тесту», но и заставлять своих учеников работать за счет потенциальной стоимости их зарплаты и гарантий занятости. Реформа предусматривала оплату по результатам, которая зависит от успеваемости учащихся на стандартизированных тестах и ​​их образовательных успехов. [60]

Школы с низкими показателями в конечном итоге подлежат закрытию или сокращению, что оказывает прямое влияние на администрацию и приводит к использованию таких опасных тактик, как запугивание, обман и выкачивание информации для повышения оценок. [59]

Некритическое использование результатов стандартизированных тестов для оценки успеваемости учителей и школы неуместно, поскольку на оценки учащихся влияют три вещи: то, чему учащиеся учатся в школе, чему учащиеся учатся вне школы, и врожденный интеллект учащихся . [61] Школа может контролировать только один из этих трех факторов. Чтобы справиться с этой критикой, было предложено моделирование добавленной стоимости путем статистического контроля врожденных способностей и контекстуальных факторов вне школы. [62] [ самостоятельно опубликованный источник ] В дополнительной системе интерпретации результатов тестов аналитики оценивают ожидаемый балл для каждого учащегося на основе таких факторов, как собственные предыдущие результаты тестов учащегося, основной язык или социально-экономический статус. Предполагается, что разница между ожидаемым и фактическим баллом учащегося обусловлена, прежде всего, усилиями учителя.

Влияние на то, чему учат студентов

Критики также утверждают, что стандартизированные тесты поощряют « обучение тесту » в ущерб творческому подходу и углубленному освещению предметов, не включенных в тест. Тесты с множественным выбором критикуются за то, что они не позволяют оценить такие навыки, как письмо. Кроме того, успехи учащихся отслеживаются по относительной успеваемости учителя, в результате чего продвижение учителя зависит от успехов учителя в успеваемости ученика. Этические и экономические вопросы возникают у учителей, когда они сталкиваются с явно отстающими или недостаточно квалифицированными учениками и стандартизированным тестом.

Критики утверждают, что чрезмерное и неправильное использование этих тестов вредит преподаванию и обучению, поскольку сужает учебную программу. По данным группы FairTest , когда стандартизированные тесты являются основным фактором подотчетности, школы используют тесты, чтобы узко определить учебную программу и сфокусировать обучение. Подотчетность создает огромное давление на результаты, и это может привести к неправильному использованию и неправильной интерпретации стандартизированных тестов. [64]

Критики говорят, что обучение с помощью теста не способствует обучению более высокого порядка; это меняет то, что учителям разрешено преподавать, и сильно ограничивает объем другой информации, которую учащиеся изучают на протяжении многих лет. [59] Хотя можно использовать стандартизированный тест, не позволяя его содержанию определять учебную программу и обучение, часто то, что не проверяется, не преподается, и то, как проверяется предмет, часто становится моделью преподавания предмета.

Критики также возражают против типа материала, который обычно тестируется в школах. Хотя существуют стандартизированные тесты для неакадемических качеств, такие как тесты Торренса на творческое мышление , школы редко проводят стандартизированные тесты для измерения инициативы, креативности, воображения, любознательности, доброй воли, этического мышления или множества других ценных качеств и качеств. [65] Вместо этого тесты, проводимые в школах, как правило, меньше сосредотачиваются на развитии нравственности или характера, а больше на индивидуальных идентифицируемых академических навыках.

В своей книге « Теперь вы это видите » Кэти Дэвидсон критикует стандартизированные тесты. Она описывает молодежь как «детей сборочного конвейера на модели конвейера», имея в виду использование стандартизированного теста как часть единой образовательной модели. Она также критикует узость проверяемых навыков и называет детей, не имеющих этих навыков, неудачниками или учениками с ограниченными возможностями. [66] Широко распространенное и организованное мошенничество стало растущей культурой. [67]

Теоретик образования Билл Эйерс прокомментировал ограничения стандартизированного теста, написав, что «Стандартизированные тесты не могут измерить инициативу, креативность, воображение, концептуальное мышление, любопытство, усилия, иронию, суждение, приверженность, нюансы, добрую волю, этическое мышление, или множество других ценных качеств и качеств. Они могут измерить и подсчитать отдельные навыки, конкретные факты и функции, содержание знаний, наименее интересные и наименее значимые аспекты обучения». [68] В своей книге « Позор нации» Джонатан Козол утверждает , что студенты, прошедшие стандартизированное тестирование, являются жертвами «когнитивного обезглавливания». Козол приходит к этому осознанию после разговора со многими детьми в городских школах, у которых нет пространственной памяти о времени, периодах времени и исторических событиях. Это особенно актуально в школах, где из-за нехватки финансирования и строгой политики подотчетности школы отказались от таких предметов, как искусство, история и география; чтобы сосредоточиться на содержании обязательных тестов. [69]

Есть три показателя, по которым оцениваются страны с лучшими показателями в TIMMS («страны А+»): целенаправленность, последовательность и строгость. Фокус определяется как количество тем, рассматриваемых в каждом классе; Идея состоит в том, что чем меньше тем рассматривается в каждом классе, тем больше внимания можно уделить каждой теме. Определение связности соответствует последовательности рассматриваемых тем, которая следует естественному развитию или логической структуре математики. CCSSM сравнивался как с действующими государственными стандартами, так и со стандартами страны A+ . Учитывая, что в среднем освещается большинство тем, действующие государственные стандарты имеют наименьшую направленность. [70] Целью Common Core Standards является устранение этого несоответствия, помогая преподавателям сосредоточиться на том, что учащимся необходимо выучить, а не отвлекаться на посторонние темы. Они побуждают образовательные материалы переходить от поверхностного освещения широкого спектра тем к более глубокому освещению нескольких тем. [71]

Время и деньги

Стандартизированные тесты — это способ измерения уровня образования учащихся и школ в широком масштабе. От детского сада до 12-го класса большинство американских учащихся ежегодно сдают стандартизированные тесты. Средний учащийся сдает около 10 таких тестов в год (например, один или два теста на понимание прочитанного, один или два теста по математике, тест по письму, тест по естественным наукам и т. д.). [72] Средний объем тестирования занимает около 2,3% от общего учебного времени (что соответствует примерно четырем учебным дням в году). [73]

Стандартизированные тесты дороги в проведении. Сообщается, что Соединенные Штаты ежегодно тратят на эти испытания около 1,7 миллиарда долларов США. [74] В 2001 году также сообщалось, что только три компании (Harcourt Educational Measurement, CTB McGraw-Hill и Riverside Publishing) разрабатывают 96% тестов, проводимых на уровне штата. [75]

Образовательные решения

Сильная зависимость от важных стандартизированных тестов при принятии решений часто вызывает споры. Критики часто предлагают делать акцент на кумулятивных или даже нечисловых показателях, таких как оценки в классе или краткие индивидуальные оценки (написанные в прозе) учителей. Сторонники утверждают, что результаты тестов представляют собой четкий и объективный стандарт, который служит ценным средством проверки завышения оценок . [76]

Национальная академия наук рекомендует, чтобы основные образовательные решения не основывались исключительно на одном результате теста. [77] Использование минимальных проходных баллов для поступления или окончания не подразумевает единого стандарта, поскольку результаты тестов почти всегда сочетаются с другими минимальными критериями, такими как количество кредитов, обязательные курсы, посещаемость и т. д. Результаты тестов часто воспринимаются в качестве «единственных критериев» просто потому, что они наиболее сложны, или автоматически предполагается выполнение других критериев. Единственным исключением из этого правила является GED , который позволил многим людям признать свои навыки, даже если они не соответствовали традиционным критериям. [ нужна цитата ]

Некоторые учителя утверждают, что один стандартизированный тест измеряет только текущие знания учащегося и не отражает прогресс учащегося с начала года. [78] Результат, созданный людьми, которые не участвуют в обычном обучении учащихся, а профессионалами, которые определяют, что учащиеся должны знать в разном возрасте. Кроме того, учителя сходятся во мнении, что лучшим создателем и координатором тестов являются они сами. Они утверждают, что лучше всего осведомлены о способностях, способностях и потребностях учащихся, что позволило бы им дольше изучать предметы или продолжить обучение по обычной учебной программе.

Влияние на учащихся из неблагополучных семей

Монти Нил, директор Национального центра справедливого и открытого тестирования, утверждает, что студентам, которые говорят на английском как на втором языке, имеют инвалидность или происходят из семей с низким доходом, непропорционально часто отказывают в дипломе из-за результатов теста. что несправедливо и вредно. Например, в конце 1970-х годов, когда в Соединенных Штатах начались выпускные испытания, в иске утверждалось, что многие чернокожие студенты не имели справедливых возможностей по материалу, который они тестировали на выпускном тесте, потому что они посещали школы, разделенные по закону. «Взаимодействие школ с ограниченными ресурсами и тестированием сильнее всего бьет по цветным учащимся», как утверждает Нил: «Им непропорционально отказывают в дипломах или повышении в классе, и школы, которые они посещают, скорее всего, будут плохо сдавать тесты и столкнуться с трудностями. санкции, такие как реструктуризация». [79]

В журнале The Progressive Барбара Майнер объясняет недостатки стандартизированного тестирования, анализируя три разные книги. Содиректор Центра образования Университета Райса и профессор педагогики Линда М. Макнил в своей книге « Противоречия школьной реформы: образовательные затраты на стандартизированное тестирование» пишет: «Образовательная стандартизация вредит преподаванию и обучению и в долгосрочной перспективе , рестратирует образование по расе и классу». Макнил считает, что реформа образования, основанная на тестировании, устанавливает более высокие стандарты для цветных учащихся. По словам Майнера, МакНил «показывает, как реформа, основанная на тестировании, централизует власть в руках корпоративной и политической элиты - особенно пугающее событие в это время растущего корпоративного и консервативного влияния на реформу образования». Такая реформа, основанная на тестировании, затруднила обучение, особенно для цветных учащихся. [80]

FairTest заявляет, что негативные последствия неправильного использования тестов включают в себя вытеснение учащихся из школы, вытеснение учителей из профессии, а также подрыв вовлеченности учащихся и школьного климата. [64]

Использование стандартизированных тестов при поступлении в университеты

Стандартизированные тесты рассматриваются университетами как часть заявления вместе с другими подтверждающими доказательствами, такими как личные заявления , оценки в средней школе , предыдущие курсовые работы и рекомендательные письма . [81] В разных странах проводятся разные тесты, например, SAT в США, Gaokao в Китае и совместный вступительный экзамен в Индии.

Натан Кансел, ученый в области высшего образования, говорит, что вступительные экзамены в колледж и другие стандартизированные тесты «помогают перегруженным сотрудникам приемной комиссии разделить огромное количество абитуриентов на группы для дальнейшей оценки. Высокие баллы не гарантируют поступления куда-либо, а низкие баллы не являются определяющими. это, но школы серьезно относятся к тестам». [82]

Исследования показывают, что тесты предсказывают не только оценки первого года обучения и уровень курсов, которые студент, скорее всего, пройдёт. Лонгитюдное исследование , проведенное учеными, показывает, что студенты с высокими результатами тестов с большей вероятностью выберут сложный путь поступления в колледж. [83] Тесты также могут показать результаты студентов после окончания колледжа, включая оценки преподавателей, научные достижения, получение ученой степени, результаты на комплексных экзаменах и профессиональную лицензию. [84]

Поскольку оценки различаются в разных школах и даже для двух учащихся в одной школе, общий показатель, обеспечиваемый результатами теста, более полезен для сравнения учащихся.

Однако в «метаанализе», опубликованном в апреле 1995 года в « Журнале образовательных и психологических измерений» , Тодд Моррисон и Мелани Моррисон изучили две дюжины исследований валидности теста, необходимого для поступления практически в любую программу магистратуры или докторантуры в Америке: «Выпускник» Запись экзамена (GRE). В этом исследовании за последние 30 лет приняли участие более 5000 тестируемых. Авторы обнаружили, что результаты GRE составляют лишь 6 процентов разницы в оценках в аспирантуре. GRE кажется «практически бесполезным с точки зрения прогнозирования», пишут авторы. Повторные исследования вступительного теста на юридический факультет (LSAT) показали то же самое.

Ведутся споры о том, укажет ли тест на долгосрочный успех в работе и жизни, поскольку существует множество других факторов, но фундаментальные навыки, такие как чтение, письмо и математика, связаны с производительностью труда.

Лонгитюдное исследование 2007 года показало, что важные жизненные достижения, такие как публикация романа или патентование технологии, также связаны с результатами тестов, даже если принять во внимание возможности получения образования. Существует даже значительное количество доказательств того, что эти навыки связаны с эффективным лидерством и творческими достижениями на работе. Умение читать тексты и понимать их смысл, а также иметь сильные количественные рассуждения имеют решающее значение в современной информационной экономике . [84]

Многие аргументы свидетельствуют о том, что навыки, полученные в результате тестов, полезны, но только до определенного момента.

Тем не менее, в замечательном лонгитудинальном исследовании, опубликованном в 2008 году в журнале Psychoological Science , были изучены студенты, которые в возрасте 13 лет входили в 1% лучших. Двадцать лет спустя они в среднем добились очень высоких результатов, имели высокие доходы, крупные награды и карьерные достижения, которыми мог бы гордиться любой родитель. [85]

Существует корреляция между результатами тестов и социальным классом, но успех на стандартизированных тестах и ​​в колледже зависит не только от класса. Исследования показывают, что «тесты были действительны даже с учетом социально-экономического класса. Независимо от семейного происхождения, учащиеся с хорошими результатами тестов и школьными оценками лучше учатся в колледже, чем учащиеся с более низкими баллами и более слабыми успеваемостью». [86]

Еще одна критика, касающаяся социального класса и стандартизированного тестирования, заключается в том, что только богатые люди получают подготовку к экзаменам и обучение. Тем не менее, «исследователи провели сочетание экспериментальных исследований и контролируемых полевых исследований, чтобы проверить этот вопрос. некоторые компании по подготовке к испытаниям». [87]

Что еще более важно, многие люди придерживаются мнения, что тесты предотвращают разнообразие при поступлении, поскольку меньшинства имеют более низкие баллы на тестах по сравнению с другими представленными группами. [88] Исследование 2012 года изучило школы, в которых вступительные испытания не являются обязательными для абитуриентов, и сравнило их со школами, в которых такие тесты используются, и результат показывает, что «недавнее исследование показывает, что в школы, в которых вступительные испытания не проводятся, набирают все более разнообразные группы учащихся. то же самое относится и к школам, требующим тестирования». [89]

Противники утверждают, что стандартизированные тесты используются неправильно и являются некритическими суждениями об интеллекте и производительности, но сторонники утверждают, что это не отрицательные стороны стандартизированных тестов, а критика плохо разработанных режимов тестирования. Они утверждают, что тестирование должно и действительно фокусирует образовательные ресурсы на наиболее важных аспектах образования — передаче заранее определенного набора знаний и навыков — и что другие аспекты либо менее важны, либо должны быть добавлены в схему тестирования.

Факты показывают, что чернокожие и латиноамериканские студенты в среднем получают более низкие баллы, чем белые и азиаты. Таким образом, стандартные тесты по математике и чтению, такие как SAT, подвергаются растущим нападкам со стороны прогрессистов. Однако в исчерпывающем отчете сената факультета Калифорнийского университета, подготовленном по заказу Джанет Наполитано и опубликованном в 2020 году, тесты не являются дискриминационными и играют важную роль в защите качества образования. [90]

В докладе говорится, что ухудшение инфляции оценок , особенно в богатых средних школах, делает стандартную оценку особенно важной. [90]

Что касается намерения школ UC отказаться от стандартных тестов, таких как SAT и ACT, при поступлении в колледж, то субъективные и индивидуальные тесты, такие как эссе и внеклассные занятия, могут быть легко адаптированы и наносить ущерб учащимся, которые не знакомы с этим процессом. Прием без тестирования может быть еще более склонен в пользу людей с хорошими связями. [91]

В январе 2020 года сенат факультета Калифорнийского университета рекомендовал системе Калифорнийского университета сохранить стандартизированные тесты в качестве требований к поступающим. [90] В докладе говорится, что стандартизированные тесты по математике и чтению полезны для прогнозирования успеваемости в колледже. Основываясь на данных учащихся системы Калифорнийского университета, в отчете делается вывод, что «результаты тестов в настоящее время являются лучшим предиктором среднего балла первого года обучения, чем средний балл средней школы». [90] В докладе продолжается: баллы также позволяют спрогнозировать общий средний балл колледжа и вероятность того, что студент окончит его. В то время как «прогностическая сила результатов тестов возросла», добавляется в докладе, «прогностическая сила оценок в средней школе снизилась». [90]

Результаты тестов позволяют школам Калифорнийского университета «отбирать тех учащихся из недостаточно представленных групп , которые с большей вероятностью получат более высокие оценки и закончат обучение вовремя». [90] «Первоначальной целью SAT было выявить студентов, пришедших из не относительно привилегированных кругов, которые могли бы иметь потенциал для достижения успеха в университете», — говорится в отчете. [90] Создатель SAT, Служба образовательного тестирования (ETS), теперь утверждает, что SAT — это не тест на «способности», а скорее оценка «развитых способностей». [92]

Тестирование для цветных учащихся, людей с ограниченными возможностями и выходцев из малообеспеченных семей в США.

Споры

Стандартизированное тестирование и требование проведения таких тестов при поступлении в колледж являются спорной темой. Причина разногласий заключается в том, что эти тесты могут создать неравные возможности для учащихся в зависимости от их экономического статуса, расы или даже статуса способностей. Цветные учащиеся, студенты с ограниченными возможностями и представители малообеспеченных слоев населения часто имеют низкие показатели успеваемости. Скорее всего, это связано с «поколениями эксклюзивного жилья, образования и экономической политики». [93] Эти пробелы в достижениях не являются новой концепцией. В 1991 году разрыв между средними баллами белых и чернокожих студентов составлял 0,91 стандартного отклонения, а в 2020 году разрыв сократился до 0,79 стандартного отклонения. [93]

Стоимость прохождения тестов

Стандартизированное тестирование может оказаться дорогостоящим для студентов как на подготовительных курсах/в рамках репетиторов, так и при фактическом сдаче теста. ACT и SAT могут стоить 55–70 и 52–68 долларов соответственно . [94] Многие учащиеся, которые могут позволить себе проходить тесты несколько раз, чтобы увидеть лучший результат, [95] который они могут получить, представляют «супер-баллы» или балл, состоящий из их лучших результатов по каждому разделу. Студенты из малообеспеченных сообществ не всегда могут позволить себе сдавать тест несколько раз.

Стоимость подготовки к экзамену

Учащиеся из малообеспеченных семей часто не имеют таких ресурсов для подготовки к экзаменам, как их сверстники из более обеспеченных семей. Это несоответствие в доступных ресурсах приводит к значительной разнице в баллах учащихся разного расового происхождения. В анализе, проведенном Институтом Брукингса, было обнаружено, что 59% белых студентов и 80% азиатских участников тестирования считаются «готовыми к поступлению в колледж» [96] по стандартам SAT по сравнению с менее 25% чернокожих студентов и менее 33% студентов. Студенты латиноамериканского происхождения, которые считаются «готовыми к поступлению в колледж». Хотя Совет колледжа сообщает, что социально-экономические факторы не влияют напрямую на успеваемость учащегося, они могут влиять на нее косвенно через доступ к подготовительным курсам и более качественное обучение, а это опыт, который может сильно повлиять на результаты тестов.

Студенты с ограниченными возможностями

Когда речь идет об учащихся с ограниченными возможностями и особыми потребностями, эти тесты не всегда являются подходящим методом измерения знаний или готовности. От учащихся с ограниченными возможностями не всегда реалистично ожидать, что они будут часами сидеть за партой и молча сдавать тест. Чтобы опровергнуть это, студенты с ограниченными возможностями могут получить дополнительные условия, например, дополнительное время для работы над тестами. [97]

Смотрите также

Основные темы

Другие темы

Рекомендации

  1. ^ Пофэм, WJ (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.
  2. ^ Фелпс, Ричард П. «Роль и важность тестирования». Nonpartisaneducation.org . Проверено 17 мая 2016 г.
  3. ^ abc Олсон, Эми М.; Сэйбрс, Даррелл (октябрь 2008 г.). «Стандартизированные тесты». В Гуде, Томас Л. (ред.). Образование XXI века: Справочник . Публикации SAGE. стр. 423–430. дои : 10.4135/9781412964012.n46. ISBN 9781452265995. S2CID  241229809.
  4. ^ «Государственная служба Китая». Британская энциклопедия . Проверено 2 мая 2015 г.
  5. ^ abcde Марк и Бойер (1996), 9–10.
  6. ^ Аб Казин, Эдвардс и Ротман (2010), 142.
  7. ^ Аб Трэхейр, Ричард (1 июня 2015 г.). Поведение, технологии и организационное развитие: Эрик Трист и Тавистокский институт. Издатели транзакций. ISBN 9781412855495.
  8. ^ Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. SAGE Publications, INC. 2010. 853–856.Web.
  9. ^ Гаррисон, Марк Дж. Мера неудачи: политические истоки стандартизированного тестирования. Олбани: Государственный университет Нью-Йорка, 2009. Печать.
  10. ^ Дарити, Уильям младший «Международная энциклопедия социальных наук». Энциклопедия справочной информации . Гейл Сенгейдж Обучение . Проверено 25 января 2017 г.
  11. ^ Гулд, С.Дж., «Нация дебилов», New Scientist (6 мая 1982 г.), 349–352.
  12. ^ Дарити, Уильям младший «Международная энциклопедия социальных наук». Энциклопедии для справочной информации . Гейл Сенгейдж Обучение . Проверено 25 января 2017 г.
  13. ^ Флетчер, Дэн. «Стандартизированное тестирование». Время. Time Inc., 11 декабря 2009 г. Интернет. 09 марта 2014 г.
  14. ^ «Что в ACT». Разделы теста ACT. Нп и Интернет. 05 мая 2014 г.
  15. ^ Стиггинс, Ричард (2002). «Кризис оценивания: отсутствие оценивания ДЛЯ обучения» (PDF) . Пхи Дельта Каппан . 83 (10): 758–765. дои : 10.1177/003172170208301010. S2CID  145683785.
  16. ^ Аб Штраус, Валери (11 марта 2015 г.). «Пять причин, по которым стандартизированное тестирование не прекратится». Вашингтон Пост . Вашингтон Пост . Проверено 26 января 2017 г.
  17. ^ Кобал, Х. и Цзян, Ю., 2018 г.
  18. ^ Кобал Х. и Цзян Ю. (2018) Основные факты о детях с низким доходом. Получено с http://www.nccp.org/publications/pub_1194.html.
  19. ^ «История и предыстория организации «Ни один ребенок не оставлен позади»» . Bright Hub Education9 июня 2015 г. Интернет. 12 октября 2015 г. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
  20. ^ «Закон об успехе каждого студента (ESSA) | Министерство образования США» .
  21. ^ Клэйборн, Чарльз. «Тестирование с высокими ставками». Энциклопедия одаренности, творчества и таланта. Публикации SAGE, 2009. 9 апреля 2014 г.
  22. Валери, Штраус (21 июня 2020 г.). «Это похоже на начало конца американской одержимости стандартизированными тестами для студентов». Вашингтон Пост .
  23. ^ «Домой - Австралийская учебная программа v8.1» . www.australiancurriculum.edu.au . Проверено 17 мая 2016 г.
  24. ^ Коули, Питер; Макферсон, Пейдж (2022). «ТЕСТИРОВАНИЕ КАНАДСКИХ СТУДЕНТОВ K-12: региональные различия, есть возможности для улучшения» (PDF) . Институт Фрейзера . ISBN 978-0-88975-694-6. Проверено 19 декабря 2023 г.
  25. ^ Горовиц, MR; Монтгомери, Д.Л. (январь 1993 г.). «Физиологический профиль пожарных по сравнению с нормами для населения Канады». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN  0008-4263. ПМИД  8500058.
  26. ^ Канадская ассоциация спортивных наук; Программа сертификации и аккредитации по фитнес-аттестации; Канадское общество физиологии физических упражнений; Фитнес Канада (1987). Канадский стандартизированный тест физической подготовки (CSTF): для детей от 15 до 69 лет: руководство по интерпретации и консультированию . Глостер, Онтарио: Канадское общество физиологии физических упражнений. ISBN 0-662-15736-2. ОСЛК  16048356.
  27. ^ Веб-страница ETS. Архивировано 18 июня 2009 г. на Wayback Machine , где рассказывается о результатах GRE.
  28. ^ Аб Хаутц, Джолейн (27 августа 2000 г.) «Временные люди тратят всего несколько минут, чтобы пройти государственный тест. Математическая задача WASL может занять 20 секунд; эссе, 2.mw-parser-output .frac{white-space:nowrap}.mw -parser-output .frac .num,.mw-parser-output .frac .den{размер шрифта:80%;line-height:0;вертикальное выравнивание:супер}.mw-parser-output .frac .den{ вертикальное выравнивание:sub}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);clip-path:polygon(0px 0px,0px ​​0px,0px ​​0px); высота: 1 пиксель; поле: -1 пиксель; переполнение: скрыто; отступ: 0; положение: абсолютное; ширина: 1 пиксель} 1/2 минуты». Архивировано 10 марта 2007 г. на Wayback Machine . Сиэтл Таймс : «За считанные минуты временный сотрудник с оплатой 10 долларов в час выставит вашему ребенку оценку за тест»
  29. ^ Рич, Мотоко (22 июня 2015 г.). «Оценка общего ядра: опыт преподавания не требуется». Нью-Йорк Таймс . ISSN  0362-4331 . Проверено 06 октября 2015 г.
  30. ^ Ли, Джуссим (1989). «Ожидания учителя: самоисполняющиеся пророчества, предвзятость восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. дои : 10.1037/0022-3514.57.3.469.
  31. ^ Где мы находимся: оценка и подотчетность на основе стандартов (Американская федерация учителей) [1] Архивировано 24 августа 2006 г., в Wayback Machine.
  32. ^ abcd «Плюсы и минусы стандартизированных тестов». Оксфордское обучение . 29 октября 2014 г. Проверено 19 февраля 2018 г.
  33. ^ «Объединенный комитет по стандартам оценки образования». Архивировано из оригинала 15 октября 2009 года . Проверено 2 мая 2015 г.
  34. ^ Объединенный комитет по стандартам оценки образования. (1988). Стандарты оценки персонала: как оценивать системы оценки преподавателей. Архивировано 12 декабря 2005 г. в Wayback Machine Newbury Park, Калифорния: Sage Publications.
  35. ^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ, 2-е издание. Архивировано 22 февраля 2006 г. в Wayback Machine Newbury Park, Калифорния: Sage Publications.
  36. ^ Комитет по стандартам оценки образования. (2003). Стандарты оценки учащихся: как улучшить оценки учащихся. Архивировано 24 мая 2006 г. в парке Wayback Machine в Ньюбери, Калифорния: Corwin Press.
  37. ^ Аб Морган, Хани (2016). «Опираться на стандартизированные тесты с высокими ставками для оценки школ и учителей: плохая идея». Информационный центр: журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. дои : 10.1080/00098655.2016.1156628. S2CID  148015644.
  38. ^ «Стандарты образовательного и психологического тестирования». www.apa.org . Проверено 2 мая 2015 г.
  39. ^ Кунцель, Северная Каролина; Хезлетт, SA (2007). «ОЦЕНКА: стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–81. дои : 10.1126/science.1136618. PMID  17322046. S2CID  143260128.
  40. ^ Вуд; Харт; Маленький; Филлипс (2016). «Тестовая тревога и стандартизированный тест на понимание прочитанного с высокими ставками: взгляд на поведенческую генетику». Ежеквартальный журнал Меррилл-Палмер . 62 (3): 233–251. doi : 10.13110/merrpalmquar1982.62.3.0233. ISSN  0272-930Х. ПМК 5487000 . ПМИД  28674461. 
  41. ^ «Тесты и предвзятость к стрессу». Гарвардская высшая школа образования . Проверено 27 октября 2022 г.
  42. ^ Ау, Уэйн (1 июня 2007 г.). «Тестирование с высокими ставками и учебный контроль: качественный метасинтез». Исследователь образования . 36 (5): 258–267. дои : 10.3102/0013189X07306523. ISSN  0013-189X. S2CID  507582.
  43. ^ abcd Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Psychology Press. ISBN 978-0-8058-4912-7.
  44. ^ Аб Хирш, Эрик младший (1999). Школы, которые нам нужны: и почему их у нас нет . Нью-Йорк: Якорь. ISBN 978-0-385-49524-0.
  45. ^ «Госвами У (1991) Испытание: влияние внешнего тестирования на учителей. Исследователь образования 20: 8-11». Архивировано из оригинала 2 февраля 2013 г.
  46. ^ "Критика FairTest SAT" . Fairtest.org.
  47. ^ «Стандартизированные тесты не всегда лучший показатель успеха».
  48. Патон, Грэм (6 июля 2010 г.). «Университеты критикуют «раздувание оценок» экзаменов» . «Дейли телеграф» . Лондон. Архивировано из оригинала 12 января 2022 г.
  49. Васагар, Дживан (2 августа 2010 г.). «Опасения за учащихся государственных учреждений, поскольку ведущие университеты настаивают на получении A* на уровне A». Хранитель . Лондон.
  50. Финч, Джулия (10 марта 2010 г.). «Они не умеют читать, не умеют писать, следить за временем и быть опрятными: приговор директора Tesco выпускникам школ». Хранитель . Лондон.
  51. ^ Хеджес, Ларри В.; Лейн, Ричард Д.; Гринвальд, Роб (1994). «Хеджес Л.В. (1994). Обмен: Часть I *: Имеют ли деньги значение? Метаанализ исследований влияния дифференциальных школьных ресурсов на результаты учащихся». Исследователь образования . 23 (3): 5–14. дои : 10.3102/0013189X023003005. S2CID  36771659.
  52. ^ Кофлан, Шон. Яркие бедняки, «сдерживаемые десятилетиями», BBC , 16 октября 2013 г. Проверено 17 октября 2013 г.
  53. ^ «Нейронаука стандартизированного тестирования».
  54. ^ «Стандартизированные тесты не показывают того, что знают дети» . 10 июля 2017 г.
  55. ^ «Согласно новому исследованию, стандартизированные тесты не являются хорошим показателем гибкого интеллекта» . 11 января 2014 г.
  56. ^ «Стандартизированные тесты не измеряют интеллект или способности» . 27 сентября 2016 г.
  57. ^ «Наблюдения: результаты стандартизированных тестов не отражают способности учащихся».
  58. ^ «Табель успеваемости стран NAEP - Национальная оценка прогресса в образовании - NAEP» . nces.ed.gov . Проверено 19 февраля 2018 г.
  59. ^ abc Уильямс, Мэри (2015). «Стандартизированное тестирование вредит обучению учащихся». go.galegroup.com . Проверено 28 марта 2018 г.
  60. Арко, Мэтт (12 июня 2015 г.). «Речь Christie Education в Айове». Нью-Джерси.com . Проверено 25 июля 2016 г.
  61. ^ Пофэм, WJ (1999). «Почему результаты стандартизированных тестов не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15. Архивировано из оригинала 11 июля 2021 г. Проверено 5 октября 2016 г.
  62. ^ Учебник по добавленной стоимости в Огайо. Институт Томаса Б. Фордхэма. 2008.
  63. ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет . Весна 2013 г. Архивировано из оригинала (PDF) 27 января 2018 г. Проверено 19 февраля 2018 г.
  64. ^ Аб Холлоуэй, Дж. Х. (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.
  65. ^ Кон, Алфи (2000). Аргументы против стандартизированного тестирования: повышение результатов, разрушение школ . Портсмут, Нью-Хэмпшир: Хайнеманн. ISBN 978-0325003252.
  66. ^ Дэвидсон, Кэти (2011). Теперь вы это видите: как наука о мозге и внимании изменит то, как мы живем, работаем и учимся . Нью-Йорк: Викинг.
  67. ^ Новости США (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли дублеров для сдачи сертификационных тестов». Новости Эн-Би-Си . Проверено 2 мая 2015 г.
  68. ^ Преподавать: путь учителя Уильяма Айерса, Teachers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , стр. 116  
  69. ^ Козол, Джонатан (2005). Позор нации: восстановление школьного апартеида в Америке . Печать: Рэндом Хаус. стр. 118–119. ISBN 9781415924167.
  70. ^ Шмидт, Уильям Х.; Хуанг, Ричард Т. (2012). «Связность учебных программ и общие основные стандарты по математике». Исследователь образования . 41 (8): 294–308. дои : 10.3102/0013189x12464517. S2CID  121779439.
  71. ^ Портер, А.; МакМакен, Дж.; Хван, Дж.; Ян, Р. (2011). «Общие основные стандарты: новая учебная программа, предназначенная для США». Исследователь образования . 40 (7): 103–116. дои : 10.3102/0013189x11405038. S2CID  51453603.
  72. Лейтон, Линдси (24 октября 2015 г.). «Исследование показывает, что стандартизированное тестирование переполняет государственные школы страны». Вашингтон Пост . Проверено 26 июля 2015 г.
  73. Деринг, Кристофер (25 октября 2015 г.). «План Обамы ограничивает стандартизированное тестирование не более чем 2% учебного времени». США сегодня . Проверено 26 июля 2016 г.
  74. ^ Кучински-Браун, Алекс. «По данным исследования, стоимость стандартизированного тестирования составляет 1,7 миллиарда долларов в год». Хаффингтон Пост. TheHuffingtonPost.com, 29 ноября 2012 г. Интернет. 7 апреля 2014 г.
  75. ^ "Большая четверка индустрии тестирования" . PBS «Линия фронта» . ПБС. 2001 . Проверено 21 января 2015 г.
  76. ^ Бакли, Джек; Летукас, Линн; Вильдавски, Бен (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледж, Балтимор: Издательство Университета Джонса Хопкинса, стр. 344, ISBN 9781421424965
  77. ^ «Просмотреть все темы - Пресса национальных академий» . Архивировано из оригинала 18 апреля 2008 г. Проверено 2 мая 2015 г.
  78. ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017 г.
  79. ^ Нил, Монти (осень 2009 г.). Стандартизированные тесты несправедливы и вредны. Детройт: Фармингтон-Хиллз, Мичиган: Greenhaven Press. стр. 28–35. ISBN 9780737747812. Проверено 4 декабря 2016 г.
  80. ^ Майнер, Барбара (август 2000 г.). «Стандартизированное мышление: высокая цена американской культуры тестирования и что мы можем сделать, чтобы изменить ее / Противоречия школьной реформы: образовательные затраты на стандартизированное тестирование». Прогрессивный . 64 : 40–43. ПроКвест  231959849.
  81. ^ Мерфи, Сара С; Клигер, Дэвид М; Борнеман, Мэтью Дж; Кунцель, Натан Р. (2009). «Прогнозирующая сила личных заявлений при поступлении: метаанализ и поучительная история». Колледж и университет . 84 : 83–86, 88.
  82. ^ Кунцель, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT». Журнал "Уолл Стрит .
  83. ^ Кунцель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–1. дои : 10.1126/science.1136618. PMID  17322046. S2CID  143260128.
  84. ^ аб Кунцель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–1081. дои : 10.1126/science.1136618. PMID  17322046. S2CID  143260128.
  85. ^ Парк, Грегори; Любинский, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия в способностях людей, имеющих соизмеримую степень, имеют значение для научного творчества». Психологическая наука . 19 (10): 957–961. дои : 10.1111/j.1467-9280.2008.02182.x. PMID  19000201. S2CID  6443429.
  86. ^ Кунцель, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус взаимосвязь между вступительными испытаниями и успеваемостью после окончания средней школы?». Психологический вестник : 1–22.
  87. ^ Коннелли, Брайан С.; Кунцель, Натан (3 ноября 2012 г.). «Балансирование групп лечения и контроля в квазиэкспериментах: введение в оценку склонности». Психология персонала . 66 (2): 407–442. дои : 10.1111/peps.12020.
  88. ^ Коуч, Майкл; Фрост, Маркиша; Сантьяго, Дж.; Хилтон, Адриэль (9 сентября 2021 г.). «Переосмысление стандартизированного тестирования с точки зрения доступа, равенства и достижений: изменилось ли что-нибудь для афроамериканских студентов?». Журнал исследовательских инициатив . 5 (3). ISSN  2168-9083.
  89. ^ Кунцель, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях с выпускниками SAT и в решениях о поступлении в колледж». Психологическая наука . 23 (9): 1000–7. дои : 10.1177/0956797612438732. PMID  22858524. S2CID  22703783.
  90. ^ abcdefg КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ, АКАДЕМИЧЕСКИЙ СЕНАТ (январь 2020 г.). «Отчет Целевой группы по стандартизированному тестированию Академического совета Калифорнийского университета» (PDF) .
  91. Редколлегия (17 мая 2020). «Калифорния определяет тестирование вниз». Журнал "Уолл Стрит .
  92. ^ Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка прогностической достоверности…» Журнал образовательных и психологических измерений. 1995. Компоненты http://epm.sagepub.com/content/55/2/309.abstract.
  93. ^ Аб Смит, Эмбер. «Оценки SAT по математике отражают и поддерживают расовое неравенство». Брукингский институт .
  94. ^ «Почему нам следует отказаться от стандартизированного тестирования» . Ежедневный Кардинал . Проверено 27 сентября 2021 г.
  95. ^ «Повторная сдача теста». www.manhattanreview.com . Проверено 4 октября 2021 г.
  96. ^ Гейзер, Сол (октябрь 2015 г.). Растущая корреляция между расой и результатами SAT (PDF) (Отчет). Серия исследований и периодических статей: CSHE.10.15. Центр исследований в области высшего образования Калифорнийского университета в Беркли.
  97. ^ «Стандартизированные тесты и проблемы с обучаемостью - ограничения и проблемы тестов» . www.neurohealthah.com . 19.11.2020 . Проверено 4 октября 2021 г.

95.) Тестируемые 1

96.) Тестируемые 2

дальнейшее чтение

Внешние ссылки