stringtranslate.com

Стандартизированный тест

Молодые люди в Польше сдают экзамены на аттестат зрелости . Экзамены на аттестат зрелости стандартизированы, поэтому университеты могут легко сравнивать результаты студентов по всей стране.

Стандартизированный тест — это тест , который проводится и оценивается последовательным или «стандартным» способом. Стандартизированные тесты разработаны таким образом, чтобы вопросы и интерпретации были единообразными, а их назначение и оценка проводились в заранее установленном стандартном порядке. [1]

Любой тест, в котором один и тот же тест дается всем участникам одинаково и оценивается одинаково для всех, является стандартизированным тестом. Стандартизированные тесты не обязательно должны быть тестами с высокими ставками , ограниченными по времени тестами, тестами с несколькими вариантами ответов , академическими тестами или тестами, предназначенными для большого числа тестируемых. Стандартизированным тестом может быть любой тип теста: письменный тест, устный тест или тест на практические навыки . Вопросы могут быть простыми или сложными. Предметом учащихся школьного возраста часто являются академические навыки, но стандартизированный тест можно сдать практически по любой теме, включая экзамены по вождению , творческие способности , атлетизм , личность , профессиональную этику или другие характеристики.

Противоположностью стандартизированного тестирования является нестандартизированное тестирование , при котором либо разные тесты даются разным тестируемым, либо один и тот же тест назначается в существенно разных условиях (например, одной группе дается гораздо меньше времени для завершения теста, чем другой группе). следующая группа) или оцениваются по-разному (например, один и тот же ответ засчитывается как правильный для одного учащегося, но неправильный для другого).

Большинство ежедневных тестов и тестов, сдаваемых учащимися в школе, соответствуют определению стандартизированного теста: все в классе сдают один и тот же тест, в одно и то же время, при одинаковых обстоятельствах, и все учащиеся получают одинаковые оценки от своих учителей. способ. Однако термин «стандартизированный тест» чаще всего используется для обозначения тестов, которые проводятся для более крупных групп, например, тест, который сдают все взрослые, желающие получить лицензию на выполнение определенного вида работы, или все студенты определенного вида работы. возраст. Большинство стандартизированных тестов представляют собой формы суммативного оценивания (оценки, которые измеряют уровень обучения участников в конце учебного модуля).

Поскольку все получают одинаковый тест и одну и ту же систему оценок, стандартизированные тесты часто считаются более справедливыми, чем нестандартизированные. Такие тесты часто считаются более справедливыми и объективными, чем система, в которой одни учащиеся получают более простой тест, а другие — более сложный. Стандартизированные тесты созданы для того, чтобы обеспечить надежное сравнение результатов всех участников тестирования, поскольку все сдают один и тот же тест. [2] Однако некоторые люди критикуют как тестирование в целом, так и стандартизированное тестирование в частности. Например, некоторые люди считают, что несправедливо задавать всем учащимся одни и те же вопросы, если в школах некоторых учащихся не действуют одинаковые стандарты обучения .

Определение

Двое мужчин выполняют искусственное дыхание кукле для сердечно-лёгочной реанимации
Двое мужчин проходят аутентичный , неписьменный , стандартизированный тест, основанный на критериях . Если они проведут сердечно-легочную реанимацию на манекене с правильной скоростью и давлением, они пройдут этот экзамен.

Определение стандартизированного теста со временем несколько изменилось. [3] В 1960 году стандартизированные тесты определялись как тесты, в которых условия и содержание были равными для всех, сдающих тест, независимо от того, когда, где и кем тест проводился или оценивался. Стандартизированные тесты имеют последовательный и единый метод оценки. [4] Это означает, что все учащиеся, ответившие на тестовый вопрос одинаково, получат одинаковый балл за этот вопрос. Цель этой стандартизации — убедиться, что баллы достоверно отражают измеряемые способности или навыки, а не другие вещи, такие как различные инструкции о том, что делать, если испытуемый не знает ответа на вопрос. [3]

К началу XXI века акцент сместился от строгого сходства условий к равной справедливости условий тестирования. [3] Например, тестируемый со сломанным запястьем мог бы писать медленнее из-за травмы, и это было бы более справедливо и обеспечило бы более достоверное понимание фактических знаний тестируемого, если бы этому человеку дали еще несколько минут, чтобы записать ответы на ограниченный по времени тест. Изменение условий тестирования таким образом, чтобы повысить справедливость в отношении постоянной или временной нетрудоспособности, но не подрывает основную суть оценки, называется приспособлением . Однако если бы целью теста было выяснить, насколько быстро студент может писать, то предоставление тестируемому дополнительного времени стало бы модификацией содержания , а не стандартизированным тестом.

История

Китай

Самые ранние свидетельства стандартизированного тестирования были в Китае , во времена династии Хань , [5] где императорские экзамены охватывали шесть искусств , включая музыку, стрельбу из лука, верховую езду, арифметику, письмо и знание ритуалов и церемоний как государственных, так и частных. части. Эти экзамены использовались для отбора сотрудников государственной бюрократии.

Позже к тестированию были добавлены разделы по военной стратегии, гражданскому праву, доходам и налогообложению, сельскому хозяйству и географии. В таком виде экзамены были институционализированы более тысячелетия.

Сегодня стандартизированное тестирование по-прежнему широко используется, особенно в системе Гаокао .

Великобритания

Стандартизированное тестирование было введено в Европу в начале 19-го века по образцу китайских экзаменов на мандарин [6] благодаря поддержке британских колониальных администраторов, наиболее «настойчивым» из которых был британский консул в Гуанчжоу, Китай , Томас Тейлор Медоуз . [6] Медоуз предупредил о крахе Британской империи, если стандартизированное тестирование не будет немедленно внедрено по всей империи. [6]

До их принятия стандартизированное тестирование традиционно не было частью западной педагогики. Основываясь на скептической и открытой традиции дебатов, унаследованной от Древней Греции, западные академические круги отдавали предпочтение нестандартизированным оценкам с использованием эссе , написанных студентами. Именно по этой причине первое европейское внедрение стандартизированного тестирования произошло не в самой Европе, а в Британской Индии . [7] Вдохновленные использованием Китаем стандартизированного тестирования, в начале 19-го века британские «менеджеры компаний нанимали и продвигали по службе сотрудников на основе конкурсных экзаменов, чтобы предотвратить коррупцию и фаворитизм». [7] Эта практика стандартизированного тестирования была позже принята в конце 19 века на материковой части Великобритании. В последовавших за этим парламентских дебатах было много упоминаний о «китайской мандариновой системе». [6]

Именно из Британии стандартизированное тестирование распространилось не только по всему Британскому Содружеству , но и в Европе, а затем и в Америке. [6] Его распространение было вызвано промышленной революцией . Увеличение числа школьников во время и после промышленной революции в результате принятия законов об обязательном образовании привело к уменьшению использования открытого оценивания, которое было сложнее массово производить и оценивать объективно из-за его по своей сути субъективного характера.

Мужчина сортирует мелкие предметы в деревянный поднос
Британские солдаты сдавали стандартизированные тесты во время Второй мировой войны. Этот новичок сортирует механические детали, чтобы проверить свое понимание механизмов. На его униформе нет имени, звания или других знаков, которые могли бы повлиять на оценку его работы.

Стандартизированные тесты, такие как отборочные комиссии военного ведомства, были разработаны для британской армии во время Второй мировой войны для отбора кандидатов для подготовки офицеров и выполнения других задач. [8] В тестах оценивались умственные способности солдат, механические навыки, способность работать с другими и другие качества. Предыдущие методы страдали предвзятостью и приводили к выбору не тех солдат для подготовки офицеров. [8]

Соединенные Штаты

Стандартизированное тестирование является частью образования в США с 19-го века, но широкое распространение стандартизированного тестирования в школах США во многом является явлением 20-го века.

Иммиграция в середине 19 века способствовала росту стандартизированных тестов в США. [9] Стандартизированные тесты использовались, когда люди впервые приехали в США, чтобы проверить социальные роли и определить социальную власть и статус. [10]

В 1901 году Комиссия по вступительным экзаменам в колледж начала предлагать стандартизированные тесты для поступления в университеты и колледжи , охватывающие девять предметов. Этот тест был реализован с целью создания стандартизированного приема в элитные университеты северо-востока США. Изначально тест предназначался также для лучших школ-интернатов , чтобы согласовать учебную программу между школами. [11] Первоначально стандартизированный тест состоял из эссе и не предназначался для широкого тестирования. [ нужна цитата ]

Во время Первой мировой войны были разработаны армейские альфа- и бета -тесты, чтобы помочь новобранцам получить соответствующие задания в зависимости от их оцененного уровня интеллекта. [12] Первое издание современного стандартизированного теста на IQ , тест интеллекта Стэнфорда-Бине , появилось в 1916 году. Затем Совет колледжа разработал SAT (тест способностей ученого) в 1926 году. Первый тест SAT был основан на армейском тесте IQ. тесты с целью определить интеллект тестируемого, навыки решения проблем и критическое мышление . [13] В 1959 году Эверетт Линдквист впервые предложил ACT (Американское тестирование колледжей). [14] По состоянию на 2020 год ACT включает четыре основных раздела с вопросами с несколькими вариантами ответов для проверки английского языка, математики, чтения и естественных наук, а также дополнительный раздел письма. [15]

В отдельных штатах в 1970-х годах началось тестирование большого количества детей и подростков через системы государственных школ. К 1980-м годам американские школы оценивали результаты на национальном уровне. [16] В 2012 году 45 штатов заплатили в среднем 27 долларов США за каждого студента и 669 миллионов долларов США в целом за крупномасштабные ежегодные академические тесты. [17] Однако косвенные затраты , такие как оплата учителям подготовки учащихся к тестам и время, потраченное на проведение тестов, значительно превышают прямые затраты на сам тест. [17]

Необходимость федерального правительства проводить значимые сравнения в высоко децентрализованной (контролируемой на местном уровне) системе государственного образования способствовала использованию крупномасштабного стандартизированного тестирования. Закон о начальном и среднем образовании 1965 года требовал стандартизированного тестирования в государственных школах. Закон 2001 года «Ни один ребенок не останется без внимания» дополнительно привязал некоторые виды финансирования государственных школ к результатам стандартизированного тестирования. В соответствии с этими федеральными законами школьная программа по-прежнему устанавливалась каждым штатом, но федеральное правительство требовало от штатов оценивать, насколько хорошо школы и учителя преподают выбранный штатом материал с помощью стандартизированных тестов. [18] Результаты учащихся по крупномасштабным стандартизированным тестам использовались для выделения средств и других ресурсов школам, а также для закрытия школ с плохой успеваемостью. Закон «Каждый студент добивается успеха» заменил NCLB в конце 2015 года. [19] К этому моменту эти крупномасштабные стандартизированные тесты стали спорными в Соединенных Штатах, и не обязательно потому, что все студенты сдавали одни и те же тесты и получали одинаковые баллы. образом, а потому, что они стали серьезным испытанием для школьной системы и учителей. [20]

В последние годы многие университеты и колледжи США отказались от требования о проведении стандартизированных тестов абитуриентами. [21]

Австралия

Стандартизированное тестирование Австралийской национальной программы оценки грамотности и счета (NAPLAN) было начато в 2008 году Австралийским органом по учебной программе, оценке и отчетности, независимым органом, «ответственным за разработку национальной учебной программы, национальной программы оценки и национального сбора данных». и программа отчетности, которая поддерживает обучение 21 века для всех австралийских студентов». [22]

В тестировании участвуют все учащиеся 3, 5, 7 и 9 классов австралийских школ, которые будут оцениваться с использованием национальных тестов. В число предметов, охватываемых этим тестированием, входят чтение, письмо, правила языка (орфография, грамматика и пунктуация) и счет.

Программа представляет отчеты об уровне учащихся, предназначенные для того, чтобы родители могли видеть прогресс своего ребенка в течение школьной жизни и помочь учителям улучшить индивидуальные возможности обучения для своих учеников. Данные об учащихся и уровне школы также предоставляются соответствующей школьной системе при том понимании, что их можно использовать для направления конкретной поддержки и ресурсов школам, которые в них больше всего нуждаются. Учителя и школы используют эту информацию в сочетании с другой информацией, чтобы определить, насколько хорошо учатся их ученики, и выявить любые области, требующие помощи.

Концепция тестирования успеваемости учащихся не нова, хотя можно сказать, что нынешний австралийский подход берет свое начало в нынешних структурах образовательной политики как в США, так и в Великобритании. Существует несколько ключевых отличий между австралийской NAPLAN и стратегиями Великобритании и США. Школам, которые оказались неэффективными в австралийских условиях, будет предложена финансовая помощь в соответствии с текущей политикой федерального правительства.

Колумбия

В 1968 году был создан Колумбийский институт оценки образования (ICFES), призванный регулировать высшее образование. Была внедрена прежняя система общественной оценки для разрешения деятельности и юридического признания учреждений и университетских программ.

В Колумбии существует несколько стандартизированных тестов, оценивающих уровень образования в стране. Эти экзамены проводятся ICFES.

Учащиеся третьего, пятого и девятого классов сдают экзамен «Сабля 3°5°9°». Этот тест в настоящее время представлен на компьютере в контролируемых и переписных выборках.

По окончании школы старшеклассникам вручается «Сабля 11», позволяющая им поступать в разные вузы страны. Студенты, обучающиеся дома, могут сдать этот экзамен, чтобы окончить среднюю школу и получить аттестат и диплом.

Студенты, покидающие университет, должны сдать экзамен «Sabre Pro».

Канада

Канада оставляет образование и, как следствие, стандартизированное тестирование под юрисдикцией провинций. В каждой провинции действует свой собственный стандартизированный режим тестирования, охватывающий всю провинцию: от отсутствия обязательных стандартизированных тестов для учащихся в Саскачеване до экзаменов, составляющих 40% итоговых оценок средней школы в Ньюфаундленде и Лабрадоре. [23]

Дизайн и озвучивание

Дизайн

Чаще всего основной академический тест включает разделы, оцениваемые как человеком, так и компьютером.

Стандартизированный тест может состоять из вопросов с несколькими вариантами ответов, вопросов «верно-неверно», вопросов-эссе, аутентичных оценок или практически любой другой формы оценки. Задания с несколькими вариантами ответов и заданиями «верно-неверно» часто выбираются для тестов, которые сдают тысячи людей, поскольку их можно сдавать и оценивать недорого, быстро и надежно с помощью специальных листов ответов, которые можно прочитать с помощью компьютера или с помощью адаптивных к компьютеру средств. тестирование . Некоторые стандартизированные тесты включают компоненты краткого ответа или написания эссе, которым независимые оценщики присваивают баллы, которые используют рубрики (правила или рекомендации) и контрольные документы (примеры работ для каждого возможного балла) для определения оценки, которая будет присвоена ответу.

Любая тематика

Плакат на стене с указанием требуемого поведения и баллов, которые будут вычитаться за ошибки на английском и китайском языках.
Плакат, показывающий стандарты сдачи экзаменов по вождению на Тайване. Каждый человек, желающий получить водительские права, сдает один и тот же тест и получает одинаковые баллы.

Не все стандартизированные тесты предполагают ответы на вопросы. Настоящая оценка спортивных навыков может принимать форму бега в течение определенного времени или ведения мяча на определенную дистанцию. Медицинские работники должны пройти тесты, доказывающие, что они могут выполнять медицинские процедуры. Кандидаты на получение водительских прав должны пройти стандартный тест, показывающий, что они умеют водить автомобиль. Канадский стандартизированный тест физической подготовки использовался в медицинских исследованиях, чтобы определить, насколько физически подготовлены участники теста. [24] [25]

Машинный и человеческий подсчет

В некоторых стандартизированных тестах используются тесты с несколькими вариантами ответов, оценка которых относительно недорога, но можно использовать любую форму оценивания.

Со второй половины 20-го века крупномасштабное стандартизированное тестирование отчасти формировалось благодаря простоте и дешевизне оценки тестов с несколькими вариантами ответов с помощью компьютера. Большинство национальных и международных оценок не в полной мере оцениваются людьми.

Люди привыкли оценивать предметы, которые сложно оценить с помощью компьютера (например, эссе). Например, выпускной экзамен представляет собой адаптивную к компьютеру оценку, которая не требует от людей выставления оценок, за исключением письменной части. [26]

Оценка, выполняемая человеком, является относительно дорогостоящей и часто варьируемой, поэтому, когда это возможно, предпочтительнее использовать компьютерную оценку. Например, некоторые критики говорят, что низкооплачиваемые сотрудники будут иметь плохие результаты на тестах. [27] Согласие между оценками может варьироваться от 60 до 85 процентов, в зависимости от теста и сеанса подсчета баллов. При проведении крупномасштабных тестов в школах некоторые тестировщики платят за то, чтобы каждый тест прочитали два или более экспертов; если их оценки не совпадают, то работа передается дополнительным оценщикам. [27]

Хотя этот процесс сложнее, чем электронная оценка тестов с несколькими вариантами ответов, эссе также можно оценивать с помощью компьютера. В других случаях эссе и другие открытые ответы оцениваются в соответствии с заранее установленными критериями оценки обученными оценщиками. Например, в Pearson все оценщики эссе имеют четырехлетнюю университетскую степень, и большинство из них являются нынешними или бывшими классными руководителями. [28]

Использование рубрик для справедливости

Использование критериев призвано повысить справедливость при оценке успеваемости учащегося. При стандартизированном тестировании ошибку измерения (постоянную картину ошибок и систематических ошибок при оценке теста) легко определить. Когда оценка зависит от индивидуальных предпочтений оценщиков, оценки учащихся зависят от того, кто оценивает тест.

Стандартизированные тесты также устраняют предвзятость оценщиков при оценке. Исследования показывают, что учителя создают своего рода самоисполняющееся пророчество в своей оценке учеников, давая тем, кто, по их ожиданиям, достигнет более высоких результатов, и давая тем, кто, по их ожиданиям, провалится, более низкие оценки. [29] При нестандартизированном оценивании оценщики обладают большей индивидуальной свободой действий и, следовательно, с большей вероятностью будут давать несправедливые результаты из-за неосознанной предвзятости .

Использование оценок для сравнения

Существует два типа интерпретации результатов тестов : интерпретация результатов , основанная на нормах, и интерпретация результатов , основанная на критериях . [4]

Любую из этих систем можно использовать при стандартизированном тестировании. Что важно для стандартизированного тестирования, так это то, всем ли учащимся задаются одинаковые вопросы, при достаточно равных обстоятельствах, и получают ли они оценки в соответствии с одними и теми же стандартами.

общая нормальная кривая с отмеченными стандартными отклонениями
Тест, основанный на нормах, может быть разработан так, чтобы определить, где тестируемый находится на нормальной кривой .

Нормативная оценка сравнивает каждого тестируемого с другими тестируемыми. Нормативно-ориентированный тест ( НЗТ ) — это тип теста, оценки или оценки , который позволяет оценить положение тестируемого человека в заранее определенной популяции. Оценка получена на основе анализа результатов тестов и других соответствующих данных выборки населения . Этот тип теста определяет, показал ли тестируемый результаты лучше или хуже, чем другие учащиеся, сдающие этот тест.

Сравнение с другими делает стандартизированные тесты, соответствующие нормам, полезными для целей поступления в высшие учебные заведения, когда школа пытается сравнить студентов со всей страны или со всего мира. Стандартизация гарантирует, что все учащиеся проходят одинаковое тестирование, а ссылки на нормы определяют, кто из них лучше, а кто хуже. Примеры таких международных эталонных тестов включают «Тенденции в международных исследованиях в области математики и естественных наук» ( TIMMS ) и «Прогресс в международном исследовании читательской грамотности» ( PIRLS ).

Техник держит карточку с цветовой кодировкой и стандартами тестирования воды.
При тестировании воды используется тестирование, основанное на критериях, поскольку важнее определить, безопасна ли местная вода для питья, чем сравнивать ее с водой из другого места.

Тест на основе критериев (CRT) — это стиль теста, в котором результаты тестов используются для того, чтобы показать, насколько хорошо испытуемые справились с заданной задачей, а не насколько хорошо они справились с заданием по сравнению с другими участниками теста. Большинство тестов и викторин, написанных школьными учителями, представляют собой тесты, основанные на критериях. В этом случае цель состоит в том, чтобы просто увидеть, сможет ли студент правильно ответить на вопросы. Учитель обычно не пытается сравнить результаты каждого ученика с результатами других учеников.

Стандарты

Соображения валидности и надежности обычно рассматриваются как важные элементы для определения качества любого стандартизированного теста. Однако ассоциации профессионалов и практиков часто помещают эти проблемы в более широкий контекст при разработке стандартов и вынесении общих суждений о качестве любого стандартизированного теста в целом в данном контексте.

Стандарты оценки

В области оценки , и в частности оценки образования , Объединенный комитет по стандартам оценки образования [31] опубликовал три набора стандартов оценки. «Стандарты оценки персонала» [32] были опубликованы в 1988 году, «Стандарты оценки программ» (2-е издание) [33] были опубликованы в 1994 году, а «Стандарты оценки студентов» [34] были опубликованы в 2003 году.

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат рекомендации по разработке, внедрению, оценке и совершенствованию определенной формы оценки. Каждый из стандартов отнесен к одной из четырех основных категорий, чтобы обеспечить правильность, полезность, осуществимость и точность образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в рамках темы точности. Однако тесты направлены на то, чтобы оценки учащихся давали надежную, точную и достоверную информацию об обучении и успеваемости учащихся; стандартизированные тесты дают ограниченную информацию о многих формах интеллекта, и использование их вредит учащимся, поскольку неточно измеряет потенциал учащегося на успех. [35]

Стандарты тестирования

Молодые люди в голубой форме сидят за столами с контрольными бумагами и карандашами.
Зачисленные военнослужащие сдают бумажный стандартизированный тест с несколькими вариантами ответов в надежде получить повышение по службе. Все они отвечают на одни и те же вопросы и получают одинаковые оценки.

В области психометрии Стандарты образовательного и психологического тестирования [36] устанавливают стандарты достоверности и надежности, а также ошибки измерения и вопросы, связанные с размещением людей с ограниченными возможностями . Третья и последняя основная тема охватывает стандарты, связанные с тестированием приложений, аттестацией , а также тестированием при оценке программ и государственной политике .

Статистическая достоверность

Одним из основных преимуществ крупномасштабного стандартизированного тестирования является то, что результаты можно документировать эмпирически; следовательно, можно показать, что результаты тестов имеют относительную степень достоверности и надежности , а также являются результатами, которые можно обобщить и воспроизвести. [37] Это часто контрастируют с оценками в школьных ведомостях, которые выставляются отдельными учителями. При рассмотрении индивидуально выставленных оценок может быть сложно учесть различия в образовательной культуре в разных школах, сложность заданий конкретного учителя, различия в стиле преподавания, давление на завышение оценок , а также другие методы и предубеждения, влияющие на выставление оценок.

Еще одним преимуществом является агрегирование. Хорошо разработанный стандартизированный тест обеспечивает оценку владения человеком областью знаний или навыков, которая на определенном уровне агрегирования предоставит полезную информацию. То есть, хотя индивидуальные оценки могут быть недостаточно точными для практических целей, средние баллы классов, школ, филиалов компании или других групп вполне могут предоставить полезную информацию из-за уменьшения ошибки, достигаемой за счет увеличения размера выборки.

Ежегодные стандартизированные тесты в школе

Стандартизированное тестирование является очень распространенным способом определения прошлых академических достижений учащегося и его будущего потенциала.

Валидность, качество или использование тестов, особенно ежегодных стандартизированных тестов, распространенных в образовании, по-прежнему широко поддерживаются или критикуются. Как и сами тесты, поддержка и критика тестов часто различаются и могут исходить из разных источников, таких как родители, тестируемые, преподаватели, бизнес-группы, университеты или государственные контролирующие органы.

Сторонники широкомасштабных стандартизированных тестов в образовании часто приводят следующие причины для продвижения тестирования в образовании:

Критики стандартизированных тестов в образовании часто приводят следующие причины для пересмотра или удаления стандартизированных тестов в образовании:

автомобиль из автошколы
Если учитель знает, что конкретный предмет, например, параллельная парковка , не тестируется, он может не тратить время на обучение этому предмету. Это верно независимо от того, стандартизирован тест или нет.

Кроме того, успехи учащихся отслеживаются по относительной успеваемости учителя, в результате чего продвижение учителя зависит от успехов учителя в успеваемости ученика. Этические и экономические вопросы возникают у учителей, когда они сталкиваются с явно отстающими или недостаточно квалифицированными учениками и стандартизированным тестом.

В своей книге « Теперь вы это видите » Кэти Дэвидсон критикует стандартизированные тесты. Она описывает молодежь как «детей сборочного конвейера на модели конвейера», имея в виду использование стандартизированного теста как часть единой образовательной модели. Она также критикует узость проверяемых навыков и называет детей, не имеющих этих навыков, неудачниками или учениками с ограниченными возможностями. [54] Широко распространенное и организованное мошенничество стало растущей культурой. [55]

Есть три показателя, по которым оцениваются страны с лучшими показателями в TIMMS («страны А+»): целенаправленность, последовательность и строгость. Фокус определяется как количество тем, рассматриваемых в каждом классе; Идея состоит в том, что чем меньше тем рассматривается в каждом классе, тем больше внимания можно уделить каждой теме. Определение связности соответствует последовательности рассматриваемых тем, которая следует естественному развитию или логической структуре математики. CCSSM сравнивался как с действующими государственными стандартами, так и со стандартами страны A+ . При том, что в среднем освещается большинство тем, действующие государственные стандарты имеют наименьшую направленность. [56] Целью Common Core Standards является устранение этого несоответствия, помогая преподавателям сосредоточиться на том, что учащимся необходимо выучить, а не отвлекаться на посторонние темы. Они побуждают образовательные материалы переходить от поверхностного освещения широкого спектра тем к более глубокому освещению нескольких тем. [57]

Время и деньги

Стандартизированные тесты — это способ измерения уровня образования учащихся и школ в широком масштабе. От детского сада до 12-го класса большинство американских учащихся ежегодно сдают стандартизированные тесты. Средний учащийся сдает около 10 таких тестов в год (например, один или два теста на понимание прочитанного, один или два теста по математике, тест по письму, тест по естественным наукам и т. д.). [58] Средний объем тестирования занимает около 2,3% от общего учебного времени (что соответствует примерно четырем учебным дням в году). [59]

Стандартизированные тесты дороги в проведении. Сообщается, что Соединенные Штаты ежегодно тратят на эти испытания около 1,7 миллиарда долларов США. [60] В 2001 году также сообщалось, что только три компании (Harcourt Educational Measurement, CTB McGraw-Hill и Riverside Publishing) разрабатывают 96% тестов, проводимых на уровне штата. [61]

Образовательные решения

Национальная академия наук рекомендует, чтобы основные образовательные решения не основывались исключительно на одном результате теста. [62] Использование минимальных проходных баллов для поступления или окончания обучения не предполагает единого стандарта, поскольку результаты тестов почти всегда сочетаются с другими минимальными критериями, такими как количество кредитов, обязательные курсы, посещаемость и т. д. Результаты тестов часто воспринимаются в качестве «единственных критериев» просто потому, что они наиболее трудны, или автоматически предполагается выполнение других критериев. Единственным исключением из этого правила является GED , который позволил многим людям признать свои навыки, даже если они не соответствовали традиционным критериям. [ нужна цитата ]

Некоторые учителя утверждают, что один стандартизированный тест измеряет только текущие знания учащегося и не отражает прогресс учащегося с начала года. [63] Результат, созданный людьми, которые не участвуют в обычном обучении учащихся, а профессионалами, которые определяют, что учащиеся должны знать в разном возрасте. Кроме того, учителя сходятся во мнении, что лучшим создателем и координатором тестов являются они сами. Они утверждают, что лучше всех осведомлены о способностях, способностях и потребностях учащихся, что позволило бы им уделять больше времени изучению предметов или продолжить обучение по обычной учебной программе.

Влияние на учащихся из неблагополучных семей

Монти Нил, директор Национального центра справедливого и открытого тестирования, утверждает, что студентам, которые говорят на английском как на втором языке, имеют инвалидность или происходят из семей с низким доходом, непропорционально часто отказывают в дипломе из-за результатов теста. что несправедливо и вредно. Например, в конце 1970-х годов, когда в Соединенных Штатах начались выпускные испытания, в иске утверждалось, что многие чернокожие студенты не имели справедливых возможностей по материалу, который они тестировали на выпускном тесте, поскольку они посещали школы, разделенные по закону. «Взаимодействие школ с ограниченными ресурсами и тестированием сильнее всего бьет по цветным учащимся», как утверждает Нил, «им непропорционально часто отказывают в дипломах или повышении в классе, а школы, которые они посещают, скорее всего, будут плохо сдавать тесты и столкнутся с трудностями. санкции, такие как реструктуризация». [64]

В журнале The Progressive Барбара Майнер объясняет недостатки стандартизированного тестирования, анализируя три разные книги. Содиректор Центра образования Университета Райса и профессор педагогики Линда М. Макнил в своей книге « Противоречия школьной реформы: образовательные затраты на стандартизированное тестирование» пишет: «Образовательная стандартизация вредит преподаванию и обучению и в долгосрочной перспективе , отдых подтверждает образование по расе и классу». Макнил считает, что реформа образования, основанная на тестировании, устанавливает более высокие стандарты для цветных учащихся. По словам Майнера, МакНил «показывает, как реформа, основанная на тестировании, централизует власть в руках корпоративной и политической элиты - особенно пугающее событие в это время растущего корпоративного и консервативного влияния на реформу образования». Такая реформа, основанная на тестировании, затруднила обучение, особенно для цветных учащихся. [65]

FairTest заявляет, что негативные последствия неправильного использования тестов включают в себя вытеснение учащихся из школы, вытеснение учителей из профессии, а также подрыв вовлеченности учащихся и школьного климата. [66]

Использование стандартизированных тестов при поступлении в университеты

Стандартизированные тесты рассматриваются университетами как часть заявления вместе с другими подтверждающими доказательствами, такими как личные заявления , оценки в средней школе , предыдущие курсовые работы и рекомендательные письма . [67] В разных странах проводятся разные тесты, например , SAT в США, Gaokao в Китае и совместный вступительный экзамен в Индии.

Натан Кансел, ученый в области высшего образования, говорит, что вступительные экзамены в колледж и другие стандартизированные тесты «помогают перегруженным сотрудникам приемной комиссии разделить огромное количество абитуриентов на группы для дальнейшей оценки. Высокие баллы не гарантируют поступления куда-либо, а низкие баллы не являются определяющими. это, но школы серьезно относятся к тестам». [68]

Исследования показывают, что тесты предсказывают не только оценки первого года обучения и уровень курсов, которые студент, скорее всего, пройдёт. Лонгитюдное исследование, проведенное учеными, показывает, что студенты с высокими результатами тестов с большей вероятностью выберут сложный путь поступления в колледж. [69] Тесты также могут показать результаты студентов после окончания колледжа, включая оценки преподавателей, научные достижения, получение ученой степени, результаты на комплексных экзаменах и профессиональную лицензию. [70]

Поскольку оценки различаются в разных школах и даже для двух учащихся в одной школе, общий показатель, обеспечиваемый результатами теста, более полезен для сравнения учащихся.

Однако в «метаанализе», опубликованном в апреле 1995 года в « Журнале образовательных и психологических измерений» , Тодд Моррисон и Мелани Моррисон изучили две дюжины исследований валидности теста, необходимого для поступления практически в любую программу магистратуры или докторантуры в Америке: «Выпускник» Запись экзаменов (GRE). В этом исследовании за последние 30 лет приняли участие более 5000 тестируемых. Авторы обнаружили, что результаты GRE составляют лишь 6 процентов разницы в оценках в аспирантуре. GRE кажется «практически бесполезным с точки зрения прогнозирования», пишут авторы. Повторные исследования вступительного теста на юридический факультет (LSAT) показали то же самое.

Ведутся споры о том, укажет ли тест на долгосрочный успех в работе и жизни, поскольку существует множество других факторов, но фундаментальные навыки, такие как чтение, письмо и математика, связаны с производительностью труда.

Лонгитюдное исследование 2007 года показало, что важные жизненные достижения, такие как публикация романа или патентование технологии, также связаны с результатами тестов, даже если принять во внимание возможности получения образования. Существует даже значительное количество доказательств того, что эти навыки связаны с эффективным лидерством и творческими достижениями на работе. Умение читать тексты и понимать их смысл, а также иметь сильные количественные рассуждения имеют решающее значение в современной информационной экономике . [70]

Многие аргументы свидетельствуют о том, что навыки, полученные в результате тестов, полезны, но только до определенного момента.

Тем не менее, в замечательном продольном исследовании, опубликованном в 2008 году в журнале Psychoological Science, были изучены студенты, которые в возрасте 13 лет входили в 1% лучших. Двадцать лет спустя они в среднем добились очень высоких результатов, имели высокие доходы, крупные награды и карьерные достижения, которыми мог бы гордиться любой родитель. [71]

Существует корреляция между результатами тестов и социальным классом, но успех на стандартизированных тестах и ​​в колледже зависит не только от класса. Исследования показывают, что «тесты были действительны даже с учетом социально-экономического класса. Независимо от их семейного происхождения, учащиеся с хорошими результатами тестов и школьными оценками лучше учатся в колледже, чем учащиеся с более низкими баллами и более слабыми успеваемостью». [72]

Еще одна критика, касающаяся социального класса и стандартизированного тестирования, заключается в том, что только богатые люди получают подготовку к экзаменам и обучение. Тем не менее, «исследователи провели сочетание экспериментальных исследований и контролируемых полевых исследований, чтобы проверить этот вопрос. некоторые компании по подготовке к испытаниям». [73]

Что еще более важно, многие люди придерживаются мнения, что тесты предотвращают разнообразие при поступлении, поскольку меньшинства имеют более низкие баллы на тестах по сравнению с другими представленными группами. [74] Исследование 2012 года изучило школы, в которых вступительные тесты не являются обязательными для абитуриентов, и сравнило их со школами, в которых такие тесты используются, и результат показывает, что «недавнее исследование показывает, что школы, в которых вступительные испытания не являются обязательными для абитуриентов, набирают все более разнообразные группы учащихся. то же самое относится и к школам, требующим тестирования». [75]

Противники утверждают, что стандартизированные тесты используются неправильно и являются некритическими суждениями об интеллекте и производительности, но сторонники утверждают, что это не отрицательные стороны стандартизированных тестов, а критика плохо разработанных режимов тестирования. Они утверждают, что тестирование должно и действительно фокусирует образовательные ресурсы на наиболее важных аспектах образования – передаче заранее определенного набора знаний и навыков – и что другие аспекты либо менее важны, либо должны быть добавлены в схему тестирования.

Факты показывают, что чернокожие и латиноамериканские студенты в среднем получают более низкие баллы, чем белые и азиаты. Таким образом, стандартные тесты по математике и чтению, такие как SAT, подвергаются растущим нападкам со стороны прогрессистов. Однако в исчерпывающем отчете сената факультетов Калифорнийского университета, подготовленном по заказу Джанет Наполитано и опубликованном в 2020 году, тесты не являются дискриминационными и играют важную роль в защите качества образования. [76]

В докладе говорится, что ухудшение инфляции оценок , особенно в богатых средних школах, делает стандартную оценку особенно важной. [76]

Что касается намерения школ Калифорнийского университета отказаться от стандартных тестов, таких как SAT и ACT, при поступлении в колледж, то субъективные и индивидуальные тесты, такие как эссе и внеклассные занятия, могут быть легко адаптированы и наносить ущерб учащимся, которые не знакомы с этим процессом. Прием без тестирования может быть еще более склонен в пользу людей с хорошими связями. [77]

В январе 2020 года сенат факультета Калифорнийского университета рекомендовал системе Калифорнийского университета сохранить стандартизированные тесты в качестве требований к поступающим. [76] В докладе говорится, что стандартизированные тесты по математике и чтению полезны для прогнозирования успеваемости в колледже. Основываясь на данных учащихся системы Калифорнийского университета, в отчете делается вывод, что «результаты тестов в настоящее время являются лучшим предиктором среднего балла первого года обучения, чем средний балл средней школы». [76] В докладе продолжается: баллы также позволяют спрогнозировать общий средний балл колледжа и вероятность того, что студент окончит его. В то время как «прогностическая сила результатов тестов возросла», добавляется в докладе, «прогностическая сила оценок в средней школе снизилась». [76]

Результаты тестов позволяют школам Калифорнийского университета «отбирать тех учащихся из недостаточно представленных групп , которые с большей вероятностью получат более высокие оценки и закончат обучение вовремя». [76] «Первоначальной целью SAT было выявить студентов, пришедших из не относительно привилегированных кругов, которые могли бы иметь потенциал для достижения успеха в университете», — говорится в отчете. [76] Создатель SAT, Служба образовательного тестирования (ETS), теперь утверждает, что SAT — это не тест на «способности», а скорее оценка «развитых способностей». [78]

Проблемы тестирования, не относящиеся к стандартизации

Большинство тестов можно разделить на несколько категорий. Например, тест может быть как стандартизированным, так и тестом с высокими ставками, или стандартизированным и одновременно тестом с несколькими вариантами ответов. Жалобы на «стандартизированные тесты» (все тестируемые сдают один и тот же тест в достаточно схожих условиях и получают одинаковые оценки) часто сосредоточены на проблемах, не связанных со стандартизацией, и в равной степени применимы к нестандартизированным тестам. Например, критик может жаловаться, что «все стандартизированные тесты являются ограниченными по времени тестами», но критика сосредоточена на ограничении по времени, а не на том, что все проходят один и тот же тест и получают одинаковые оценки за ответы.

Тесты с высокими ставками

Тест с высокими ставками — это тест с желаемой наградой за хорошую работу. [4] Некоторые стандартизированные тесты, в том числе многие тесты, используемые при поступлении в университеты по всему миру, представляют собой тесты с высокими ставками. Большинство стандартизированных тестов, таких как обычные тесты в классе, представляют собой тесты с низкими ставками. [4]

Сильная зависимость от важных стандартизированных тестов при принятии решений часто вызывает споры. Общая проблема, связанная с тестами с высокими ставками, заключается в том, что они измеряют производительность в течение одного события, тогда как критики считают, что более целостная оценка была бы уместна. Критики часто предлагают делать акцент на кумулятивных или даже нечисловых показателях, таких как оценки в классе или краткие индивидуальные оценки (написанные в прозе) учителей. Сторонники утверждают, что результаты тестов представляют собой четкий и объективный стандарт, который служит ценным средством проверки завышения оценок . [79]

Нормативные тесты

женщина пересекает финишную черту
Бег – это настоящее испытание, соответствующее нормам . Цель забега — увидеть, кто бежит быстрее всех, а не посмотреть, сможет ли каждый бежать с определенной скоростью.

Тест, основанный на нормах, — это тест, который разработан и оценивается таким образом, чтобы некоторые участники теста оценивались лучше или хуже, чем другие. [4] Рейтинг предоставляет информацию об относительном рейтинге, что полезно, когда цель состоит в том, чтобы определить, кто является лучшим (например, при поступлении в элитные университеты). [4]

Несогласие с образовательными стандартами

Тест на основе критериев является более распространенным и более практичным, когда цель состоит в том, чтобы узнать, усвоили ли тестируемые необходимый материал. [4]

Однако некоторые критики возражают против «стандартизированных тестов» не потому, что они возражают против предоставления учащимся одного и того же теста в достаточно схожих условиях и одинаковой оценки ответов, а потому, что они возражают против типа материала, который обычно проверяется в школах. Хотя существуют стандартизированные тесты на неакадемические качества, такие как тесты творческого мышления Торренса , школы редко проводят стандартизированные тесты для измерения «инициативы, креативности, воображения... любознательности... доброй воли, этического размышления или множества других ценных качеств». диспозиции и атрибуты». [80] [81] Вместо этого тесты, проводимые в школах, как правило, меньше сосредотачиваются на развитии нравственности или характера, а больше на индивидуальных идентифицируемых академических навыках, таких как понимание прочитанного и арифметика .

В своей книге « Позор нации» Джонатан Козол утверждает, что студенты, прошедшие стандартизированное тестирование, являются жертвами «когнитивного обезглавливания». Козол приходит к этому осознанию после разговора со многими детьми в городских школах, у которых нет пространственной памяти о времени, периодах времени и исторических событиях. Это особенно актуально в школах, где из-за нехватки финансирования и строгой политики подотчетности школы отказались от таких предметов, как искусство, история и география; чтобы сосредоточиться на содержании обязательных тестов. [82]

Тест на тревожность

Некоторые люди начинают волноваться во время прохождения теста. Это явление чаще встречается для тестов с высокими ставками, чем для тестов с низкими ставками. Тесты с высокими ставками (стандартизованные или нестандартизированные) могут вызывать беспокойство.

Сами учащиеся критикуют, что тесты, хотя и стандартизированы, несправедливы по отношению к отдельному учащемуся. Некоторые студенты утверждают, что они «плохо сдают тесты», то есть они нервничают и теряют концентрацию на тестах. Таким образом, хотя тест является стандартным и должен давать справедливые результаты, тестируемые утверждают, что они находятся в невыгодном положении и не имеют возможности доказать свои знания иным образом, поскольку не существует другой альтернативы тестированию, которая позволила бы учащимся доказать свои знания и решить проблемы. навыки решения.

Некоторые студенты испытывают тревогу перед экзаменами . От десяти до сорока процентов студентов испытывают этот тип тревоги. [83] Больше всего тревогой перед тестированием страдают дети, живущие в бедности. [84] Тревога перед тестированием применима как к стандартизированным, так и к нестандартизированным тестам.

Тесты с множественным выбором и форматы тестов

часть теста с несколькими вариантами ответов
Тесты с множественным выбором могут быть стандартизированными и нестандартизированными тестами.

Тест с несколькими вариантами ответов предоставляет испытуемому вопросы в сочетании с заранее определенным списком возможных ответов. Это тип закрытого вопроса . Экзаменуемый выбирает правильный ответ из списка.

Многие критики стандартизированного тестирования возражают против формата с несколькими вариантами ответов, который обычно используется для недорогого крупномасштабного тестирования и который не подходит для некоторых целей, например, для проверки того, может ли тестируемый написать абзац. Однако в стандартизированном тестировании может использоваться любой формат теста, включая открытые вопросы , при условии, что все участники теста сдают один и тот же тест в достаточно схожих условиях и получают одинаковые оценки.

Обучение на тесте

Преподавание теста – это процесс сознательного сужения инструкций, чтобы сосредоточиться только на материале, который будет измеряться в тесте. Например, если учитель знает, что предстоящий тест по истории не будет включать никаких вопросов по истории музыки или искусства, тогда учитель может «учить на тесте», пропуская материал в учебнике по музыке и искусству. Критики также утверждают, что стандартизированные тесты поощряют « обучение тесту » в ущерб творческому подходу и углубленному освещению предметов, не включенных в тест. Критики говорят, что обучение с помощью теста не способствует обучению более высокого порядка; это меняет то, что учителям разрешено преподавать, и сильно ограничивает объем другой информации, которую учащиеся изучают на протяжении многих лет. [85] Хотя можно использовать стандартизированный тест, не позволяя его содержанию определять учебную программу и обучение, часто то, что не проверяется, не преподается, и то, как проверяется предмет, часто становится моделью преподавания предмета.

Навязанные извне тесты, например, тесты, созданные отделом образования для учащихся в их районе, побуждают учителей сужать формат учебной программы и преподавать в соответствии с тестом. [86]

Оплата по результатам – это идея, согласно которой учителям следует платить больше, если учащиеся хорошо сдают тесты, и меньше, если они показывают плохие результаты. [85] Когда учителей или школы вознаграждают за лучшую работу на тестах, тогда эти награды побуждают учителей « учить по тесту », а не предоставлять насыщенную и обширную учебную программу. В 2007 году качественное исследование, проведенное О Уэйном, продемонстрировало, что стандартизированное тестирование сужает учебную программу и поощряет обучение, ориентированное на учителя, а не обучение, ориентированное на учащихся . [87] Губернатор Нью-Джерси Крис Кристи предложил реформу образования в Нью-Джерси, которая заставляет учителей не только «учить по тесту», но и заставлять своих учеников работать за счет потенциальной стоимости их зарплаты и гарантий занятости. Реформа предусматривала оплату по результатам, которая зависит от успеваемости учащихся на стандартизированных тестах и ​​их образовательных успехов. [88]

Критики утверждают, что чрезмерное и неправильное использование этих тестов вредит преподаванию и обучению, поскольку сужает учебную программу. По данным группы FairTest , когда стандартизированные тесты являются основным фактором подотчетности, школы используют тесты, чтобы узко определить учебную программу и сфокусировать обучение. Подотчетность создает огромное давление на результаты, и это может привести к неправильному использованию и неправильной интерпретации стандартизированных тестов. [66]

Критика тестирования

Некоторые люди критикуют тестирование в целом, независимо от того, стандартизирован тест или нет.

Смотрите также

Основные темы

Другие темы

Рекомендации

  1. ^ Пофэм, WJ (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.
  2. ^ Фелпс, Ричард П. «Роль и важность тестирования». Nonpartisaneducation.org . Проверено 17 мая 2016 г.
  3. ^ abc Олсон, Эми М.; Сэйбрс, Даррелл (октябрь 2008 г.). «Стандартизированные тесты». В Гуде, Томас Л. (ред.). Образование XXI века: Справочник . Публикации SAGE. стр. 423–430. дои : 10.4135/9781412964012.n46. ISBN 9781452265995. S2CID  241229809.
  4. ^ abcdefghi Аллен, Г. Дональд; Росс, Аманда (10 ноября 2017 г.). «Тесты и ярлыки с низкими ставками». Педагогика и содержание математики в средней и старшей школе . Спрингер. ISBN 978-94-6351-137-7.
  5. ^ «Государственная служба Китая». Британская энциклопедия . Проверено 2 мая 2015 г.
  6. ^ abcde Марк и Бойер (1996), 9–10.
  7. ^ Аб Казин, Эдвардс и Ротман (2010), 142.
  8. ^ Аб Трэхейр, Ричард (1 июня 2015 г.). Поведение, технологии и организационное развитие: Эрик Трист и Тавистокский институт. Издатели транзакций. ISBN 9781412855495.
  9. ^ Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. SAGE Publications, INC. 2010. 853–856.Web.
  10. ^ Гаррисон, Марк Дж. Мера неудачи: политические истоки стандартизированного тестирования. Олбани: Государственный университет Нью-Йорка, 2009. Печать.
  11. ^ Дарити, Уильям младший «Международная энциклопедия социальных наук». Энциклопедия справочной информации . Гейл Сенгадж Обучение . Проверено 25 января 2017 г.
  12. ^ Гулд, С.Дж., «Нация дебилов», New Scientist (6 мая 1982 г.), 349–352.
  13. ^ Дарити, Уильям младший «Международная энциклопедия социальных наук». Энциклопедии для справочной информации . Гейл Сенгадж Обучение . Проверено 25 января 2017 г.
  14. ^ Флетчер, Дэн. «Стандартизированное тестирование». Время. Time Inc., 11 декабря 2009 г. Интернет. 09 марта 2014 г.
  15. ^ «Что в ACT». Разделы теста ACT. Нп и Интернет. 05 мая 2014 г.
  16. ^ Стиггинс, Ричард (2002). «Кризис оценивания: отсутствие оценивания ДЛЯ обучения» (PDF) . Пхи Дельта Каппан . 83 (10): 758–765. дои : 10.1177/003172170208301010. S2CID  145683785.
  17. ^ Аб Штраус, Валери (11 марта 2015 г.). «Пять причин, по которым стандартизированное тестирование не прекратится». Вашингтон Пост . Вашингтон Пост . Проверено 26 января 2017 г.
  18. ^ «История и предыстория организации «Ни один ребенок не оставлен позади»» . Bright Hub Education9 июня 2015 г. Интернет. 12 октября 2015 г. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
  19. ^ «Закон об успехе каждого студента (ESSA) | Министерство образования США» .
  20. ^ Клэйборн, Чарльз. «Тестирование с высокими ставками». Энциклопедия одаренности, творчества и таланта. Публикации SAGE, 2009. 9 апреля 2014 г.
  21. Валери, Штраус (21 июня 2020 г.). «Это похоже на начало конца американской одержимости стандартизированными тестами для студентов». Вашингтон Пост .
  22. ^ «Домой - Австралийская учебная программа v8.1» . www.australiancurriculum.edu.au . Проверено 17 мая 2016 г.
  23. ^ Коули, Питер; Макферсон, Пейдж (2022). ТЕСТИРОВАНИЕ КАНАДСКИХ УЧЕНИКОВ K-12: региональные различия, возможности для улучшения (PDF) . ISBN 978-0-88975-694-6. Проверено 19 декабря 2023 г. {{cite book}}: |website=игнорируется ( помощь )
  24. ^ Горовиц, MR; Монтгомери, Д.Л. (январь 1993 г.). «Физиологический профиль пожарных по сравнению с нормами для населения Канады». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN  0008-4263. ПМИД  8500058.
  25. ^ Канадская ассоциация спортивных наук; Программа сертификации и аккредитации по фитнес-аттестации; Канадское общество физиологии физических упражнений; Фитнес Канада (1987). Канадский стандартизированный тест физической подготовки (CSTF): для детей от 15 до 69 лет: руководство по интерпретации и консультированию . Глостер, Онтарио: Канадское общество физиологии физических упражнений. ISBN 0-662-15736-2. ОСЛК  16048356.
  26. ^ Веб-страница ETS. Архивировано 18 июня 2009 г. на Wayback Machine, где рассказывается о результатах GRE.
  27. ^ Аб Хаутц, Джолейн (27 августа 2000 г.) «Временные люди тратят всего несколько минут, чтобы набрать балл по государственному тесту. Математическая задача WASL может занять 20 секунд; эссе, 2.mw-parser-output .frac{white-space:nowrap}.mw -parser-output .frac .num,.mw-parser-output .frac .den{размер шрифта:80%;line-height:0;вертикальное выравнивание:супер}.mw-parser-output .frac .den{ вертикальное выравнивание:sub}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);clip-path:polygon(0px 0px,0px ​​0px,0px ​​0px); высота: 1 пиксель; поле: -1 пиксель; переполнение: скрыто; отступ: 0; положение: абсолютное; ширина: 1 пиксель} 1/2 минуты». Архивировано 10 марта 2007 г. на Wayback Machine . Сиэтл Таймс : «За считанные минуты временный сотрудник за 10 долларов в час выставит вашему ребенку оценку за тест»
  28. ^ Рич, Мотоко (22 июня 2015 г.). «Оценка общего ядра: опыт преподавания не требуется». Нью-Йорк Таймс . ISSN  0362-4331 . Проверено 6 октября 2015 г.
  29. ^ Ли, Джуссим (1989). «Ожидания учителя: самоисполняющиеся пророчества, предвзятость восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. дои : 10.1037/0022-3514.57.3.469.
  30. ^ Где мы находимся: оценка и подотчетность на основе стандартов (Американская федерация учителей) [1] Архивировано 24 августа 2006 г., в Wayback Machine.
  31. ^ «Объединенный комитет по стандартам оценки образования». Архивировано из оригинала 15 октября 2009 года . Проверено 2 мая 2015 г.
  32. ^ Объединенный комитет по стандартам оценки образования. (1988). Стандарты оценки персонала: как оценивать системы оценки преподавателей. Архивировано 12 декабря 2005 г. в Wayback Machine Newbury Park, Калифорния: Sage Publications.
  33. ^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ, 2-е издание. Архивировано 22 февраля 2006 г. в Wayback Machine Newbury Park, Калифорния: Sage Publications.
  34. ^ Комитет по стандартам оценки образования. (2003). Стандарты оценки учащихся: как улучшить оценки учащихся. Архивировано 24 мая 2006 г. в парке Wayback Machine в Ньюбери, Калифорния: Corwin Press.
  35. ^ Морган, Хани (2016). «Опираться на сложные стандартизированные тесты для оценки школ и учителей: плохая идея». Информационный центр: журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. дои : 10.1080/00098655.2016.1156628. S2CID  148015644.
  36. ^ «Стандарты образовательного и психологического тестирования». www.apa.org . Проверено 2 мая 2015 г.
  37. ^ Кунцель, Северная Каролина; Хезлетт, SA (2007). «ОЦЕНКА: стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–81. дои : 10.1126/science.1136618. PMID  17322046. S2CID  143260128.
  38. ^ abcd Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Psychology Press. ISBN 978-0-8058-4912-7.
  39. ^ ab «Плюсы и минусы стандартизированных тестов». Оксфордское обучение . 29 октября 2014 г. Проверено 19 февраля 2018 г.
  40. ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет . Весна 2013 г. Архивировано из оригинала (PDF) 27 января 2018 г. Проверено 19 февраля 2018 г.
  41. ^ Аб Хирш, Эрик младший (1999). Школы, которые нам нужны: и почему их у нас нет . Нью-Йорк: Якорь. ISBN 978-0-385-49524-0.
  42. ^ "Критика FairTest SAT" . fairtest.org. 20 августа 2007 г.
  43. ^ «Стандартизированные тесты не всегда лучший показатель успеха». 20 августа 2007 г.
  44. Патон, Грэм (6 июля 2010 г.). «Университеты критикуют «раздувание оценок» экзаменов» . «Дейли телеграф» . Лондон. Архивировано из оригинала 12 января 2022 г.
  45. Васагар, Дживан (2 августа 2010 г.). «Опасения за учащихся государственных учреждений, поскольку ведущие университеты настаивают на получении A* на уровне A». Хранитель . Лондон.
  46. Финч, Джулия (10 марта 2010 г.). «Они не умеют читать, не умеют писать, следить за временем и быть опрятными: приговор директора Tesco выпускникам школ». Хранитель . Лондон.
  47. ^ Хеджес, Ларри В.; Лейн, Ричард Д.; Гринвальд, Роб (1994). «Хеджес Л.В. (1994). Обмен: Часть I *: Имеют ли деньги значение? Метаанализ исследований влияния дифференциальных школьных ресурсов на результаты учащихся». Исследователь образования . 23 (3): 5–14. дои : 10.3102/0013189X023003005. S2CID  36771659.
  48. ^ Кофлан, Шон. Яркие бедняки, «сдерживаемые десятилетиями», BBC , 16 октября 2013 г. Проверено 17 октября 2013 г.
  49. ^ «Нейронаука стандартизированного тестирования».
  50. ^ «Стандартизированные тесты не показывают того, что знают дети» . 10 июля 2017 г.
  51. ^ «Согласно новому исследованию, стандартизированные тесты не являются хорошим показателем гибкого интеллекта» . 11 января 2014 г.
  52. ^ «Стандартизированные тесты не измеряют интеллект или способности» . 27 сентября 2016 г.
  53. ^ «Наблюдения: результаты стандартизированных тестов не отражают способности учащихся».
  54. ^ Дэвидсон, Кэти (2011). Теперь вы это видите: как наука о мозге и внимании изменит то, как мы живем, работаем и учимся . Нью-Йорк: Викинг.
  55. ^ Новости США (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли дублеров для сдачи сертификационных тестов». Новости Эн-Би-Си . Проверено 2 мая 2015 г.
  56. ^ Шмидт, Уильям Х.; Хуанг, Ричард Т. (2012). «Связность учебных программ и общие основные стандарты по математике». Исследователь образования . 41 (8): 294–308. дои : 10.3102/0013189x12464517. S2CID  121779439.
  57. ^ Портер, А.; МакМакен, Дж.; Хван, Дж.; Ян, Р. (2011). «Общие основные стандарты: новая учебная программа, предназначенная для США». Исследователь образования . 40 (7): 103–116. дои : 10.3102/0013189x11405038. S2CID  51453603.
  58. Лейтон, Линдси (24 октября 2015 г.). «Исследование показывает, что стандартизированное тестирование переполняет государственные школы страны». Вашингтон Пост . Проверено 26 июля 2015 г.
  59. Деринг, Кристофер (25 октября 2015 г.). «План Обамы ограничивает стандартизированное тестирование не более чем 2% учебного времени». США сегодня . Проверено 26 июля 2016 г.
  60. ^ Кучински-Браун, Алекс. «По данным исследования, стоимость стандартизированного тестирования составляет 1,7 миллиарда долларов в год». Хаффингтон Пост. TheHuffingtonPost.com, 29 ноября 2012 г. Интернет. 7 апреля 2014 г.
  61. ^ "Большая четверка индустрии тестирования" . PBS «Линия фронта» . ПБС. 2001 . Проверено 21 января 2015 г.
  62. ^ «Просмотреть все темы - Пресса национальных академий» . Архивировано из оригинала 18 апреля 2008 г. Проверено 2 мая 2015 г.
  63. ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017 г.
  64. ^ Нил, Монти (осень 2009 г.). Стандартизированные тесты несправедливы и вредны. Детройт: Фармингтон-Хиллз, Мичиган: Greenhaven Press. стр. 28–35. ISBN 9780737747812. Проверено 4 декабря 2016 г.
  65. ^ Майнер, Барбара (август 2000 г.). «Стандартизированное мышление: высокая цена американской культуры тестирования и что мы можем сделать, чтобы изменить ее / Противоречия школьной реформы: образовательные затраты на стандартизированное тестирование». Прогрессивный . 64 : 40–43. ПроКвест  231959849.
  66. ^ Аб Холлоуэй, Дж. Х. (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.
  67. ^ Мерфи, Сара С; Клигер, Дэвид М; Борнеман, Мэтью Дж; Кунцель, Натан Р. (2009). «Прогнозирующая сила личных заявлений при поступлении: метаанализ и поучительная история». Колледж и университет . 84 : 83–86, 88.
  68. ^ Кунцель, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT». Журнал "Уолл Стрит .
  69. ^ Кунцель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–1. дои : 10.1126/science.1136618. PMID  17322046. S2CID  143260128.
  70. ^ аб Кунцель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–1081. дои : 10.1126/science.1136618. PMID  17322046. S2CID  143260128.
  71. ^ Парк, Грегори; Любинский, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия в способностях людей, имеющих соизмеримую степень, имеют значение для научного творчества». Психологическая наука . 19 (10): 957–961. дои : 10.1111/j.1467-9280.2008.02182.x. PMID  19000201. S2CID  6443429.
  72. ^ Кунцель, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус взаимосвязь между вступительными испытаниями и успеваемостью после окончания средней школы?». Психологический вестник : 1–22.
  73. ^ Коннелли, Брайан С.; Кунцель, Натан (3 ноября 2012 г.). «Балансирование групп лечения и контроля в квазиэкспериментах: введение в оценку склонности». Психология персонала . 66 (2): 407–442. дои : 10.1111/peps.12020.
  74. ^ Коуч, Майкл; Фрост, Маркиша; Сантьяго, Дж.; Хилтон, Адриэль (9 сентября 2021 г.). «Переосмысление стандартизированного тестирования с точки зрения доступа, равенства и достижений: изменилось ли что-нибудь для афроамериканских студентов?». Журнал исследовательских инициатив . 5 (3). ISSN  2168-9083.
  75. ^ Кунцель, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях с выпускниками SAT и в решениях о поступлении в колледж». Психологическая наука . 23 (9): 1000–7. дои : 10.1177/0956797612438732. PMID  22858524. S2CID  22703783.
  76. ^ abcdefg КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ, АКАДЕМИЧЕСКИЙ СЕНАТ (январь 2020 г.). «Отчет Целевой группы по стандартизированному тестированию Академического совета Калифорнийского университета» (PDF) .
  77. Редколлегия (17 мая 2020). «Калифорния определяет тестирование вниз». Журнал "Уолл Стрит .
  78. ^ Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка достоверности прогнозов…» Журнал образовательных и психологических измерений. 1995. Компоненты http://epm.sagepub.com/content/55/2/309.abstract.
  79. ^ Бакли, Джек; Летукас, Линн; Вильдавски, Бен (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледж, Балтимор: Издательство Университета Джонса Хопкинса, стр. 344, ISBN 9781421424965
  80. ^ Кон, Алфи (2000). Аргументы против стандартизированного тестирования: повышение результатов, разрушение школ . Портсмут, Нью-Хэмпшир: Хайнеманн. ISBN 978-0325003252.
  81. ^ Преподавать: путь учителя, Уильям Айерс, Teachers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , стр. 116  
  82. ^ Козол, Джонатан (2005). Позор нации: восстановление школьного апартеида в Америке . Печать: Рэндом Хаус. стр. 118–119. ISBN 9781415924167.
  83. ^ Вуд; Харт; Маленький; Филлипс (2016). «Тестовая тревога и стандартизированный тест на понимание прочитанного с высокими ставками: взгляд на поведенческую генетику». Ежеквартальный журнал Меррилл-Палмер . 62 (3): 233–251. doi : 10.13110/merrpalmquar1982.62.3.0233. ISSN  0272-930Х. ПМК 5487000 . ПМИД  28674461. 
  84. ^ «Тесты и предвзятость к стрессу». Гарвардская высшая школа образования . 12 февраля 2019 года . Проверено 27 октября 2022 г.
  85. ^ Аб Уильямс, Мэри (2015). «Стандартизированное тестирование вредит обучению учащихся». go.galegroup.com . Проверено 28 марта 2018 г.
  86. ^ «Госвами У (1991) Испытание: влияние внешнего тестирования на учителей. Исследователь образования 20: 8-11». Архивировано из оригинала 2 февраля 2013 г.
  87. ^ Ау, Уэйн (1 июня 2007 г.). «Тестирование с высокими ставками и учебный контроль: качественный метасинтез». Исследователь образования . 36 (5): 258–267. дои : 10.3102/0013189X07306523. ISSN  0013-189X. S2CID  507582.
  88. Арко, Мэтт (12 июня 2015 г.). «Выступление Christie Education в Айове». Нью-Джерси.com . Проверено 25 июля 2016 г.

95.) Тестируемые 1

96.) Тестируемые 2

дальнейшее чтение

Внешние ссылки