Тест с высокими ставками — это тест , имеющий важные последствия для тестируемого. [1] Прохождение дает важные преимущества, такие как диплом средней школы , стипендию или лицензию на профессиональную деятельность. Неудача имеет важные недостатки, такие как необходимость посещать коррекционные занятия до тех пор, пока тест не будет сдан, невозможность водить машину или трудности с поиском работы .
Использование и неправильное использование тестов с высокими ставками является спорной темой в государственном образовании , особенно в Соединенных Штатах и Великобритании, где они стали особенно популярны в последние годы и используются не только для оценки учащихся школьного возраста, но и в попытках повысить уровень учителей. подотчетность. [2]
Определения
В обычном понимании тест с высокими ставками — это любой тест, который имеет серьезные последствия или является основой для принятия важного решения. [1] [3] [4]
Если говорить более точно, тест с высокими ставками — это любой тест, который:
это единая, определенная оценка,
имеет четкую грань между теми, кто проходит, и теми, кто терпит неудачу, и
имеет прямые последствия для прохождения или неудачи (что-то «на кону»). [5]
Например, выпускные экзамены для окончания средней школы часто представляют собой экзамены с высокими ставками: существует один определенный тест (учащийся должен сдать этот тест; никакой другой тест не может быть заменен); некоторые баллы достаточно высоки, чтобы пройти, а другие нет; и неудача имеет прямое последствие предотвращения окончания учебы. Точно так же экзамены по вождению часто имеют высокие ставки, поскольку они также соответствуют тем же трем критериям.
Тестирование с высокими ставками не является синонимом тестирования под высоким давлением . Американский старшеклассник может чувствовать давление, связанное с необходимостью хорошо сдать экзамен SAT-I на профпригодность в колледже. Однако результаты SAT не определяют напрямую поступление в какой-либо колледж или университет, и не существует четкой границы между сдавшими и не сдавшими экзамен, поэтому формально он не считается тестом с высокими ставками. [6] [7] С другой стороны, поскольку баллам SAT-I придается большое значение при поступлении в некоторые школы, многие люди считают, что они имеют последствия для хорошей или плохой успеваемости, и поэтому их можно считать высокими. Тест ставок по более простому и общепринятому определению. [8] [9]
Тест с высокими ставками можно противопоставить тесту со средними ставками или тесту с низкими ставками . [7] Тест со средними ставками может обеспечить доступ к желательной, но менее необходимой выгоде, например, к награде, или это только один из компонентов процесса принятия решений, например, программа приема, в которой учитываются результаты теста и другие факторы. Тест с низкими ставками не имеет существенных последствий для тестируемого.
Ставки
Высокие ставки характеризуют не само испытание, а, скорее, последствия, влияющие на его результат. Например, независимо от того, какой тип теста используется — письменное эссе, компьютерный тест с несколькими вариантами ответов , устный экзамен , тест на работоспособность или что-то еще — для медицинской практики необходимо пройти тест на получение медицинской лицензии.
Восприятие ставок может быть разным. Например, студентам колледжей, желающим пропустить курс вводного уровня, часто сдают экзамены, чтобы проверить, усвоили ли они уже материал и могут ли они перейти на следующий уровень. Сдача экзамена может сократить расходы на обучение и время, проведенное в университете . Студент, который хочет получить эти преимущества, может счесть этот тест экзаменом с высокими ставками. Другой студент, который не придает значения результату, при условии, что его определили в класс, соответствующий его уровню навыков, может считать тот же экзамен тестом с низкими ставками. [5]
Фраза «высокие ставки» происходит непосредственно от термина, связанного с азартными играми . В азартных играх ставка — это количество денег или других товаров, которыми рискуют в результате определенного события. Игра с высокими ставками – это игра, в которой, по личному мнению игрока, рискуется большое количество денег. Этот термин подразумевает, что внедрение такой системы приводит к неопределенности и потенциальным потерям для участников тестирования, которые должны сдать экзамен , чтобы «выиграть » , вместо того, чтобы иметь возможность достичь цели другими способами. [ нужна цитата ]
Примеры
Примеры тестов с высокими ставками и их «ставок» включают в себя:
Тесты на получение водительских прав и право на вождение автомобиля
Кандидат наук. устные экзамены и получение докторской степени
Экзамены на профессиональное лицензирование и сертификацию (например, экзамены на адвоката , письменные тесты ФАУ и медицинские осмотры), а также требуемую лицензию или сертификат.
Система высоких ставок может быть предназначена для того, чтобы принести пользу другим людям, помимо тестируемого. Целью экзаменов на профессиональную сертификацию и получение лицензии является защита населения от некомпетентных специалистов-практиков. Мы надеемся, что индивидуальные ставки студента-медика и медицинской школы сбалансированы с социальными интересами, позволяющими некомпетентному врачу заниматься медицинской практикой. [10]
Тест может быть «высоким» в зависимости от последствий для других людей, помимо отдельного тестируемого. [4] Например, студент-медик, проваливший экзамен на получение лицензии, не может заниматься своей профессией. Однако, если достаточное количество учащихся одной и той же школы не сдадут экзамен, репутация и аккредитация школы могут оказаться под угрозой. Аналогичным образом, тестирование в соответствии с Законом США « Ни один ребенок не останется без внимания» не имело прямых негативных последствий для учащихся, не добившихся успеха, [11] но потенциально имело серьезные последствия для их школ, включая потерю аккредитации, финансирования, заработной платы учителей, трудоустройства учителей или изменений в руководстве школы. . [12] Таким образом, ставки были высоки для школы, но низки для отдельных экзаменуемых.
Использованные оценки
Любая форма оценивания может быть использована в качестве серьезного теста. Часто для удобства выбирают недорогой тест с несколькими вариантами ответов. Важная оценка может также включать ответы на открытые вопросы или практический раздел. Например, типичный экзамен на получение лицензии медицинской медсестры с высокими ставками определяет, может ли медсестра вставить капельницу, наблюдая, как медсестра фактически выполняет эту задачу. Эти оценки называются аутентичными оценками или тестами производительности . [5]
Некоторые тесты с высокими ставками могут быть стандартизированными тестами (в которых все экзаменуемые сдают один и тот же тест в разумно равных условиях) с ожиданием, что стандартизация предоставит всем экзаменуемым справедливую и равную возможность пройти тест. [5] Некоторые экзамены с высокими ставками не стандартизированы, например, театральные прослушивания.
Как и другие тесты, тесты с высокими ставками могут быть основаны на критериях или нормах . [5] Например, письменный экзамен на получение водительских прав обычно основан на критериях: неограниченное количество потенциальных водителей могут его сдать, если они правильно ответят на определенный процент вопросов. С другой стороны, части эссе некоторых экзаменов на адвоката часто соответствуют нормам: худшие эссе проваливаются, а лучшие сдаются, без учета общего качества эссе.
«Четкая грань» между сдачей и провалом экзамена может быть достигнута за счет использования сокращенного балла: например, тестируемые, правильно ответившие на 75% или более вопросов, проходят тест; Тестируемые, правильно ответившие на 74% или меньше, терпят неудачу или не «проходят отбор». При крупномасштабном тестировании с высокими ставками могут использоваться строгие и дорогостоящие исследования по установлению стандартов для определения идеального проходного балла или обеспечения согласованности результатов теста между группами, сдающими тест в разное время.
Критика
Тесты с высокими ставками, несмотря на их широкое использование для определения академических и неакадемических знаний, подвергаются критике по разным причинам. Примеры проблем включают следующее:
Тест неправильно измеряет знания и навыки человека. Например, тест может претендовать на общий тест на навыки чтения, но на самом деле он может определить, прочитал ли испытуемый конкретную книгу или нет. В контексте компьютерных тестов с высокими ставками испытуемые с низким доходом и другие лица, не имеющие прямого доступа к компьютерам, могут оказаться в невыгодном положении [13] , если тест должен измерять навыки чтения, но на практике измеряет навыки тестируемых набирать текст. или их умение отвечать на вопросы на компьютере.
Тест может не измерить то, что хочет измерить критик. Например, тест может точно определить, приобрел ли студент-юрист фундаментальные знания о правовой системе, но критик может захотеть, чтобы этих потенциальных юристов проверили на предмет юридической этики, а не на юридические знания.
Тестирование с высокими ставками может побудить учителей пропускать материал, который не проверяется. « Преподавание в соответствии с тестом » может привести к узкому учебному плану и снижению навыков. Например, если на экзамене по вождению не проверяются навыки параллельной парковки , инструкторы по вождению могут прекратить обучение этому навыку студента-водителя, сосредоточив время обучения на материале, который будет проверяться, например, на определении того, какое транспортное средство имеет право на вождение . путь на четырехпутной остановке . В результате учащийся сможет пройти тест, но в некоторых местах он не сможет безопасно припарковать машину. Согласно закону Кэмпбелла , чем выше ставки (для тестируемого или для школы), тем больше вероятность того, что это произойдет.
Тестирование вызывает у некоторых людей стресс. Критики предполагают, что, поскольку некоторые люди плохо справляются с давлением, связанным с тестами, любой тест, вероятно, будет менее репрезентативным для их фактического уровня достижений, чем альтернатива, не связанная с тестированием. [14] Это называется тревогой перед экзаменом или тревогой по поводу производительности .
Тесты с высокими ставками часто сдаются как один длинный экзамен. Некоторые критики предпочитают непрерывную оценку вместо одного более крупного теста. Например, Американская психологическая ассоциация (АПА) выступает против использования однократного выпускного экзамена в средней школе как единственного фактора, определяющего, должен ли учащийся окончить среднюю школу, заявив: «Любое решение о продолжении обучения учащегося, такое как удержание, отслеживание , или выпускной экзамен, не должны основываться на результатах одного теста, а должны включать другую соответствующую и достоверную информацию». [15] Однако, поскольку ставки связаны с последствиями, а не с методом, короткие тесты также могут иметь высокие ставки.
Тестирование с высокими ставками создает больше стимулов для мошенничества. [16] Поскольку списать на одном важном экзамене может быть проще, чем выучить необходимый материал или заработать баллы за посещаемость, усердие или множество более мелких тестов, больше экзаменующихся, которые на самом деле не обладают необходимыми знаниями или навыками, но являются эффективными мошенниками. , может пройти. Кроме того, некоторые люди, которые в противном случае прошли бы тест, но недостаточно уверены в себе, могут решить дополнительно обеспечить результат с помощью мошенничества, попасться и часто столкнуться с еще худшими последствиями, чем просто провал. Кроме того, если результаты тестов используются для определения заработной платы учителей или дальнейшего трудоустройства, или для оценки школы, то школьный персонал может обманным путем изменить тестовые работы учащихся, чтобы искусственно завысить успеваемость. [16]
Иногда испытание с высокими ставками связано со спорной наградой. Например, некоторые люди могут захотеть, чтобы диплом об окончании средней школы представлял собой подтвержденное приобретение определенных навыков или знаний, и поэтому используют оценку с высокими ставками, чтобы отказать в получении диплома любому, кто не может овладеть необходимыми навыками. [17] Другие могут захотеть, чтобы аттестат средней школы представлял собой в первую очередь свидетельство о посещении занятий , чтобы человек, который добросовестно посещал занятия, но не умел читать и писать, все равно получал социальные льготы после окончания школы. Подобное использование тестов – для лишения аттестата средней школы и, следовательно, доступа к большинству рабочих мест и высшего образования на всю жизнь – вызывает споры, даже если сам тест точно выявляет учащихся, не обладающих необходимыми навыками. Критика обычно формулируется как чрезмерная зависимость от одного измерения [18] или с точки зрения социальной справедливости , если отсутствие навыков не является полностью ошибкой тестируемого, как в случае с учащимся, который не умеет читать из-за неквалифицированных учителей. или человек с развитой деменцией , который больше не может сдать экзамен по вождению из-за потери когнитивных функций. [3]
Тесты могут наказывать участников тестирования, которые не обладают необходимыми навыками не по своей вине. Отсутствие навыков может быть не ошибкой тестируемого, но тест с высокими ставками измеряет только уровень владения навыками, независимо от того, имели ли тестируемые равные возможности для изучения материала. [3] [19] [20] Кроме того, богатые участники тестирования могут использовать частные репетиторы или программы подготовки к экзаменам , чтобы улучшить свои результаты. Некоторые богатые родители платят тысячи долларов за подготовку своих детей к вступительным экзаменам в университет. [21] Критики считают это несправедливым по отношению к семьям, которые не могут позволить себе платить за дополнительные образовательные услуги. [22]
Тесты с высокими ставками показывают, что некоторые экзаменуемые не знают требуемого материала или не обладают необходимыми навыками. Хотя неудачи этих людей могут принести много общественных выгод, последствия повторных неудач могут быть очень серьезными для отдельного человека. Например, человек, проваливший практический экзамен по вождению, не сможет легально водить автомобиль, а это значит, что он не сможет ездить на работу и может потерять работу, если альтернативные варианты транспорта недоступны. Человек может испытать социальное неловкое положение, когда его знакомые обнаружат, что отсутствие у него навыков привело к потере водительских прав. В контексте выпускных экзаменов в старших классах школьные округа с низкой успеваемостью официально выступили против тестирования с высокими ставками после низких результатов тестов, которые точно и публично выявили неудачи округов, оказались политически неудобными [23] и подвергли критике тесты с высокими ставками. для правильного выявления студентов, которым не хватает необходимых знаний. [24]
Иногда тестирование с высокими ставками проводится в отношении маленьких детей. Тестирование часто начинается уже в третьем классе , когда дети могут быть не в состоянии правильно распределить умственные ресурсы, необходимые для достижения успеха. Если они потерпят неудачу, им может быть назначено дополнительное обучение, которое может быть использовано в качестве наказания. [25]
Низкие результаты тестов часто могут быть синонимом хороших тестов. [26] Может возникнуть предвзятое мнение, что для того, чтобы тест с высокими ставками был действительным, результаты теста должны быть плохими. С другой стороны, тесты, с которыми учащиеся обычно справляются хорошо, часто можно игнорировать как слишком простые, даже если они хорошо соответствуют стандартам. Кроме того, эта предвзятость может способствовать созданию оценок, в которых показателем того, насколько хороша оценка, становится процент неудач учащихся, а не соответствие стандартам.
Преимущества
Помимо критики, тестирование с высокими ставками сохраняет некоторые преимущества:
Результаты и тенденции оценок по тестам с высокими ставками, как правило, более надежны, чем результаты тестов с низкими ставками или без них, поскольку тестируемые с большей вероятностью будут безопасно назначаться и восприниматься ими серьезно. [27] [28] [29] [30]
Слабая безопасность пронизывает проведение тестов без ставок — тестов, которые «не учитываются». Действительно, все тесты, кроме одного, вошедшие в знаменитый скандал с школьными тестами «Эффект озера Вобегон» в 1980-х годах, не имели никакого значения для учеников, учителей или школ. Во многих случаях школы могут проводить тесты по своему усмотрению, при этом учителя контролируют своих учеников или вообще не контролируют. Поскольку администраторы образования на уровне штата и на местном уровне могут свободно управлять большинством аспектов проведения тестов, выставления оценок и отчетности, они могут искусственно завышать баллы и определять их тенденции таким образом, что учащиеся во всех штатах США будут «выше среднего по стране». [31]
Тесты с высокими ставками также с большей вероятностью будут проводиться извне (независимыми лицами без конфликта интересов) и безопасно. В то время как тестирование с высокими ставками может создать больше стимулов для мошенничества, тестирование с низкими ставками или без них может создать больше возможностей для мошенничества, поскольку оно обычно проводится внутри школы (например, в школах учащихся их собственными учителями) с меньшей безопасностью. [32] [33] [34]
Добавление ставок в тест в целом положительно влияет на успеваемость учащихся, предполагая большую мотивацию и усилия. [35]
Рекомендации
^ ab «Лексикон обучения». Ассоциация по надзору и разработке учебных программ.
^ Розмари Саттон; Кельвин Зайферт (2009). «Глава 1: Меняющаяся профессия учителя и вы». Педагогическая психология (PDF) (2-е изд.). п. 14.
^ abc Тогут, Торин Д. «Тестирование с высокими ставками: образовательный барометр успеха или ложный прогноз неудачи». Маяк . № Осень 2004 г. Harbour House Law Press.
^ аб Торин Д. Тогут. «Глоссарий образовательных терминов EDEX 790». Архивировано из оригинала 11 января 2009 года . Проверено 23 июля 2009 г.
^ abcde «Характер оценки: Руководство по стандартизированному тестированию - Центр народного образования». Архивировано из оригинала 25 июля 2011 года . Проверено 23 июля 2009 г.
^ Пфайффер, Стивен I (зима 2009 г.). «Дебаты об использовании SAT при поступлении в колледж». Программа выявления талантов Университета Дьюка. Архивировано из оригинала 14 октября 2009 г. Гастон Капертон, президент Совета колледжей, который публикует тесты SAT, возражает, что SAT I — это «не экзамен с высокими ставками», но полезный инструмент для поступления, если его рассматривать вместе с другими доказательствами потенциала студента для успеха в колледже.
^ аб Фелпс, Ричард П. (июнь 2010 г.). «Источник озера Вобегон» (PDF) . Беспартийный обзор образования . Проверено 18 октября 2020 г.
↑ Мари Перлман (4 апреля 2001 г.). «Тестирование с высокими ставками: опасности и возможности». Архивировано из оригинала 25 сентября 2009 г. Проверено 23 июля 2009 г.
↑ Эдди Рамирес (30 апреля 2008 г.). «Чиновники приемной комиссии пожимают плечами на письменном тесте SAT» . Проверено 24 июля 2009 г.
^ Меренс, Вашингтон (1995). Правовые и профессиональные основы тестирования на получение лицензии». В Импара, Дж. К. (ред.) Тестирование на получение лицензии: цели, процедуры и практика , стр. 33-58. Линкольн, Небраска: Институт Буроса.
^ «NCLB не имеет ничего общего с высокими ставками теста для студентов» . Архивировано из оригинала 13 декабря 2012 г.
^ Грин, Джей П.; Маркус А. Уинтерс; Грег Форстер (февраль 2003 г.). «Тестирование тестов с высокими ставками: можем ли мы поверить результатам тестов на подотчетность?». Гражданский отчет . Манхэттенский институт политических исследований.
^ Файл, Том; Райан, Камилла (ноябрь 2014 г.). «Использование компьютеров и Интернета в США: 2013 г.» (PDF) . census.gov .
^ Зуриф GE (1997). «Помещения для страха перед экзаменами в соответствии с ADA?». Варенье. акад. Закон о психиатрии . 25 (2): 197–206. ПМИД 9213292.
^ «Соответствующее использование тщательного тестирования в школах нашей страны» . Американская психологическая ассоциация . Проверено 9 января 2008 г.
^ аб Джейкоб, Брайан А. и Стивен Д. Левитт (зима 2004 г.). «Чтобы поймать обман» (PDF) . Образование Далее .
^ «Рисунок 1-10: Поддержка сотрудников/преподавателей при проведении важных тестов: 2000 г.» Архивировано из оригинала 7 февраля 2008 г. Проверено 6 февраля 2008 г.
^ Льюис, Энн (апрель 2000 г.). Тестирование с высокими ставками: тенденции и проблемы (PDF) (отчет). Среднеконтинентальные исследования в области образования и обучения. Архивировано из оригинала (PDF) 27 июля 2011 г.
^ Майерс, Дэвид (2001). Психология . Нью-Йорк: Издательство Worth. п. 464. ИСБН1-57259-791-7. Зачем обвинять тесты в том, что они выявляют неравный опыт и возможности?
↑ Данг, Ник (18 марта 2003 г.). «Реформировать образование, а не выпускные экзамены». Ежедневный Брюин . Одна из распространенных жалоб со стороны тех, кто не сдал экзамен, заключается в том, что им не преподавали тестируемый материал в школе. Здесь виновато неадекватное обучение, а не тесты. Обвинять тест в своей неудаче — все равно, что обвинять станцию технического обслуживания в неудавшейся проверке смога; он игнорирует основные проблемы внутри «учебной машины».
^ «Занимаемся сдачей SAT? Помощь в подготовке к экзаменам имеется в изобилии» . Христианский научный монитор . Том. 90, нет. 175. Ассошиэйтед Пресс. 4 августа 1998 г. стр. B3. ISSN 0882-7729 . Проверено 9 июля 2007 г. Некоторые родители тратят тысячи долларов на частные занятия...
^ Джонсон, Дейл, Бонни Джонсон, Стивен Дж. Фаренга и Дэниел Несс. (2008). Остановите испытания с высокими ставками: обращение к совести Америки. Лэнхэм, доктор медицины: Роуман и Литтлфилд.
^ Вайнкопф, Крис (2002). «Во всем виноват тест: LAUSD отрицает ответственность за низкие результаты». Ежедневные новости . Вина лежит на «тестах с высокими ставками», таких как Стэнфордский девятый выпускной экзамен и выпускной экзамен в средней школе Калифорнии. Комиссия ворчит, что использование таких тестов «несправедливо наказывает студентов, которым не предоставлены академические инструменты, позволяющие максимально раскрыть свой потенциал на этих тестах».
^ «Обвинение теста». Деловая газета инвестора . 11 мая 2006 г. Судья в Калифорнии собирается отменить выпускной экзамен в средней школе этого штата. Почему? Потому что это работает. Это говорит студентам, что им нужно учиться больше. Мы называем это полезной информацией. Для истцов, которые подают в суд с требованием прекратить использование теста в качестве требования к выпускному экзамену, это нечто иное: доказательства неравного обращения... выпускной экзамен был признан несправедливым, потому что у слишком многих студентов, проваливших тест, было слишком мало дипломированных учителей. Что ж, может быть, они и так и сделали, но выдача им диплома, когда у них нет необходимых знаний, только усугубляет несправедливость, оставляя им бесполезный клочок бумаги.
^ Кон, А. (1999) Путать сложнее и лучше. Получено 26 января 21 года с https://www.alfiekohn.org/article/confusing-harder-better/.
^ Эклёф, Ханна (2007). «Мотивация сдачи теста и успеваемость по математике в TIMSS». Международный журнал тестирования . 7 (3): 311–326. дои : 10.1080/15305050701438074. S2CID 144686714.
^ Финн Б. (2015). Измерение мотивации при оценивании с низкими ставками (Отчет об исследовании RR-15-19). Служба образовательного тестирования.
^ Хоторн, Калифорния; Бол, Л.; Прибеш, С.; Су, Ю. (2015). «Мотивация сдачи теста и успеваемость по математике в TIMSS». Исследования и практика оценки . 10 :30–38.
^ Мудрый, СЛ; ДеМарс, CE (2010). «Без усилий испытуемого и достоверность результатов оценки программы». Образовательная оценка . 15 : 27–41. дои : 10.1080/10627191003673216. S2CID 143794026.
^ «Эффект озера Вобегон: двадцать лет спустя». Беспартийный обзор образования .
^ Чижек, GJ (1999). Обман на тестах: как это сделать, обнаружить и предотвратить . Рутледж. дои : 10.4324/9781410601520. ISBN9781410601520.
^ Стегер, Д.; Шредерс, У.; Гнамбс, Т. (2018). «Метаанализ результатов тестов при контролируемой и неконтролируемой оценке способностей». Европейский журнал психологической оценки . 36 : 1–11. дои : 10.1027/1015-5759/a000494. S2CID 149485786.
^ Счетная палата правительства США (2013). K-12 Образование: политика и процедуры безопасности тестов в штатах различаются (отчет).
^ Фелпс, Р.П. (2019). «Частота тестов, ставки и обратная связь в успеваемости учащихся: метаанализ». Обзор оценки . 43 (3–4): 111–151. дои : 10.1177/0193841X19865628. PMID 31382776. S2CID 199449477.
дальнейшее чтение
Фезерстон, Марк Дэвис, 2011. «Политика тестирования в Техасе с высокими ставками: описание отношения молодых выпускников колледжей». Проекты прикладных исследований, Техасский государственный университет, Сан-Маркос .