Образовательная оценка или образовательная оценка [1] - это систематический процесс документирования и использования эмпирических данных о знаниях , навыках , отношениях , способностях и убеждениях для совершенствования программ и улучшения обучения учащихся. [2] Данные оценки могут быть получены путем непосредственного изучения работы учащихся для оценки достижения результатов обучения или основаны на данных, из которых можно сделать выводы об обучении. [3] Оценка часто используется взаимозаменяемо с тестом, но не ограничивается тестами. [4] Оценка может быть сосредоточена на отдельном учащемся, учебном сообществе (классе, семинаре или другой организованной группе учащихся), курсе, академической программе, учреждении или образовательной системе в целом (также известном как гранулярность). Слово «оценка» вошло в употребление в образовательном контексте после Второй мировой войны . [5]
Как непрерывный процесс, оценка устанавливает измеримые результаты обучения учащихся, предоставляет достаточное количество возможностей для обучения для достижения этих результатов, реализует систематический способ сбора, анализа и интерпретации доказательств для определения того, насколько хорошо обучение учащихся соответствует ожиданиям, и использует собранную информацию для предоставления обратной связи по улучшению обучения учащихся. [6] Оценка является важным аспектом образовательного процесса, который определяет уровень достижений учащихся. [7]
Конечная цель методов оценки в образовании зависит от теоретической базы практиков и исследователей, их предположений и убеждений относительно природы человеческого разума, происхождения знаний и процесса обучения.
Термин «оценка» обычно используется для обозначения всех видов деятельности, которые учителя используют для помощи учащимся в обучении и для оценки прогресса учащихся. [8] Оценку можно разделить для удобства, используя следующие категории:
Оценку часто делят на начальную, формирующую и итоговую категории с целью рассмотрения различных целей практики оценки.
(1) Оценка размещения – Оценка размещения может использоваться для размещения студентов в соответствии с предыдущими достижениями или уровнем знаний, или личными характеристиками, в наиболее подходящей точке в учебной последовательности, в уникальной учебной стратегии или с подходящим учителем [9], проводимой посредством тестирования размещения , т. е. тестов, которые колледжи и университеты используют для оценки готовности к колледжу и размещения студентов в их начальных классах. Оценка размещения, также называемая предварительной оценкой, начальной оценкой или пороговым тестом знаний (TKT), проводится до обучения или вмешательства, чтобы установить исходный уровень, от которого можно измерить индивидуальный рост студента. Этот тип оценки используется, чтобы узнать, каков уровень навыков студента по предмету, он также может помочь учителю более эффективно объяснять материал. Эти оценки, как правило, не оцениваются. [10]
(2) Формативное оценивание – обычно проводится на протяжении всего курса или проекта. Его также называют «образовательным оцениванием», которое используется для помощи в обучении. В образовательной среде формирующее оценивание может проводиться учителем (или коллегой ) или учащимся (например, посредством самооценки [11] [12] ), предоставляя обратную связь по работе учащегося и не обязательно будет использоваться для целей выставления оценок. Формативное оценивание может принимать форму диагностических, стандартизированных тестов, викторин, устных вопросов или черновиков. Формативное оценивание проводится одновременно с инструкциями, и результаты могут учитываться. Целью формирующего оценивания является проверка того, понимают ли учащиеся инструкцию, прежде чем проводить итоговое оценивание. [10]
(3) Суммативное оценивание – обычно проводится в конце курса или проекта. В образовательной среде суммативные оценки обычно используются для выставления студентам оценки за курс и являются оценочными. Суммативное оценивание проводится для подведения итогов того, что студенты узнали, чтобы узнать, хорошо ли они понимают предмет. Этот тип оценки обычно оценивается по шкале (например, сдал/не сдал, 0–100) и может принимать форму тестов, экзаменов или проектов. Суммативное оценивание в основном используется для определения того, сдал или не сдал студент курс. Критика суммарных оценок заключается в том, что они являются упрощенными, и учащиеся обнаруживают, насколько хорошо они усвоили знания, слишком поздно, чтобы они были полезны. [10]
(4) Диагностическая оценка. В конце диагностическая оценка фокусируется на всех трудностях, возникших в процессе обучения.
Джей МакТай и Кен О'Коннор предложили семь практик эффективного обучения. [10] Одна из них — демонстрация критериев оценки перед тестом, а другая — важность предварительной оценки, чтобы знать уровень навыков ученика, прежде чем давать инструкции. Предоставление большого количества обратной связи и поощрений — это другие практики.
Исследователь в области образования Роберт Стейк [13] объясняет разницу между формирующим и итоговым оцениванием с помощью следующей аналогии:
Когда повар пробует суп, это формирующее. Когда гости пробуют суп, это суммирующее. [14]
Суммативное и формирующее оценивание часто упоминаются в контексте обучения как оценка обучения и оценка для обучения соответственно. Оценка обучения, как правило, является суммирующим по своей природе и предназначена для измерения результатов обучения и сообщения этих результатов учащимся, родителям и администраторам. Оценка обучения в основном происходит в конце занятия, курса, семестра или учебного года, в то время как оценка для обучения, как правило, является формирующим по своей природе и используется учителями для рассмотрения подходов к преподаванию и следующих шагов для отдельных учащихся и класса. [15]
Распространенной формой формативной оценки является диагностическая оценка . Диагностическая оценка измеряет текущие знания и навыки учащегося с целью определения подходящей программы обучения. Самооценка — это форма диагностической оценки, которая предполагает, что учащиеся оценивают себя сами.
Перспективная оценка предполагает, что оцениваемые лица должны рассмотреть себя в гипотетических будущих ситуациях. [16]
Оценка на основе результатов похожа на суммативную оценку, поскольку она фокусируется на достижениях. Она часто соответствует реформе образования на основе стандартов и движению за образование на основе результатов . Хотя в идеале они значительно отличаются от традиционного теста с множественным выбором, они чаще всего связаны с оценкой на основе стандартов , которая использует ответы в свободной форме на стандартные вопросы, оцениваемые людьми-оценщиками по шкале на основе стандартов, соответствуя, отставая или превосходя стандарт производительности, а не ранжируясь по кривой. Определяется четко определенная задача, и ученикам предлагается создать, произвести или сделать что-то, часто в условиях, которые предполагают применение знаний и навыков в реальном мире. Мастерство демонстрируется путем предоставления расширенного ответа. Форматы производительности далее классифицируются на продукты и выступления. Результатом выступления может быть продукт, такой как картина, портфолио, статья или выставка, или оно может состоять из выступления, такого как речь, спортивное мастерство, музыкальный концерт или чтение.
Оценка (суммативная или формирующая) часто классифицируется как объективная или субъективная. Объективная оценка — это форма опроса, которая имеет один правильный ответ. Субъективная оценка — это форма опроса, которая может иметь более одного правильного ответа (или более одного способа выражения правильного ответа). Существуют различные типы объективных и субъективных вопросов. Объективные типы вопросов включают в себя ответы «истина/ложь», вопросы с множественным выбором , вопросы с множественным ответом и вопросы на сопоставление, в то время как субъективные вопросы включают вопросы с расширенным ответом и эссе. Объективная оценка хорошо подходит для все более популярного формата компьютерной или онлайн-оценки .
Некоторые утверждают, что различие между объективными и субъективными оценками не является ни полезным, ни точным, поскольку в действительности не существует такого понятия, как «объективная» оценка. Фактически, все оценки создаются с присущими им предубеждениями, встроенными в решения о соответствующих предметах и содержании, а также культурными (классовыми, этническими и гендерными) предубеждениями. [17]
Результаты теста можно сравнить с установленным критерием или с результатами других студентов, или с предыдущими результатами:
(5) Критериально-связанная оценка , обычно использующая критериально-связанный тест , как следует из названия, происходит, когда кандидаты оцениваются по определенным (и объективным) критериям. Критериально-связанная оценка часто, но не всегда, используется для установления компетентности человека (может ли он/она что-то сделать). Самым известным примером критериально-связанной оценки является экзамен по вождению, когда водители-ученики оцениваются по ряду явных критериев (например, «Не подвергать опасности других участников дорожного движения»).
(6) Норма-ориентированная оценка (в просторечии известная как « оценивание по кривой »), обычно использующая тест, ориентированный на норму , не измеряется по определенным критериям. Этот тип оценки относится к студенческому коллективу, проводящему оценку. Это фактически способ сравнения студентов. Тест IQ является самым известным примером оценки, ориентированной на норму. Многие вступительные тесты (в престижные школы или университеты) являются норма-ориентированными, позволяя фиксированной доле студентов пройти («прохождение» в этом контексте означает принятие в школу или университет, а не явный уровень способностей). Это означает, что стандарты могут меняться из года в год в зависимости от качества когорты; оценка, ориентированная на критерии, не меняется из года в год (если критерии не меняются). [18]
(7) Ипсативная оценка — это самосравнение либо в одной и той же области с течением времени, либо в сравнении с другими областями в рамках одного и того же учащегося.
Оценка может быть формальной или неформальной . Формальная оценка обычно подразумевает письменный документ, такой как тест, викторина или статья. Формальная оценка представляет собой числовой балл или оценку на основе успеваемости учащегося, тогда как неформальная оценка не влияет на итоговую оценку учащегося. Неформальная оценка обычно происходит более неформально и может включать наблюдение, инвентаризацию, контрольные списки, шкалы оценок, рубрики , оценки производительности и портфолио, участие, оценку коллег и самооценку, а также обсуждение. [19]
Внутренняя оценка устанавливается и оценивается школой (т. е. учителями), ученики получают оценку и обратную связь относительно оценки. Внешняя оценка устанавливается руководящим органом и оценивается непредвзятым персоналом, некоторые внешние оценки дают гораздо более ограниченную обратную связь в своей оценке. Однако в тестах, таких как австралийский NAPLAN, критерий, рассматриваемый учениками, получает подробную обратную связь, чтобы их учителя могли рассмотреть и сравнить достижения ученика в обучении, а также спланировать будущее.
В целом, высококачественными оценками считаются те, которые имеют высокий уровень надежности и валидности . Другими общими принципами являются практичность , подлинность и обратная связь. [20] [21]
Надежность относится к последовательности оценки. Надежная оценка — это та, которая последовательно достигает тех же результатов с той же (или похожей) группой студентов. На надежность влияют различные факторы, в том числе неоднозначные вопросы, слишком много вариантов ответов в экзаменационном листе, нечеткие инструкции по выставлению оценок и плохо обученные оценщики. Традиционно надежность оценки основывается на следующем:
Надежность измерения x также можно определить количественно как: где — надежность наблюдаемого (тестового) результата x; и — изменчивость «истинных» (т. е. врожденных результатов кандидата) и измеренных тестовых результатов соответственно. может варьироваться от 0 (совершенно ненадежно) до 1 (совершенно надежно).
Существует четыре типа надежности: связанная со студентом, которая может быть вызвана личными проблемами, болезнью или усталостью ; связанная с оценщиком, которая включает в себя предвзятость и субъективность ; связанная с администрацией теста, которая является условиями процесса сдачи теста; связанная с тестом, которая в основном связана с природой теста. [23] [20] [24]
Действительная оценка — это та, которая измеряет то, для измерения чего она предназначена. Например, было бы недействительно оценивать навыки вождения только с помощью письменного теста. Более действительным способом оценки навыков вождения было бы сочетание тестов, которые помогают определить, что знает водитель, например, с помощью письменного теста на знание правил вождения, и что водитель может делать, например, с помощью оценки эффективности фактического вождения. Преподаватели часто жалуются, что некоторые экзамены не оценивают должным образом программу, на которой основан экзамен; они фактически подвергают сомнению действительность экзамена.
Обоснованность оценки обычно оценивается путем изучения доказательств по следующим категориям:
Другие: [20] [23]
Хорошая оценка имеет как валидность, так и надежность, а также другие качественные атрибуты, указанные выше для определенного контекста и цели. На практике оценка редко бывает полностью валидной или полностью надежной. Линейка, на которой неправильно нанесена отметка, всегда будет давать одинаковые (неправильные) измерения. Она очень надежна, но не очень валидна. Просьба к случайным людям назвать время, не глядя на часы, иногда используется в качестве примера оценки, которая является валидной, но ненадежной. Ответы будут различаться у разных людей, но средний ответ, вероятно, близок к фактическому времени. Во многих областях, таких как медицинские исследования, образовательное тестирование и психология, часто будет существовать компромисс между надежностью и валидностью. Тест по истории, написанный для высокой валидности, будет содержать много вопросов-эссе и вопросов с заполнением пропусков. Это будет хорошим показателем владения предметом, но его трудно оценить абсолютно точно. Тест по истории, написанный для высокой надежности, будет полностью с множественным выбором. Он не так хорош для измерения знания истории, но его можно легко оценить с большой точностью. Мы можем обобщить это. Чем надежнее наша оценка того, что мы намерены измерить, тем меньше мы уверены в том, что мы действительно измеряем этот аспект достижения.
Хорошо различать валидность «предмета» и «прогностическую» валидность. Первая, широко используемая в образовании, предсказывает балл, который получит студент на аналогичном тесте, но с другими вопросами. Последняя, широко используемая на рабочем месте, предсказывает результаты. Таким образом, валидный по предмету тест на знание правил вождения является подходящим, в то время как прогностически валидный тест оценит, сможет ли потенциальный водитель следовать этим правилам.
Этот принцип относится к ограничениям по времени и стоимости при построении и администрировании инструмента оценки. [20] Это означает, что тест должен быть экономичным в предоставлении. Формат теста должен быть простым для понимания. Более того, решение теста должно оставаться в пределах подходящего времени. Он, как правило, прост в администрировании. Его процедура оценки должна быть конкретной и эффективной по времени. [24]
Инструмент оценки является аутентичным, когда он контекстуализирован, содержит естественный язык и значимую, релевантную и интересную тему, а также воспроизводит реальный жизненный опыт. [20]
Этот принцип относится к последствиям оценки в преподавании и обучении в классах. [20] Обратная реакция может быть положительной и отрицательной. Положительная обратная реакция относится к желаемым эффектам теста, в то время как отрицательная обратная реакция относится к отрицательным последствиям теста. Для того чтобы иметь положительную обратную реакцию, можно использовать учебное планирование. [26]
В области оценки , и в частности образовательной оценки в Северной Америке, Объединенный комитет по стандартам образовательной оценки опубликовал три набора стандартов для оценки. Стандарты оценки персонала были опубликованы в 1988 году, [27] Стандарты оценки программ (2-е издание) были опубликованы в 1994 году, [28] и Стандарты оценки студентов были опубликованы в 2003 году. [29]
Каждая публикация представляет и разрабатывает набор стандартов для использования в различных образовательных условиях. Стандарты предоставляют руководящие принципы для разработки, внедрения, оценки и улучшения определенной формы оценки. Каждый из стандартов был помещен в одну из четырех основных категорий для содействия образовательным оценкам, которые являются надлежащими, полезными, осуществимыми и точными. В этих наборах стандартов соображения валидности и надежности рассматриваются в разделе точности. Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.
В Великобритании существует награда в области обучения, оценки и обеспечения качества (TAQA), которая помогает сотрудникам изучать и развивать передовой опыт в отношении оценки образования в контексте образования взрослых, дополнительного образования и обучения на рабочем месте. [30]
Из-за инфляции оценок стандартизированные тесты могут иметь более высокую достоверность, чем нестандартизированные экзаменационные баллы. [32] Недавнее увеличение показателей окончания школы можно частично объяснить инфляцией оценок . [33]
В следующей таблице суммированы основные теоретические рамки, лежащие в основе почти всех теоретических и исследовательских работ, а также учебных практик в образовании (одной из них, конечно же, является практика оценки). Эти различные рамки породили интересные дебаты среди ученых.
Озабоченность по поводу того, как лучше всего применять методы оценки в системах государственных школ, в основном сосредоточена на вопросах использования высокоуровневого тестирования и стандартизированных тестов, которые часто используются для оценки успеваемости учащихся, качества работы учителей и образовательных успехов в масштабах школы, округа или штата.
Для большинства исследователей и практиков вопрос заключается не в том, следует ли вообще проводить тесты — существует общее мнение, что при эффективном проведении тесты могут предоставить полезную информацию об успеваемости учащихся и реализации учебной программы, а также предложить обучающимся формирующее применение. [34] Реальный вопрос заключается в том, могут ли методы тестирования, применяемые в настоящее время, предоставлять эти услуги преподавателям и студентам.
Президент Буш подписал Закон «Ни один ребенок не останется без внимания» (NCLB) 8 января 2002 года. Закон NCLB повторно ввел в действие Закон о начальном и среднем образовании (ESEA) 1965 года. Президент Джонсон подписал ESEA, чтобы помочь в борьбе с бедностью и финансировать начальные и средние школы. Целью президента Джонсона было подчеркнуть равный доступ к образованию и установить высокие стандарты и подотчетность. Закон NCLB требовал от штатов разработки оценок основных навыков. Чтобы получить федеральное финансирование школ, штаты должны были проводить эти оценки для всех учащихся выбранного уровня обучения.
В США закон «Ни один ребенок не останется без внимания» предписывает стандартизированное тестирование по всей стране. Эти тесты соответствуют государственной программе и связывают ответственность учителя, ученика, округа и штата с результатами этих тестов. Сторонники NCLB утверждают, что он предлагает ощутимый метод оценки успеваемости в образовании, возлагая ответственность на учителей и школы за неудовлетворительные результаты и сокращая разрыв в успеваемости между классами и этническими группами. [35]
Противники стандартизированного тестирования оспаривают эти утверждения, утверждая, что привлечение педагогов к ответственности за результаты тестов приводит к практике « обучения по результатам тестов ». Кроме того, многие утверждают, что сосредоточенность на стандартизированном тестировании побуждает учителей снабжать учеников узким набором навыков, которые повышают эффективность тестов, фактически не способствуя более глубокому пониманию предмета или ключевых принципов в области знаний. [36]
Оценки, которые вызвали больше всего споров в США, - это использование выпускных экзаменов в средней школе , которые используются для отказа в выдаче дипломов студентам, которые посещали среднюю школу в течение четырех лет, но не могут продемонстрировать, что они изучили требуемый материал при написании экзаменов. Оппоненты говорят, что ни один студент, который четыре года отсидел в сидении, не должен быть лишен диплома средней школы только из-за того, что неоднократно провалил тест или даже не знал требуемый материал. [37] [38] [39]
Тесты с высокими ставками обвинялись в том, что они вызывают у учеников и учителей болезни и тревожность перед тестами , а также в том, что учителя решают сузить учебную программу до того, что, по мнению учителя, будет проверяться. В упражнении, разработанном для того, чтобы дети чувствовали себя комфортно во время тестирования, газета из Спокана, штат Вашингтон, опубликовала изображение монстра , который питается страхом. [40] Опубликованное изображение предположительно является ответом ученика, которого попросили нарисовать то, что он думает о государственной оценке.
Другие критики, такие как Дон Орлич из Университета штата Вашингтон , подвергают сомнению использование тестовых заданий, выходящих далеко за рамки стандартных когнитивных уровней для возраста учащихся. [41]
По сравнению с оценками портфолио, простые тесты с несколькими вариантами ответов намного менее затратны, менее подвержены разногласиям между оценщиками и могут быть оценены достаточно быстро, чтобы быть возвращенными до конца учебного года. Стандартизированные тесты (все ученики проходят один и тот же тест в одинаковых условиях) часто используют тесты с несколькими вариантами ответов по этим причинам. Орлич критикует использование дорогих, целостно оцененных тестов, а не недорогих тестов с несколькими вариантами ответов «пузырьковых тестов», чтобы измерить качество как системы, так и отдельных лиц для очень большого количества учеников. [41] Другие известные критики тестирования с высокими ставками включают Fairtest и Alfie Kohn .
Использование тестов IQ было запрещено в некоторых штатах для принятия образовательных решений, а тесты, основанные на нормах , которые ранжируют учащихся от «лучших» до «худших», подвергались критике за предвзятость по отношению к меньшинствам. Большинство должностных лиц в сфере образования поддерживают тесты, основанные на критериях (результаты каждого отдельного учащегося зависят исключительно от того, правильно ли он ответил на вопросы, независимо от того, лучше или хуже справились его соседи) для принятия решений с высокими ставками.
Широко отмечалось, что с появлением социальных сетей и технологий и менталитетов Web 2.0 обучение становится все более совместным, а знания все больше распределяются между многими членами обучающегося сообщества. Однако традиционные методы оценки в значительной степени сосредоточены на личности и не учитывают накопление знаний и обучение в контексте. Поскольку исследователи в области оценки рассматривают культурные сдвиги, возникающие в результате появления более партиципаторной культуры , им необходимо будет найти новые методы применения оценок к учащимся. [42]
Масштабные оценки обучения (LSLA) — это системные оценки, которые дают моментальный снимок успеваемости группы учащихся в определенном году и в ограниченном количестве областей. Их часто относят к национальным или кросс-национальным оценкам, и они привлекают внимание к вопросам, связанным с уровнями обучения и детерминантами обучения, включая квалификацию учителей ; качество школьной среды; родительскую поддержку и руководство; а также социальное и эмоциональное здоровье в школах и за их пределами. [43]
Модель демократического образования Садбери не выполняет и не предлагает оценок, оценок, стенограмм или рекомендаций. Они утверждают, что не оценивают людей, и что школа не является судьей; сравнение учеников друг с другом или с каким-либо установленным стандартом для них является нарушением права ученика на частную жизнь и самоопределение . Учащиеся сами решают, как измерять свой прогресс как самостоятельно начинающих учеников, как процесс самооценки: настоящее непрерывное обучение и надлежащая образовательная оценка для 21-го века, утверждают они. [44]
По данным школ Садбери, эта политика не наносит вреда их ученикам, когда они переходят к жизни за пределами школы. Тем не менее, они признают, что это делает процесс более сложным, но такие трудности являются частью обучения учеников тому, как идти своим путем, устанавливать свои собственные стандарты и достигать своих собственных целей.
Политика отсутствия оценок и рейтингов помогает создать атмосферу, свободную от конкуренции среди студентов или борьбы за одобрение взрослых, и поощряет позитивную атмосферу сотрудничества среди студентов. [45]
Заключительный этап обучения в Садбери, если студент решит его пройти, — выпускная работа. Каждый студент пишет на тему, как он подготовил себя к взрослой жизни и вхождению в общество в целом. Эта работа представляется Ассамблее, которая ее рассматривает. Заключительный этап процесса написания диссертации — устная защита студентом, в которой он предоставляет слово для вопросов, возражений и комментариев от всех членов Ассамблеи. В конце Ассамблея голосует тайным голосованием за то, выдавать или нет диплом. [46]
Основная проблема с использованием образовательных оценок заключается в общей валидности, точности и справедливости, когда речь идет об оценке изучающих английский язык (ELL). Большинство оценок в Соединенных Штатах имеют нормативные стандарты, основанные на англоязычной культуре, которая неадекватно представляет население ELL. [ необходима цитата ] Следовательно, во многих случаях было бы неточно и неуместно делать выводы из нормативных баллов учащихся ELL. Исследования показывают, что большинство школ не вносят должным образом изменения в оценки, чтобы приспособить учащихся с уникальным культурным происхождением. [ необходима цитата ] Это привело к чрезмерному направлению учащихся ELL в специальное образование, в результате чего они непропорционально представлены в программах специального образования. Хотя некоторые могут считать такое ненадлежащее размещение в специальном образовании поддерживающим и полезным, исследования показали, что ненадлежащим образом размещенные учащиеся на самом деле регрессировали в прогрессе. [ необходима цитата ]
Часто необходимо воспользоваться услугами переводчика для проведения оценки на родном языке студента ELL; однако при переводе оценочных пунктов возникает несколько проблем. Одна из проблем заключается в том, что переводы часто могут предлагать правильный или ожидаемый ответ, изменяя сложность оценочного пункта. [47] Кроме того, перевод оценочных пунктов иногда может искажать исходный смысл пункта. [47] Наконец, многие переводчики не имеют квалификации или надлежащей подготовки для работы со студентами ELL в ситуации оценки. [ необходима цитата ] Все эти факторы ставят под угрозу обоснованность и справедливость оценок, делая результаты ненадежными. Невербальные оценки оказались менее дискриминационными для студентов ELL, однако некоторые все еще имеют культурные предубеждения в оценочных пунктах. [47]
При рассмотрении вопроса о специальном образовании для учащегося ELL группа оценки должна объединить и интерпретировать всю собранную информацию, чтобы обеспечить непредвзятое заключение. [47] Решение должно основываться на многомерных источниках данных, включая интервью с учителями и родителями, а также наблюдения за классом. [47] Решения должны учитывать уникальные культурные, языковые и практические особенности учащихся и не должны основываться исключительно на результатах оценки.
Оценка может быть связана с неравенством, когда ученики из традиционно недопредставленных групп исключаются из тестирования, необходимого для доступа к определенным программам или возможностям, как в случае с одаренными программами. Одним из способов борьбы с этим неравенством является всеобщий отбор, который включает тестирование всех учеников (например, на одаренность) вместо тестирования только некоторых учеников на основе рекомендаций учителей или родителей. Всеобщий отбор приводит к значительному увеличению традиционно недооцененных групп (таких как чернокожие, испаноязычные, бедные, женщины и ELLs), идентифицированных для одаренных программ, без каких-либо изменений стандартов идентификации. [48]
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь )Одна из распространенных жалоб от не сдавших тест — то, что их не научили тестируемому материалу в школе. Здесь виновато неадекватное обучение, а не тест. Обвинять тест в своей неудаче — это то же самое, что обвинять автозаправочную станцию в проваленной проверке на смог; это игнорирует основные проблемы в «транспортном средстве обучения».
[ постоянная мертвая ссылка ]
Вина лежит на «тестах с высокими ставками», таких как Stanford 9 и California's High School Exit Exam. Совет ворчит, что опора на такие тесты «несправедливо наказывает учеников, которым не были предоставлены академические инструменты для достижения их наивысшего потенциала на этих тестах».
Судья в Калифорнии собирается отменить выпускной экзамен в средней школе этого штата. Почему? Потому что он работает. Он говорит ученикам, что им нужно больше учиться. Мы называем это полезной информацией. Для истцов, которые подают в суд, чтобы прекратить использование теста в качестве требования для выпуска, это нечто другое: доказательство неравного обращения... выпускной экзамен был признан несправедливым, потому что слишком много учеников, которые провалили тест, имели слишком мало сертифицированных учителей. Ну, может быть, так и было, но выдача им диплома, когда у них нет необходимых знаний, только усугубляет несправедливость, оставляя их с бесполезным листком бумаги.
[ постоянная мертвая ссылка ]
{{cite web}}
: CS1 maint: архивная копия как заголовок ( ссылка )