stringtranslate.com

Образовательная оценка

Образовательная оценка или образовательная оценка [1] — это систематический процесс документирования и использования эмпирических данных о знаниях , навыках , отношениях , склонностях и убеждениях для совершенствования программ и улучшения обучения учащихся. [2] Данные оценки могут быть получены в результате непосредственного изучения работы учащихся для оценки достижения результатов обучения или могут быть основаны на данных, на основе которых можно сделать выводы об обучении. [3] Оценка часто используется как синоним теста, но не ограничивается тестами. [4] Оценка может быть сосредоточена на отдельном учащемся, обучающемся сообществе (классе, семинаре или другой организованной группе учащихся), курсе, академической программе, учебном заведении или образовательной системе в целом (также известное как детализация). . Слово «оценка» вошло в употребление в образовательном контексте после Второй мировой войны . [5]

Будучи непрерывным процессом, оценка устанавливает измеримые и четкие результаты обучения учащихся, предоставляя достаточное количество возможностей обучения для достижения этих результатов, внедряя систематический способ сбора, анализа и интерпретации данных для определения того, насколько обучение учащихся соответствует ожиданиям, и используя собранная информация для улучшения обучения учащихся. [6] Оценивание является важным аспектом образовательного процесса, определяющим уровень достижений обучающихся. [7]

Конечная цель практик оценивания в образовании зависит от теоретических основ практиков и исследователей, их предположений и убеждений о природе человеческого разума, происхождении знаний и процессе обучения.

Типы

Термин «оценка» обычно используется для обозначения всех видов деятельности, которые учителя используют, чтобы помочь учащимся учиться и оценить прогресс учащихся. [8] Для удобства оценки можно разделить на следующие категории:

  1. Размещение, формирующее, суммативное и диагностическое оценивание
  2. Объективное и субъективное
  3. Ссылки (ссылающиеся на критерии, на нормы и ипсативные (принудительный выбор) )
  4. Неформальный и формальный
  5. Внутренний и внешний

Размещение, формирующее, суммирующее и диагностическое

Оценка часто делится на начальную, формирующую и итоговую категории с целью рассмотрения различных целей практики оценивания.

(1) Оценка размещения. Оценка размещения может использоваться для распределения учащихся в соответствии с предыдущими достижениями, уровнем знаний или личными характеристиками в наиболее подходящий момент в учебной последовательности, в уникальную стратегию обучения или к подходящему учителю [9]. ] проводится посредством вступительного тестирования , то есть тестов, которые колледжи и университеты используют для оценки готовности к поступлению в колледж и распределения учащихся в начальные классы. Оценка размещения, также называемая предварительной оценкой, первоначальной оценкой или пороговым тестом знаний (TKT), проводится до обучения или вмешательства, чтобы установить базовый уровень, на основе которого можно измерить индивидуальный рост учащегося. Этот тип оценки используется для определения уровня навыков учащегося по предмету. Это может помочь учителю более эффективно объяснить материал. Эти оценки, как правило, не оцениваются. [10]

(2) Формативное оценивание . Формативное оценивание обычно проводится на протяжении всего курса или проекта. Формативное оценивание, также называемое «образовательным оцениванием», используется для облегчения обучения. В образовательной среде формирующая оценка может проводиться учителем (или коллегой ) или учащимся, обеспечивая обратную связь о работе учащегося, и не обязательно будет использоваться для выставления оценок. Формативное оценивание может принимать форму диагностических, стандартизированных тестов, викторин, устных вопросов или черновых работ. Формативное оценивание проводится одновременно с инструктированием. Результат может иметь значение. Формирующее оценивание направлено на то, чтобы увидеть, понимают ли учащиеся инструкцию, прежде чем проводить итоговую оценку. [10]

(3) Суммативное оценивание . Суммативное оценивание обычно проводится в конце курса или проекта. В образовательных учреждениях суммативное оценивание обычно используется для присвоения учащимся оценки за курс. Суммативное оценивание носит оценочный характер. Суммативное оценивание проводится для того, чтобы подвести итог тому, что учащиеся изучили, и определить, хорошо ли они понимают предмет. Этот тип оценки обычно оценивается по шкале (например, зачтено/не пройдено, 0–100) и может принимать форму тестов, экзаменов или проектов. Суммативное оценивание часто используется для определения того, сдал ли ученик урок или не сдал его. Суммативное оценивание критикуется за то, что оно является редуктивным и учащиеся обнаруживают, насколько хорошо они усвоили знания, слишком поздно, чтобы они могли пригодиться. [10]

(4) Диагностическая оценка. Диагностическая оценка касается всех трудностей, возникающих в конце процесса обучения.

Джей МакТай и Кен О'Коннор предложили семь практик эффективного обучения. [10] Один из них касается демонстрации критериев оценки перед тестом. Другой вопрос касается важности предварительной оценки, чтобы узнать уровень навыков учащегося, прежде чем давать инструкции. Еще одна практика — давать много обратной связи и поощрять.

Исследователь образования Роберт Стейк [11] объясняет разницу между формирующим и суммативным оцениванием следующей аналогией:

Когда повар пробует суп, это формирует. Когда гости пробуют суп, это подводит итог. [12]

Суммативное и формирующее оценивание в контексте обучения часто называют оценкой обучения и оценкой обучения соответственно. Оценка обучения, как правило, носит суммирующий характер и предназначена для измерения результатов обучения и сообщения о них учащимся, родителям и администраторам. Оценка обучения обычно происходит в конце класса, курса, семестра или учебного года. Оценка обучения, как правило, носит формирующий характер и используется учителями для рассмотрения подходов к преподаванию и последующих шагов для отдельных учащихся и класса. [13]

Распространенной формой формативного оценивания является диагностическое оценивание . Диагностическая оценка измеряет текущие знания и навыки учащегося с целью определения подходящей программы обучения. Самооценка – это форма диагностического оценивания, при которой учащиеся оценивают себя. Перспективная оценка требует от оцениваемых рассмотреть себя в гипотетических будущих ситуациях. [14]

Оценка, основанная на результатах, аналогична суммирующей оценке, поскольку она фокусируется на достижениях. Это часто согласуется с реформой образования, основанной на стандартах, и движением за образование, основанное на результатах . Хотя в идеале они значительно отличаются от традиционного теста с множественным выбором, они чаще всего связаны с оценкой, основанной на стандартах , в которой используются ответы в свободной форме на стандартные вопросы, оцениваемые людьми по стандартной шкале, соответствующие, опускающиеся ниже или превышающие стандарт производительности, а не ранжирование по кривой. Определяется четко определенная задача, и учащихся просят создать, произвести или сделать что-то, часто в условиях, предполагающих практическое применение знаний и навыков. Мастерство демонстрируется предоставлением расширенного ответа. Форматы выступлений далее дифференцируются на продукты и выступления. Результатом исполнения может быть продукт, такой как картина, портфолио, статья или выставка, или оно может состоять из выступления, например выступления, спортивных навыков, музыкального выступления или чтения.

Объективное и субъективное

Оценку (обобщающую или формирующую) часто подразделяют на объективную и субъективную. Объективная оценка – это форма опроса, предполагающая единственный правильный ответ. Субъективная оценка – это форма опроса, при которой может быть более одного правильного ответа (или более одного способа выражения правильного ответа). Существуют различные типы объективных и субъективных вопросов. Типы объективных вопросов включают вопросы «верно/неверно», вопросы с множественным выбором , вопросы с множественными ответами и вопросы на совпадение. Субъективные вопросы включают вопросы с расширенным ответом и эссе. Объективная оценка хорошо подходит для набирающего популярность компьютерного или онлайн-формата оценки .

Некоторые утверждают, что различие между объективными и субъективными оценками не является ни полезным, ни точным, поскольку в действительности не существует такого понятия, как «объективная» оценка. Фактически, все оценки создаются с учетом присущих им предубеждений, заложенных в решениях относительно соответствующего предмета и содержания, а также культурных (классовых, этнических и гендерных) предубеждений. [15]

Основа сравнения

Результаты теста можно сравнивать с установленным критерием, с успеваемостью других учащихся или с предыдущими достижениями:


(5) Оценка, основанная на критериях , обычно использующая тест, основанный на критериях , как следует из названия, происходит, когда кандидаты оцениваются по определенным (и объективным) критериям. Критериальная оценка часто, но не всегда, используется для установления компетентности человека (может ли он/она что-то сделать). Самым известным примером оценки на основе критериев является экзамен по вождению, когда водители-ученики оцениваются по ряду четких критериев (например, «Не подвергать опасности других участников дорожного движения»).

(6) Оценка, основанная на нормах (в просторечии известная как « оценка по кривой »), обычно с использованием теста, основанного на нормах , не измеряется по определенным критериям. Этот тип оценки относится к студенческому составу, проводящему оценку. По сути, это способ сравнения студентов. Тест IQ — самый известный пример оценки, основанной на нормах. Многие вступительные тесты (в престижные школы или университеты) привязаны к нормам, что позволяет пройти фиксированной доле учащихся («сдача» в этом контексте означает поступление в школу или университет, а не определенный уровень способностей). Это означает, что стандарты могут меняться из года в год в зависимости от качества когорты; критериальная оценка не меняется из года в год (если только критерии не меняются). [16]

(7) Ипсативное оценивание – это самосравнение либо в одной и той же области с течением времени, либо с другими областями одного и того же учащегося.

Неформальный и формальный

Оценка может быть формальной или неформальной . Формальная оценка обычно подразумевает письменный документ, например тест, викторину или бумагу. При формальной оценке присваивается числовой балл или оценка, основанная на успеваемости учащегося, тогда как неформальная оценка не влияет на итоговую оценку учащегося. Неформальная оценка обычно происходит в более непринужденной форме и может включать наблюдение, инвентаризацию, контрольные списки, рейтинговые шкалы, рубрики , оценку эффективности и портфолио, участие, коллегиальную и самооценку, а также обсуждение. [17]

Внутренний и внешний

Внутренняя оценка устанавливается и выставляется школой (т.е. учителями). Учащиеся получают оценку и обратную связь по поводу оценки. Внешняя оценка устанавливается руководящим органом и выставляется непредвзятым персоналом. Некоторые внешние оценки дают гораздо более ограниченную обратную связь при выставлении оценок. Однако в таких тестах, как австралийский NAPLAN, критерию, к которому обращаются учащиеся, предоставляется подробная обратная связь, чтобы учителя могли рассмотреть и сравнить учебные достижения учащегося, а также спланировать будущее.

Стандарты качества

В целом, высококачественными оценками считаются оценки с высоким уровнем надежности и валидности . Другими общими принципами являются практичность , аутентичность и возврат. [18] [19]

Надежность

Надежность связана с последовательностью оценки. Надежная оценка – это оценка, которая последовательно достигает одних и тех же результатов с одной и той же (или похожей) группой учащихся. На надежность влияют различные факторы, в том числе двусмысленные вопросы, слишком много вариантов в вопроснике, расплывчатые инструкции по выставлению оценок и плохо подготовленные маркеры. Традиционно надежность оценки основывается на следующем:

  1. Временная стабильность: результаты теста сравнимы в двух или более отдельных случаях.
  2. Эквивалентность формы: результаты экзаменуемых эквивалентны в различных формах теста, основанных на одном и том же содержании.
  3. Внутренняя согласованность: ответы в тесте одинаковы на всех вопросах. Например: в опросе, в котором респондентов просят оценить отношение к технологиям, следует ожидать последовательности в ответах на следующие вопросы:
    • «Я очень негативно отношусь к компьютерам в целом».
    • «Мне нравится пользоваться компьютерами». [20]

Надежность измерения x также можно определить количественно как: где – надежность наблюдаемого (тестового) балла x; и представляют собой изменчивость «истинных» (т. е. врожденных результатов кандидата) и измеренных результатов тестов соответственно. может принимать значения от 0 (полностью ненадежно) до 1 (полностью достоверно).

Существует четыре типа надежности: связанная со студентом, которая может быть связана с личными проблемами, болезнью или усталостью , связанная с оценщиком, которая включает в себя предвзятость и субъективность , связанная с проведением теста, которая является условиями процесса сдачи теста, связанная с тестированием, которая в основном связана с к характеру теста. [21] [18] [22]

Период действия

Валидная оценка – это та, которая измеряет то, для измерения чего предназначена. Например, было бы неправильно оценивать навыки вождения только с помощью письменного теста. Более достоверный способ оценки навыков вождения — это сочетание тестов, которые помогают определить, что знает водитель, например, посредством письменного теста на знание вождения, и того, что водитель умеет делать, например, посредством оценки фактических навыков вождения. вождение. Учителя часто жалуются, что некоторые экзамены не дают должной оценки учебной программе , на которой основан экзамен; они, по сути, ставят под сомнение достоверность экзамена.

Обоснованность оценки обычно оценивается путем изучения доказательств в следующих категориях:

  1. Валидность содержания . Соответствует ли содержание теста заявленным целям?
  2. Критерий валидности – коррелируют ли оценки с внешними данными? (пример: точно ли высокие баллы на тесте по чтению в 4-м классе предсказывают навыки чтения в будущих классах?)
  3. Конструктивная валидность – соответствует ли оценка другим значимым переменным? (Пример: Постоянно ли учащиеся ESL сдают письменный экзамен иначе, чем носители английского языка?) [23]

Другие: [18] [21]

Хорошая оценка обладает как достоверностью, так и надежностью, а также другими качествами, отмеченными выше для конкретного контекста и цели. На практике оценка редко бывает полностью валидной или абсолютно надежной. Линейка с неправильной разметкой всегда будет давать одни и те же (неправильные) измерения. Это очень надежно, но не очень валидно. Просьбу случайных людей определить время, не глядя на часы, иногда используется как пример валидной, но ненадежной оценки. Ответы будут различаться у разных людей, но средний ответ, вероятно, близок к фактическому времени. Во многих областях, таких как медицинские исследования, образовательное тестирование и психология, часто приходится искать компромисс между надежностью и достоверностью. Тест по истории, написанный для высокой валидности, будет включать в себя много вопросов-эссе и вопросов для заполнения пропусков. Это будет хорошим показателем владения предметом, но получить абсолютно точную оценку сложно. Исторический тест, написанный с высокой надежностью, будет полностью множественным выбором. Он не так хорош для измерения знаний по истории, но его легко оценить с большой точностью. Мы можем сделать из этого обобщение. Чем более надежна наша оценка того, что мы намереваемся измерить, тем менее мы уверены, что действительно измеряем этот аспект достижений.

Следует различать «предметную» валидность и «прогностическую» валидность. Первый метод, широко используемый в образовании, предсказывает, какой балл получит учащийся за аналогичный тест, но с другими вопросами. Последний, широко используемый на рабочем месте, предсказывает производительность. Таким образом, целесообразным является предметно-действительный тест на знание правил вождения, тогда как прогнозно-действительный тест позволит оценить, может ли потенциальный водитель следовать этим правилам.

Практичность

Этот принцип относится к временным и финансовым ограничениям во время разработки и применения инструмента оценки. [18] Это означает, что проведение теста должно быть экономичным . Формат теста должен быть простым для понимания. Более того, решение теста должно оставаться в пределах подходящего времени. В целом он прост в администрировании. Процедура ее оценки должна быть конкретной и эффективной по времени. [22]

Подлинность

Инструмент оценки является аутентичным, если он контекстуализирован, содержит естественный язык и содержательную, актуальную и интересную тему, а также воспроизводит реальный опыт. [18]

обратная вода

Этот принцип относится к последствиям оценки преподавания и обучения в классах. [18] Возврат может быть положительным и отрицательным. Положительная обратная связь относится к желаемым эффектам теста, а отрицательная обратная связь относится к отрицательным последствиям теста. Чтобы получить положительный результат, можно использовать планирование обучения. [24]

Стандарты оценки

В области оценки , и в частности оценки образования в Северной Америке, Объединенный комитет по стандартам оценки образования опубликовал три набора стандартов оценки. Стандарты оценки персонала были опубликованы в 1988 году, [25] Стандарты оценки программ (2-е издание) были опубликованы в 1994 году, [26] а Стандарты оценки студентов были опубликованы в 2003 году. [27]

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат рекомендации по разработке, внедрению, оценке и совершенствованию определенной формы оценки. Каждый из стандартов отнесен к одной из четырех основных категорий, чтобы обеспечить правильность, полезность, осуществимость и точность образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в рамках темы точности. Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.

В Великобритании существует награда в области обучения, оценки и обеспечения качества (TAQA), которая помогает сотрудникам изучать и развивать передовую практику оценки образования в контексте образования и обучения взрослых, дальнейшего обучения и на рабочем месте. [28]

Сводная таблица основных теоретических основ

В следующей таблице суммированы основные теоретические основы, лежащие в основе почти всех теоретических и исследовательских работ, а также педагогической практики в образовании (одной из них, конечно же, является практика оценивания). Эти различные концепции вызвали интересные дебаты среди ученых.

Споры

Обеспокоенность по поводу того, как лучше всего применять методы оценивания в системах государственных школ, в основном сосредоточена на вопросах использования комплексного тестирования и стандартизированных тестов, которые часто используются для оценки успеваемости учащихся, качества учителей и успехов в образовании на уровне школы, округа или штата. .

Ни один ребенок не останется позади

Для большинства исследователей и практиков вопрос не в том, следует ли вообще проводить тесты — существует общее мнение, что, если проводить их полезным образом, тесты могут предоставить полезную информацию об успеваемости учащихся и выполнении учебной программы, а также предложить формирующее использование для учащиеся. [29] Таким образом, реальный вопрос заключается в том, могут ли методы тестирования в том виде, в каком они применяются в настоящее время, предоставить эти услуги преподавателям и студентам.

Президент Буш подписал Закон «Ни один ребенок не останется без внимания» (NCLB) 8 января 2002 года. Закон NCLB повторно утвердил Закон о начальном и среднем образовании (ESEA) 1965 года. Президент Джонсон подписал ESEA, чтобы помочь в борьбе с бедностью и помочь финансировать начальное образование. и средние школы. Целью президента Джонсона было подчеркнуть равный доступ к образованию и установить высокие стандарты и подотчетность. Закон NCLB требовал от штатов проводить оценку базовых навыков. Чтобы получить федеральное финансирование школ, штаты должны были дать эти оценки всем учащимся в выбранном классе.

В США Закон «Ни один ребенок не останется без внимания» требует стандартизированного тестирования по всей стране. Эти тесты соответствуют учебной программе штата и связывают ответственность учителей, учащихся, округа и штата за результаты этих тестов. Сторонники NCLB утверждают, что она предлагает реальный метод оценки успехов в образовании, привлечения учителей и школ к ответственности за плохие результаты и сокращения разрыва в успеваемости между классами и этническими группами. [30]

Противники стандартизированного тестирования оспаривают эти утверждения, утверждая, что привлечение преподавателей к ответственности за результаты тестов приводит к практике « обучения в соответствии с тестом ». Кроме того, многие утверждают, что акцент на стандартизированном тестировании побуждает учителей вооружать учащихся узким набором навыков, которые повышают эффективность тестов, но на самом деле не способствуют более глубокому пониманию предмета или ключевых принципов в области знаний. [31]

Тестирование с высокими ставками

Оценки, вызвавшие наибольшее противоречие в США, — это использование выпускных экзаменов средней школы , которые используются для отказа в выдаче дипломов учащимся, которые посещали среднюю школу в течение четырех лет, но не могут продемонстрировать, что они усвоили необходимый материал при написании экзаменов. . Оппоненты утверждают, что ни одному учащемуся, отучившемуся четыре года обучения, не должно быть отказано в аттестате средней школы только из-за неоднократного провала на экзамене или даже из-за незнания необходимого материала. [32] [33] [34]

Тесты с высокими ставками обвиняют в том, что они вызывают болезни и беспокойство перед экзаменами у учащихся и учителей, а также в том, что учителя решают сузить учебную программу до того, что, по мнению учителя, будет проверяться. В ходе упражнения, предназначенного для того, чтобы дети чувствовали себя комфортно во время тестирования, газета Спокана, штат Вашингтон, опубликовала изображение монстра , питающегося страхом. [35] Опубликованное изображение предположительно является ответом студентки, которую попросили нарисовать, что она думает о государственной аттестации.

Другие критики, такие как Дон Орлих из Университета штата Вашингтон , ставят под сомнение использование тестовых заданий, выходящих далеко за рамки стандартных когнитивных уровней для учащихся возраста. [36]

По сравнению с оценкой портфолио, простые тесты с несколькими вариантами ответов намного дешевле, менее подвержены разногласиям между оценивающими и могут быть оценены достаточно быстро, чтобы вернуться до конца учебного года. По этим причинам в стандартизированных тестах (все учащиеся сдают один и тот же тест в одинаковых условиях) часто используются тесты с несколькими вариантами ответов. Орлич критикует использование дорогих тестов с целостной оценкой вместо недорогих «пузырьковых тестов» с несколькими вариантами ответов для измерения качества как системы, так и отдельных лиц для очень большого числа студентов. [36] Среди других известных критиков тестирования с высокими ставками можно назвать Fairtest и Alfie Kohn .

Использование тестов IQ было запрещено в некоторых штатах при принятии образовательных решений, а тесты, основанные на нормах , которые ранжируют учащихся от «лучших» до «худших», подвергались критике за предвзятость в отношении меньшинств. Большинство чиновников от образования поддерживают тесты, основанные на критериях (баллы каждого отдельного учащегося зависят исключительно от того, правильно ли он ответил на вопросы, независимо от того, лучше или хуже справились его соседи) для принятия важных решений.

Оценка 21 века

Широко отмечено, что с появлением социальных сетей , технологий и мышления Web 2.0 обучение становится все более совместным, а знания все чаще распределяются между многими членами учебного сообщества. Однако традиционные методы оценки в значительной степени ориентированы на человека и не учитывают накопление знаний и обучение в контексте. Поскольку исследователи в области оценивания рассматривают культурные сдвиги, возникающие в результате появления культуры более широкого участия , им необходимо будет найти новые методы применения оценивания к учащимся. [37]

Масштабная оценка обучения

Крупномасштабные оценки обучения (LSLA) — это оценки на уровне системы, которые предоставляют моментальную картину успеваемости группы учащихся за определенный год и в ограниченном количестве областей. Их часто относят к национальным или межнациональным оценкам и привлекают внимание к вопросам, связанным с уровнями обучения и определяющими факторами обучения, включая квалификацию учителей ; качество школьной среды; родительская поддержка и руководство; социальное и эмоциональное здоровье в школах и за их пределами. [38]

Оценка в демократической школе

Школы демократического образования модели Садбери не работают и не предлагают оценок, оценок, стенограмм или рекомендаций. Они утверждают, что не оценивают людей и что школа не судья; сравнение учащихся друг с другом или с каким-либо установленным стандартом является для них нарушением права учащегося на неприкосновенность частной жизни и на самоопределение . Студенты сами решают, как измерять свой прогресс в качестве самостоятельного ученика, используя процесс самооценки: настоящее обучение на протяжении всей жизни и правильная образовательная оценка для 21-го века, утверждают они. [39]

По мнению школ Садбери, эта политика не причиняет вреда их ученикам, поскольку они переходят к жизни за пределами школы. Однако они признают, что это усложняет процесс, но такие трудности являются частью того, что студенты учатся идти своим путем, устанавливать свои собственные стандарты и достигать своих собственных целей.

Политика отсутствия оценок и оценок помогает создать атмосферу, свободную от конкуренции среди учащихся и борьбы за одобрение взрослых, а также способствует созданию позитивной атмосферы сотрудничества среди учащихся. [40]

Заключительным этапом обучения в Садбери, если студент решит его пройти, является дипломная работа. Каждый ученик пишет на тему того, как он подготовил себя к взрослой жизни и вхождению в общество в целом. Этот тезис представляется Ассамблее, которая его рассматривает. Заключительным этапом работы над диссертацией является устная защита студента, в ходе которой он предоставляет слово для вопросов, проблем и комментариев от всех членов Ассамблеи. В конце Ассамблея тайным голосованием решает, присуждать ли диплом. [41]

Оценка учащихся ELL

Основная проблема, связанная с использованием образовательных оценок, заключается в общей достоверности, точности и справедливости, когда речь идет об оценке изучающих английский язык (ELL). Большинство оценок в Соединенных Штатах имеют нормативные стандарты, основанные на англоязычной культуре, которая не отражает адекватно население ELL. [ нужна ссылка ] Следовательно, во многих случаях было бы неточно и неуместно делать выводы на основе нормативных оценок учащихся ELL. Исследования показывают, что большинство школ не меняют методы оценки должным образом, чтобы учесть учащихся с уникальным культурным прошлым. [ нужна цитата ] Это привело к чрезмерному направлению учащихся ELL на специальное образование, в результате чего они были непропорционально представлены в программах специального образования. Хотя некоторые могут рассматривать такое неподходящее размещение в специальном образовании как поддержку и помощь, исследования показали, что учащиеся, попавшие в неподходящее место, на самом деле регрессировали в прогрессе. [ нужна цитата ]

Часто бывает необходимо воспользоваться услугами переводчика, чтобы провести оценивание на родном языке учащегося ELL; однако при переводе элементов оценки возникает ряд проблем. Одна из проблем заключается в том, что переводы часто могут подсказывать правильный или ожидаемый ответ, меняя сложность задания. [42] Кроме того, перевод элементов оценивания иногда может исказить первоначальный смысл элемента. [42] Наконец, многие переводчики не имеют квалификации или надлежащей подготовки для работы со студентами ELL в ситуации оценивания. [ нужна цитата ] Все эти факторы ставят под угрозу достоверность и справедливость оценок, делая результаты ненадежными. Невербальные оценки оказались менее дискриминационными для учащихся ELL, однако некоторые из них все еще демонстрируют культурные предубеждения в рамках оценочных заданий. [42]

При выборе учащегося ELL для получения специального образования группа по оценке должна интегрировать и интерпретировать всю собранную информацию, чтобы обеспечить непредвзятое заключение. [42] Решение должно быть основано на многомерных источниках данных, включая интервью с учителями и родителями, а также наблюдения в классе. [42] Решения должны принимать во внимание уникальные культурные, языковые и практические особенности учащихся и не должны основываться строго на результатах оценивания.

Универсальный скрининг

Оценка может быть связана с неравенством, когда учащиеся из традиционно недостаточно представленных групп исключаются из тестирования, необходимого для доступа к определенным программам или возможностям, как в случае с программами для одаренных детей . Одним из способов борьбы с этим неравенством является всеобщий скрининг, который предполагает тестирование всех учащихся (например, на предмет одаренности), а не тестирование только некоторых учащихся на основе рекомендаций учителей или родителей. Всеобщий скрининг приводит к значительному увеличению числа традиционно недостаточно обслуживаемых групп (таких как чернокожие, латиноамериканцы, бедные, женщины и ELL), отобранных для участия в программах для одаренных людей, без какого-либо изменения стандартов идентификации. [43]

Смотрите также

Рекомендации

  1. ^ Некоторые преподаватели и теоретики образования используют термины «оценка» и «оценка» для обозначения различных концепций тестирования во время процесса обучения с целью его улучшения (для чего предпочтительны одинаково однозначные термины « формирующее оценивание » или «формирующее оценивание ») и тестирования после завершения обучения. процесс (для которого предпочтительнее одинаково однозначные термины суммативное оценивание или суммативное оценивание ), но на самом деле они являются синонимами и по своей сути не означают разные вещи. Большинство словарей не только говорят, что эти термины являются синонимами, но и используют их для определения друг друга. Если термины используются для разных понятий, тщательное редактирование требует как пояснения того, что они обычно являются синонимами, так и пояснения того, что они используются для обозначения разных понятий в текущем тексте.
  2. ^ Аллен, MJ (2004). Оценка академических программ высшего образования . Сан-Франциско: Джосси-Басс.
  3. ^ Кух, Г.Д.; Янковский, Н.; Икенберри, Т.О. (2014). Знание того, что знают и могут делать студенты: текущее состояние оценки результатов обучения в колледжах и университетах США (PDF) . Урбана: Университет Иллинойса и Университет Индианы, Национальный институт оценки результатов обучения.
  4. ^ Национальный совет по измерению в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorA. Архивировано 2017–07. -22 в Wayback Machine
  5. ^ Нельсон, Роберт; Доусон, Филипп (2014). «Вклад в историю оценивания: как симулятор разговора искупает сократический метод». Оценка и оценка в высшем образовании . 39 (2): 195–204. дои : 10.1080/02602938.2013.798394. S2CID  56445840.
  6. ^ Саски, Линда (2004). Оценка обучения учащихся . Болтон, Массачусетс: Анкер.
  7. ^ Оксфордский университет Брукса. «Цели и принципы оценивания». www.brookes.ac.uk . Проверено 9 октября 2018 г.
  8. ^ Блэк, Пол, и Уильям, Дилан (октябрь 1998 г.). «Внутри черного ящика: повышение стандартов посредством оценивания в классе». Фи Бета Каппан. Доступно по адресу http://www.pdkmembers.org/members_online/members/orders.asp?action=results&t=A&desc=Inside+the+Black+Box%3A+Raising+Standards+Through+Classroom+Assessment&text=&lname_1=&fname_1= &lname_2=&fname_2=&kw_1=&kw_2=&kw_3=&kw_4=&mn1=&yr1=&mn2=&yr2=&c1= [ постоянная мертвая ссылка ] PDKintl.org]. Проверено 28 января 2009 г.
  9. ^ Мадаус, Джордж Ф.; Айразиан, Питер В. (30 ноября 1969 г.). «Размещение, формативная, диагностическая и итоговая оценка обучения в классе». {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  10. ^ abcd Мактай, Джей; О'Коннор, Кен (ноябрь 2005 г.). «Семь практик эффективного обучения». Образовательное лидерство . 63 (3): 10–17 . Проверено 3 марта 2017 г.
  11. ^ "Роберт Э. Стейк, директор" . Архивировано из оригинала 8 февраля 2009 г. Проверено 29 января 2009 г.
  12. ^ Скривен, М. (1991). Оценочный тезаурус. 4-е изд. Ньюбери-Парк, Калифорния: Публикации SAGE . ISBN 0-8039-4364-4
  13. ^ Эрл, Лорна (2003). Оценка как обучение: использование оценки в классе для максимизации обучения учащихся. Таузенд-Оукс, Калифорния, Corwin Press. ISBN 0-7619-4626-8 
  14. ^ Рид, Дэниел. «Диагностическая оценка в преподавании и изучении языка». Центр языкового образования и исследований, доступен на Google.com. Архивировано 14 сентября 2011 г. на Wayback Machine . Проверено 28 января 2009 г.
  15. ^ Объединенный комитет информационных систем (JISC). «Что мы подразумеваем под электронной оценкой?» JISC InfoNet. Получено 29 января 2009 г. с http://tools.jiscinfonet.ac.uk/downloads/vle/eassessment-printable.pdf. Архивировано 16 января 2017 г. на Wayback Machine.
  16. ^ Образовательные технологии в Технологическом институте Вирджинии. «Цели оценки». VirginiaTech DesignShop: Уроки эффективного преподавания, доступно на Edtech.vt.edu. Архивировано 26 февраля 2009 г. в Wayback Machine . Проверено 29 января 2009 г.
  17. ^ Валенсия, Шейла В. «Каковы различные формы подлинной оценки?» Понимание подлинной оценки грамотности в классе (1997), доступно на Eduplace.com. Проверено 29 января 2009 г.
  18. ^ abcdef Браун, Дуглас; Абейвикрама, Приянвада (2010). Языковая оценка, принципы и практика занятий в классе . Соединенные Штаты Америки: Пирсон Лонгман. ISBN 978-0-13-814931-4.
  19. ^ Оксфордский университет Брукса. «Принципы оценивания». www.brookes.ac.uk . Проверено 9 октября 2018 г.
  20. ^ Ю, Чонг Хо (2005). "Надежность и достоверность." Образовательная оценка. Доступно на Creative-wisdom.com. Проверено 29 января 2009 г.
  21. ^ аб Фосетт, Элисон (2013). Принципы оценки и измерения результатов для эрготерапевтов и физиотерапевтов: теория, навыки и применение . Джон Уайли и сыновья. ISBN 9781118709696.
  22. ^ ab «Надежность, достоверность и практичность | Преподавайте английский | Englishpost.org». Englishpost.org . 26 июня 2012 г. Проверено 30 октября 2018 г.
  23. ^ Москаль, Барбара; Лейденс, Джон (23 ноября 2019 г.). «Разработка рубрики оценки: достоверность и надежность». Практическая оценка, исследования и оценка . 7 (1). дои : 10.7275/q7rm-gg74.
  24. ^ «Понимание оценки: возврат и планирование обучения». www.cal.org . Проверено 29 октября 2018 г.
  25. ^ Объединенный комитет по стандартам оценки образования. (1988). «Стандарты оценки персонала: как оценивать системы оценки преподавателей». Ньюбери-Парк, Калифорния: Публикации SAGE
  26. ^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ , 2-е издание. Ньюбери-Парк, Калифорния: Публикации SAGE
  27. ^ Комитет по стандартам оценки образования. (2003). Стандарты оценки учащихся: как улучшить оценки учащихся . Ньюбери-Парк, Калифорния: Corwin Press
  28. ^ City & Guilds, Понимание принципов и практики оценки: информационный бюллетень о квалификациях, по состоянию на 26 февраля 2020 г.
  29. ^ Американская психологическая ассоциация. «Соответствующее использование тщательного тестирования в школах нашей страны». APA Online, доступно на APA.org, дата обращения 24 января 2010 г.
  30. ^ (nd) Повторная авторизация NCLB. Отдел образования. Проверено 29 января 2009 г.
  31. ^ (nd) Что не так со стандартизированным тестированием? FairTest.org. Проверено 29 января 2009 г.
  32. Данг, Ник (18 марта 2003 г.). «Реформировать образование, а не выпускные экзамены». Ежедневный Брюин . Одна из распространенных жалоб со стороны тех, кто не сдал экзамен, заключается в том, что им не преподавали тестируемый материал в школе. Здесь виновато неадекватное обучение, а не тесты. Обвинять тест в своей неудаче — все равно, что обвинять станцию ​​технического обслуживания в неудавшейся проверке смога; он игнорирует основные проблемы внутри «учебной машины».[ постоянная мертвая ссылка ]
  33. ^ Вайнкопф, Крис (2002). «Во всем виноват тест: LAUSD отрицает ответственность за низкие результаты». Ежедневные новости . Вина лежит на «тестах с высокими ставками», таких как Стэнфордский девятый выпускной экзамен и выпускной экзамен в средней школе Калифорнии. Комиссия ворчит, что использование таких тестов «несправедливо наказывает студентов, которым не предоставлены академические инструменты, позволяющие максимально раскрыть свой потенциал на этих тестах».
  34. ^ «Обвинение теста». Деловая газета инвестора . 11 мая 2006 г. Судья в Калифорнии собирается отменить выпускной экзамен в средней школе этого штата. Почему? Потому что это работает. Это говорит студентам, что им нужно учиться больше. Мы называем это полезной информацией. Для истцов, которые подают в суд с требованием прекратить использование теста в качестве требования к выпускному экзамену, это нечто иное: доказательства неравного обращения... выпускной экзамен был признан несправедливым, потому что у слишком многих студентов, проваливших тест, было слишком мало дипломированных учителей. Ну, может быть, и так, но выдача им диплома, когда у них нет необходимых знаний, только усугубляет несправедливость, оставляя им бесполезный клочок бумаги».[ постоянная мертвая ссылка ]
  35. ^ "ASD.wednet.edu" . Архивировано из оригинала 25 февраля 2007 г. Проверено 22 сентября 2006 г.
  36. ^ аб Бах, Дебора и Бланшар, Джессика (19 апреля 2005 г.). «WASL беспокоится о стрессе у детей и школ». Сиэтлский пост-разведчик. Получено 30 января 2009 г. с сайта Seattlepi.nwsource.com.
  37. Фадель, Чарльз, Хани, Маргарет и Пасник, Шелли (18 мая 2007 г.). «Оценка в эпоху инноваций». Неделя образования. Получено 29 января 2009 г. с http://www.edweek.org/ew/articles/2007/05/23/38fadel.h26.html.
  38. ^ ЮНЕСКО (2019). Перспективы крупномасштабных оценок обучения: признание ограничений для раскрытия возможностей. ЮНЕСКО. ISBN 978-92-3-100333-2.
  39. ^ Гринберг, Д. (2000). Школы 21-го века, отредактированная стенограмма выступления, прозвучавшего на Международной конференции по обучению в 21-м веке в апреле 2000 г.
  40. ^ Гринберг, Д. (1987). Глава 20. Оценка, наконец-то бесплатно — Школа Садбери-Вэлли.
  41. ^ Порядок написания дипломной работы, Школа Маунтин-Лорел Садбери.
  42. ^ abcde «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 29 мая 2012 г. Проверено 11 апреля 2012 г.{{cite web}}: CS1 maint: archived copy as title (link)
  43. ^ Кард Д. и Джулиано Л. (2015). Может ли всеобщий скрининг увеличить долю учащихся с низкими доходами и представителей меньшинств в системе образования для одаренных детей? (Рабочий документ № 21519). Кембридж, Массачусетс: Национальное бюро экономических исследований. Получено с www.nber.org/papers/w21519.

Источники

дальнейшее чтение