Оценка образования

Образовательная оценка или образовательная оценка ^[1] - это систематический процесс документирования и использования эмпирических данных о знаниях , навыках , отношениях , способностях и убеждениях для совершенствования программ и улучшения обучения учащихся. ^[2] Данные оценки могут быть получены путем непосредственного изучения работы учащихся для оценки достижения результатов обучения или основаны на данных, из которых можно сделать выводы об обучении. ^[3] Оценка часто используется взаимозаменяемо с тестом, но не ограничивается тестами. ^[4] Оценка может быть сосредоточена на отдельном учащемся, учебном сообществе (классе, семинаре или другой организованной группе учащихся), курсе, академической программе, учреждении или образовательной системе в целом (также известном как гранулярность). Слово «оценка» вошло в употребление в образовательном контексте после Второй мировой войны . ^[5]

Как непрерывный процесс, оценка устанавливает измеримые результаты обучения учащихся, предоставляет достаточное количество возможностей для обучения для достижения этих результатов, реализует систематический способ сбора, анализа и интерпретации доказательств для определения того, насколько хорошо обучение учащихся соответствует ожиданиям, и использует собранную информацию для предоставления обратной связи по улучшению обучения учащихся. ^[6] Оценка является важным аспектом образовательного процесса, который определяет уровень достижений учащихся. ^[7]

Конечная цель методов оценки в образовании зависит от теоретической базы практиков и исследователей, их предположений и убеждений относительно природы человеческого разума, происхождения знаний и процесса обучения.

Типы

Термин «оценка» обычно используется для обозначения всех видов деятельности, которые учителя используют для помощи учащимся в обучении и для оценки прогресса учащихся. ^[8] Оценку можно разделить для удобства, используя следующие категории:

Размещение, формирующее, итоговое и диагностическое оценивание
Объективное и субъективное
Референтность (критериальная, нормо-ориентированная и ипсативная (принудительный выбор) )
Неформальные и формальные
Внутренние и внешние

Размещение, формирующее, обобщающее и диагностическое

Оценку часто делят на начальную, формирующую и итоговую категории с целью рассмотрения различных целей практики оценки.

(1) Оценка размещения – Оценка размещения может использоваться для размещения студентов в соответствии с предыдущими достижениями или уровнем знаний, или личными характеристиками, в наиболее подходящей точке в учебной последовательности, в уникальной учебной стратегии или с подходящим учителем ^[9], проводимой посредством тестирования размещения , т. е. тестов, которые колледжи и университеты используют для оценки готовности к колледжу и размещения студентов в их начальных классах. Оценка размещения, также называемая предварительной оценкой, начальной оценкой или пороговым тестом знаний (TKT), проводится до обучения или вмешательства, чтобы установить исходный уровень, от которого можно измерить индивидуальный рост студента. Этот тип оценки используется, чтобы узнать, каков уровень навыков студента по предмету, он также может помочь учителю более эффективно объяснять материал. Эти оценки, как правило, не оцениваются. ^[10]

(2) Формативное оценивание – обычно проводится на протяжении всего курса или проекта. Его также называют «образовательным оцениванием», которое используется для помощи в обучении. В образовательной среде формирующее оценивание может проводиться учителем (или коллегой ) или учащимся (например, посредством самооценки ^[11]^[12] ), предоставляя обратную связь по работе учащегося и не обязательно будет использоваться для целей выставления оценок. Формативное оценивание может принимать форму диагностических, стандартизированных тестов, викторин, устных вопросов или черновиков. Формативное оценивание проводится одновременно с инструкциями, и результаты могут учитываться. Целью формирующего оценивания является проверка того, понимают ли учащиеся инструкцию, прежде чем проводить итоговое оценивание. ^[10]

(3) Суммативное оценивание – обычно проводится в конце курса или проекта. В образовательной среде суммативные оценки обычно используются для выставления студентам оценки за курс и являются оценочными. Суммативное оценивание проводится для подведения итогов того, что студенты узнали, чтобы узнать, хорошо ли они понимают предмет. Этот тип оценки обычно оценивается по шкале (например, сдал/не сдал, 0–100) и может принимать форму тестов, экзаменов или проектов. Суммативное оценивание в основном используется для определения того, сдал или не сдал студент курс. Критика суммарных оценок заключается в том, что они являются упрощенными, и учащиеся обнаруживают, насколько хорошо они усвоили знания, слишком поздно, чтобы они были полезны. ^[10]

(4) Диагностическая оценка. В конце диагностическая оценка фокусируется на всех трудностях, возникших в процессе обучения.

Джей МакТай и Кен О'Коннор предложили семь практик эффективного обучения. ^[10] Одна из них — демонстрация критериев оценки перед тестом, а другая — важность предварительной оценки, чтобы знать уровень навыков ученика, прежде чем давать инструкции. Предоставление большого количества обратной связи и поощрений — это другие практики.

Исследователь в области образования Роберт Стейк ^[13] объясняет разницу между формирующим и итоговым оцениванием с помощью следующей аналогии:

Когда повар пробует суп, это формирующее. Когда гости пробуют суп, это суммирующее. ^[14]

Суммативное и формирующее оценивание часто упоминаются в контексте обучения как оценка обучения и оценка для обучения соответственно. Оценка обучения, как правило, является суммирующим по своей природе и предназначена для измерения результатов обучения и сообщения этих результатов учащимся, родителям и администраторам. Оценка обучения в основном происходит в конце занятия, курса, семестра или учебного года, в то время как оценка для обучения, как правило, является формирующим по своей природе и используется учителями для рассмотрения подходов к преподаванию и следующих шагов для отдельных учащихся и класса. ^[15]

Распространенной формой формативной оценки является диагностическая оценка . Диагностическая оценка измеряет текущие знания и навыки учащегося с целью определения подходящей программы обучения. Самооценка — это форма диагностической оценки, которая предполагает, что учащиеся оценивают себя сами.

Перспективная оценка предполагает, что оцениваемые лица должны рассмотреть себя в гипотетических будущих ситуациях. ^[16]

Оценка на основе результатов похожа на суммативную оценку, поскольку она фокусируется на достижениях. Она часто соответствует реформе образования на основе стандартов и движению за образование на основе результатов . Хотя в идеале они значительно отличаются от традиционного теста с множественным выбором, они чаще всего связаны с оценкой на основе стандартов , которая использует ответы в свободной форме на стандартные вопросы, оцениваемые людьми-оценщиками по шкале на основе стандартов, соответствуя, отставая или превосходя стандарт производительности, а не ранжируясь по кривой. Определяется четко определенная задача, и ученикам предлагается создать, произвести или сделать что-то, часто в условиях, которые предполагают применение знаний и навыков в реальном мире. Мастерство демонстрируется путем предоставления расширенного ответа. Форматы производительности далее классифицируются на продукты и выступления. Результатом выступления может быть продукт, такой как картина, портфолио, статья или выставка, или оно может состоять из выступления, такого как речь, спортивное мастерство, музыкальный концерт или чтение.

Объективное и субъективное

Оценка (суммативная или формирующая) часто классифицируется как объективная или субъективная. Объективная оценка — это форма опроса, которая имеет один правильный ответ. Субъективная оценка — это форма опроса, которая может иметь более одного правильного ответа (или более одного способа выражения правильного ответа). Существуют различные типы объективных и субъективных вопросов. Объективные типы вопросов включают в себя ответы «истина/ложь», вопросы с множественным выбором , вопросы с множественным ответом и вопросы на сопоставление, в то время как субъективные вопросы включают вопросы с расширенным ответом и эссе. Объективная оценка хорошо подходит для все более популярного формата компьютерной или онлайн-оценки .

Некоторые утверждают, что различие между объективными и субъективными оценками не является ни полезным, ни точным, поскольку в действительности не существует такого понятия, как «объективная» оценка. Фактически, все оценки создаются с присущими им предубеждениями, встроенными в решения о соответствующих предметах и содержании, а также культурными (классовыми, этническими и гендерными) предубеждениями. ^[17]

Основа сравнения

Результаты теста можно сравнить с установленным критерием или с результатами других студентов, или с предыдущими результатами:

(5) Критериально-связанная оценка , обычно использующая критериально-связанный тест , как следует из названия, происходит, когда кандидаты оцениваются по определенным (и объективным) критериям. Критериально-связанная оценка часто, но не всегда, используется для установления компетентности человека (может ли он/она что-то сделать). Самым известным примером критериально-связанной оценки является экзамен по вождению, когда водители-ученики оцениваются по ряду явных критериев (например, «Не подвергать опасности других участников дорожного движения»).

(6) Норма-ориентированная оценка (в просторечии известная как « оценивание по кривой »), обычно использующая тест, ориентированный на норму , не измеряется по определенным критериям. Этот тип оценки относится к студенческому коллективу, проводящему оценку. Это фактически способ сравнения студентов. Тест IQ является самым известным примером оценки, ориентированной на норму. Многие вступительные тесты (в престижные школы или университеты) являются норма-ориентированными, позволяя фиксированной доле студентов пройти («прохождение» в этом контексте означает принятие в школу или университет, а не явный уровень способностей). Это означает, что стандарты могут меняться из года в год в зависимости от качества когорты; оценка, ориентированная на критерии, не меняется из года в год (если критерии не меняются). ^[18]

(7) Ипсативная оценка — это самосравнение либо в одной и той же области с течением времени, либо в сравнении с другими областями в рамках одного и того же учащегося.

Неформальные и формальные

Оценка может быть формальной или неформальной . Формальная оценка обычно подразумевает письменный документ, такой как тест, викторина или статья. Формальная оценка представляет собой числовой балл или оценку на основе успеваемости учащегося, тогда как неформальная оценка не влияет на итоговую оценку учащегося. Неформальная оценка обычно происходит более неформально и может включать наблюдение, инвентаризацию, контрольные списки, шкалы оценок, рубрики , оценки производительности и портфолио, участие, оценку коллег и самооценку, а также обсуждение. ^[19]

Внутренние и внешние

Внутренняя оценка устанавливается и оценивается школой (т. е. учителями), ученики получают оценку и обратную связь относительно оценки. Внешняя оценка устанавливается руководящим органом и оценивается непредвзятым персоналом, некоторые внешние оценки дают гораздо более ограниченную обратную связь в своей оценке. Однако в тестах, таких как австралийский NAPLAN, критерий, рассматриваемый учениками, получает подробную обратную связь, чтобы их учителя могли рассмотреть и сравнить достижения ученика в обучении, а также спланировать будущее.

Стандарты качества

В целом, высококачественными оценками считаются те, которые имеют высокий уровень надежности и валидности . Другими общими принципами являются практичность , подлинность и обратная связь. ^[20]^[21]

Надежность

Надежность относится к последовательности оценки. Надежная оценка — это та, которая последовательно достигает тех же результатов с той же (или похожей) группой студентов. На надежность влияют различные факторы, в том числе неоднозначные вопросы, слишком много вариантов ответов в экзаменационном листе, нечеткие инструкции по выставлению оценок и плохо обученные оценщики. Традиционно надежность оценки основывается на следующем:

Временная стабильность: результаты теста сопоставимы в двух или более отдельных случаях.
Эквивалентность форм: результаты экзаменуемых по разным формам теста, основанного на одном и том же содержании, одинаковы.
Внутренняя согласованность: Ответы на тест согласованы по всем вопросам. Например: В опросе, в котором респондентам предлагается оценить отношение к технологиям, согласованность ожидается в ответах на следующие вопросы:
- «Я вообще очень негативно отношусь к компьютерам».
- «Мне нравится пользоваться компьютерами». ^[22]

Надежность измерения x также можно определить количественно как: где — надежность наблюдаемого (тестового) результата x; и — изменчивость «истинных» (т. е. врожденных результатов кандидата) и измеренных тестовых результатов соответственно. может варьироваться от 0 (совершенно ненадежно) до 1 (совершенно надежно). $R_{\text{x}}=V_{\text{t}}/V_{\text{x}}$ $R_{\text{x}}$ $V_{\text{т}}$ $V_{\text{x}}$ $R_{\text{x}}$

Существует четыре типа надежности: связанная со студентом, которая может быть вызвана личными проблемами, болезнью или усталостью ; связанная с оценщиком, которая включает в себя предвзятость и субъективность ; связанная с администрацией теста, которая является условиями процесса сдачи теста; связанная с тестом, которая в основном связана с природой теста. ^[23]^[20]^[24]

Действительность

Действительная оценка — это та, которая измеряет то, для измерения чего она предназначена. Например, было бы недействительно оценивать навыки вождения только с помощью письменного теста. Более действительным способом оценки навыков вождения было бы сочетание тестов, которые помогают определить, что знает водитель, например, с помощью письменного теста на знание правил вождения, и что водитель может делать, например, с помощью оценки эффективности фактического вождения. Преподаватели часто жалуются, что некоторые экзамены не оценивают должным образом программу, на которой основан экзамен; они фактически подвергают сомнению действительность экзамена.

Обоснованность оценки обычно оценивается путем изучения доказательств по следующим категориям:

Валидность содержания — Соответствует ли содержание теста заявленным целям?
Критериальная валидность – Соотносятся ли баллы с внешними показателями? (например: точно ли высокие баллы за тест по чтению в 4-м классе предсказывают навыки чтения в будущих классах?)
Конструктивная валидность – Соответствует ли оценка другим значимым переменным? (например: учащиеся, изучающие английский как второй язык, постоянно показывают результаты на письменном экзамене иначе, чем носители английского языка?) ^[25]

Другие: ^[20]^[23]

косвенная действительность
действительность лица

Хорошая оценка имеет как валидность, так и надежность, а также другие качественные атрибуты, указанные выше для определенного контекста и цели. На практике оценка редко бывает полностью валидной или полностью надежной. Линейка, на которой неправильно нанесена отметка, всегда будет давать одинаковые (неправильные) измерения. Она очень надежна, но не очень валидна. Просьба к случайным людям назвать время, не глядя на часы, иногда используется в качестве примера оценки, которая является валидной, но ненадежной. Ответы будут различаться у разных людей, но средний ответ, вероятно, близок к фактическому времени. Во многих областях, таких как медицинские исследования, образовательное тестирование и психология, часто будет существовать компромисс между надежностью и валидностью. Тест по истории, написанный для высокой валидности, будет содержать много вопросов-эссе и вопросов с заполнением пропусков. Это будет хорошим показателем владения предметом, но его трудно оценить абсолютно точно. Тест по истории, написанный для высокой надежности, будет полностью с множественным выбором. Он не так хорош для измерения знания истории, но его можно легко оценить с большой точностью. Мы можем обобщить это. Чем надежнее наша оценка того, что мы намерены измерить, тем меньше мы уверены в том, что мы действительно измеряем этот аспект достижения.

Хорошо различать валидность «предмета» и «прогностическую» валидность. Первая, широко используемая в образовании, предсказывает балл, который получит студент на аналогичном тесте, но с другими вопросами. Последняя, широко используемая на рабочем месте, предсказывает результаты. Таким образом, валидный по предмету тест на знание правил вождения является подходящим, в то время как прогностически валидный тест оценит, сможет ли потенциальный водитель следовать этим правилам.

Практичность

Этот принцип относится к ограничениям по времени и стоимости при построении и администрировании инструмента оценки. ^[20] Это означает, что тест должен быть экономичным в предоставлении. Формат теста должен быть простым для понимания. Более того, решение теста должно оставаться в пределах подходящего времени. Он, как правило, прост в администрировании. Его процедура оценки должна быть конкретной и эффективной по времени. ^[24]

Подлинность

Инструмент оценки является аутентичным, когда он контекстуализирован, содержит естественный язык и значимую, релевантную и интересную тему, а также воспроизводит реальный жизненный опыт. ^[20]

Отмывка

Этот принцип относится к последствиям оценки в преподавании и обучении в классах. ^[20] Обратная реакция может быть положительной и отрицательной. Положительная обратная реакция относится к желаемым эффектам теста, в то время как отрицательная обратная реакция относится к отрицательным последствиям теста. Для того чтобы иметь положительную обратную реакцию, можно использовать учебное планирование. ^[26]

Стандарты оценки

В области оценки , и в частности образовательной оценки в Северной Америке, Объединенный комитет по стандартам образовательной оценки опубликовал три набора стандартов для оценки. Стандарты оценки персонала были опубликованы в 1988 году, ^[27] Стандарты оценки программ (2-е издание) были опубликованы в 1994 году, ^[28] и Стандарты оценки студентов были опубликованы в 2003 году. ^[29]

Каждая публикация представляет и разрабатывает набор стандартов для использования в различных образовательных условиях. Стандарты предоставляют руководящие принципы для разработки, внедрения, оценки и улучшения определенной формы оценки. Каждый из стандартов был помещен в одну из четырех основных категорий для содействия образовательным оценкам, которые являются надлежащими, полезными, осуществимыми и точными. В этих наборах стандартов соображения валидности и надежности рассматриваются в разделе точности. Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.

В Великобритании существует награда в области обучения, оценки и обеспечения качества (TAQA), которая помогает сотрудникам изучать и развивать передовой опыт в отношении оценки образования в контексте образования взрослых, дополнительного образования и обучения на рабочем месте. ^[30]

Инфляция оценок

Инфляция оценок (также известная как снисходительность к оценкам) — это общее присуждение более высоких оценок за то же качество работы с течением времени, что обесценивает оценки. ^[31] Однако более высокие средние оценки сами по себе не доказывают инфляцию оценок. Чтобы это было инфляцией оценок, необходимо продемонстрировать, что качество работы не заслуживает высокой оценки. ^[31]

Из-за инфляции оценок стандартизированные тесты могут иметь более высокую достоверность, чем нестандартизированные экзаменационные баллы. ^[32] Недавнее увеличение показателей окончания школы можно частично объяснить инфляцией оценок . ^[33]

Сводная таблица основных теоретических основ

В следующей таблице суммированы основные теоретические рамки, лежащие в основе почти всех теоретических и исследовательских работ, а также учебных практик в образовании (одной из них, конечно же, является практика оценки). Эти различные рамки породили интересные дебаты среди ученых.

Противоречие

Озабоченность по поводу того, как лучше всего применять методы оценки в системах государственных школ, в основном сосредоточена на вопросах использования высокоуровневого тестирования и стандартизированных тестов, которые часто используются для оценки успеваемости учащихся, качества работы учителей и образовательных успехов в масштабах школы, округа или штата.

Ни один ребенок не останется без внимания

Для большинства исследователей и практиков вопрос заключается не в том, следует ли вообще проводить тесты — существует общее мнение, что при эффективном проведении тесты могут предоставить полезную информацию об успеваемости учащихся и реализации учебной программы, а также предложить обучающимся формирующее применение. ^[34] Реальный вопрос заключается в том, могут ли методы тестирования, применяемые в настоящее время, предоставлять эти услуги преподавателям и студентам.

Президент Буш подписал Закон «Ни один ребенок не останется без внимания» (NCLB) 8 января 2002 года. Закон NCLB повторно ввел в действие Закон о начальном и среднем образовании (ESEA) 1965 года. Президент Джонсон подписал ESEA, чтобы помочь в борьбе с бедностью и финансировать начальные и средние школы. Целью президента Джонсона было подчеркнуть равный доступ к образованию и установить высокие стандарты и подотчетность. Закон NCLB требовал от штатов разработки оценок основных навыков. Чтобы получить федеральное финансирование школ, штаты должны были проводить эти оценки для всех учащихся выбранного уровня обучения.

В США закон «Ни один ребенок не останется без внимания» предписывает стандартизированное тестирование по всей стране. Эти тесты соответствуют государственной программе и связывают ответственность учителя, ученика, округа и штата с результатами этих тестов. Сторонники NCLB утверждают, что он предлагает ощутимый метод оценки успеваемости в образовании, возлагая ответственность на учителей и школы за неудовлетворительные результаты и сокращая разрыв в успеваемости между классами и этническими группами. ^[35]

Противники стандартизированного тестирования оспаривают эти утверждения, утверждая, что привлечение педагогов к ответственности за результаты тестов приводит к практике « обучения по результатам тестов ». Кроме того, многие утверждают, что сосредоточенность на стандартизированном тестировании побуждает учителей снабжать учеников узким набором навыков, которые повышают эффективность тестов, фактически не способствуя более глубокому пониманию предмета или ключевых принципов в области знаний. ^[36]

Тестирование с высокими ставками

Оценки, которые вызвали больше всего споров в США, - это использование выпускных экзаменов в средней школе , которые используются для отказа в выдаче дипломов студентам, которые посещали среднюю школу в течение четырех лет, но не могут продемонстрировать, что они изучили требуемый материал при написании экзаменов. Оппоненты говорят, что ни один студент, который четыре года отсидел в сидении, не должен быть лишен диплома средней школы только из-за того, что неоднократно провалил тест или даже не знал требуемый материал. ^[37]^[38]^[39]

Тесты с высокими ставками обвинялись в том, что они вызывают у учеников и учителей болезни и тревожность перед тестами , а также в том, что учителя решают сузить учебную программу до того, что, по мнению учителя, будет проверяться. В упражнении, разработанном для того, чтобы дети чувствовали себя комфортно во время тестирования, газета из Спокана, штат Вашингтон, опубликовала изображение монстра , который питается страхом. ^[40] Опубликованное изображение предположительно является ответом ученика, которого попросили нарисовать то, что он думает о государственной оценке.

Другие критики, такие как Дон Орлич из Университета штата Вашингтон , подвергают сомнению использование тестовых заданий, выходящих далеко за рамки стандартных когнитивных уровней для возраста учащихся. ^[41]

По сравнению с оценками портфолио, простые тесты с несколькими вариантами ответов намного менее затратны, менее подвержены разногласиям между оценщиками и могут быть оценены достаточно быстро, чтобы быть возвращенными до конца учебного года. Стандартизированные тесты (все ученики проходят один и тот же тест в одинаковых условиях) часто используют тесты с несколькими вариантами ответов по этим причинам. Орлич критикует использование дорогих, целостно оцененных тестов, а не недорогих тестов с несколькими вариантами ответов «пузырьковых тестов», чтобы измерить качество как системы, так и отдельных лиц для очень большого количества учеников. ^[41] Другие известные критики тестирования с высокими ставками включают Fairtest и Alfie Kohn .

Использование тестов IQ было запрещено в некоторых штатах для принятия образовательных решений, а тесты, основанные на нормах , которые ранжируют учащихся от «лучших» до «худших», подвергались критике за предвзятость по отношению к меньшинствам. Большинство должностных лиц в сфере образования поддерживают тесты, основанные на критериях (результаты каждого отдельного учащегося зависят исключительно от того, правильно ли он ответил на вопросы, независимо от того, лучше или хуже справились его соседи) для принятия решений с высокими ставками.

оценка 21 века

Широко отмечалось, что с появлением социальных сетей и технологий и менталитетов Web 2.0 обучение становится все более совместным, а знания все больше распределяются между многими членами обучающегося сообщества. Однако традиционные методы оценки в значительной степени сосредоточены на личности и не учитывают накопление знаний и обучение в контексте. Поскольку исследователи в области оценки рассматривают культурные сдвиги, возникающие в результате появления более партиципаторной культуры , им необходимо будет найти новые методы применения оценок к учащимся. ^[42]

Масштабная оценка обучения

Масштабные оценки обучения (LSLA) — это системные оценки, которые дают моментальный снимок успеваемости группы учащихся в определенном году и в ограниченном количестве областей. Их часто относят к национальным или кросс-национальным оценкам, и они привлекают внимание к вопросам, связанным с уровнями обучения и детерминантами обучения, включая квалификацию учителей ; качество школьной среды; родительскую поддержку и руководство; а также социальное и эмоциональное здоровье в школах и за их пределами. ^[43]

Оценка в демократической школе

Модель демократического образования Садбери не выполняет и не предлагает оценок, оценок, стенограмм или рекомендаций. Они утверждают, что не оценивают людей, и что школа не является судьей; сравнение учеников друг с другом или с каким-либо установленным стандартом для них является нарушением права ученика на частную жизнь и самоопределение . Учащиеся сами решают, как измерять свой прогресс как самостоятельно начинающих учеников, как процесс самооценки: настоящее непрерывное обучение и надлежащая образовательная оценка для 21-го века, утверждают они. ^[44]

По данным школ Садбери, эта политика не наносит вреда их ученикам, когда они переходят к жизни за пределами школы. Тем не менее, они признают, что это делает процесс более сложным, но такие трудности являются частью обучения учеников тому, как идти своим путем, устанавливать свои собственные стандарты и достигать своих собственных целей.

Политика отсутствия оценок и рейтингов помогает создать атмосферу, свободную от конкуренции среди студентов или борьбы за одобрение взрослых, и поощряет позитивную атмосферу сотрудничества среди студентов. ^[45]

Заключительный этап обучения в Садбери, если студент решит его пройти, — выпускная работа. Каждый студент пишет на тему, как он подготовил себя к взрослой жизни и вхождению в общество в целом. Эта работа представляется Ассамблее, которая ее рассматривает. Заключительный этап процесса написания диссертации — устная защита студентом, в которой он предоставляет слово для вопросов, возражений и комментариев от всех членов Ассамблеи. В конце Ассамблея голосует тайным голосованием за то, выдавать или нет диплом. ^[46]

Оценка студентов ELL

Основная проблема с использованием образовательных оценок заключается в общей валидности, точности и справедливости, когда речь идет об оценке изучающих английский язык (ELL). Большинство оценок в Соединенных Штатах имеют нормативные стандарты, основанные на англоязычной культуре, которая неадекватно представляет население ELL. ^{[ необходима цитата ]} Следовательно, во многих случаях было бы неточно и неуместно делать выводы из нормативных баллов учащихся ELL. Исследования показывают, что большинство школ не вносят должным образом изменения в оценки, чтобы приспособить учащихся с уникальным культурным происхождением. ^{[ необходима цитата ]} Это привело к чрезмерному направлению учащихся ELL в специальное образование, в результате чего они непропорционально представлены в программах специального образования. Хотя некоторые могут считать такое ненадлежащее размещение в специальном образовании поддерживающим и полезным, исследования показали, что ненадлежащим образом размещенные учащиеся на самом деле регрессировали в прогрессе. ^{[ необходима цитата ]}

Часто необходимо воспользоваться услугами переводчика для проведения оценки на родном языке студента ELL; однако при переводе оценочных пунктов возникает несколько проблем. Одна из проблем заключается в том, что переводы часто могут предлагать правильный или ожидаемый ответ, изменяя сложность оценочного пункта. ^[47] Кроме того, перевод оценочных пунктов иногда может искажать исходный смысл пункта. ^[47] Наконец, многие переводчики не имеют квалификации или надлежащей подготовки для работы со студентами ELL в ситуации оценки. ^{[ необходима цитата ]} Все эти факторы ставят под угрозу обоснованность и справедливость оценок, делая результаты ненадежными. Невербальные оценки оказались менее дискриминационными для студентов ELL, однако некоторые все еще имеют культурные предубеждения в оценочных пунктах. ^[47]

При рассмотрении вопроса о специальном образовании для учащегося ELL группа оценки должна объединить и интерпретировать всю собранную информацию, чтобы обеспечить непредвзятое заключение. ^[47] Решение должно основываться на многомерных источниках данных, включая интервью с учителями и родителями, а также наблюдения за классом. ^[47] Решения должны учитывать уникальные культурные, языковые и практические особенности учащихся и не должны основываться исключительно на результатах оценки.

Универсальный скрининг

Оценка может быть связана с неравенством, когда ученики из традиционно недопредставленных групп исключаются из тестирования, необходимого для доступа к определенным программам или возможностям, как в случае с одаренными программами. Одним из способов борьбы с этим неравенством является всеобщий отбор, который включает тестирование всех учеников (например, на одаренность) вместо тестирования только некоторых учеников на основе рекомендаций учителей или родителей. Всеобщий отбор приводит к значительному увеличению традиционно недооцененных групп (таких как чернокожие, испаноязычные, бедные, женщины и ELLs), идентифицированных для одаренных программ, без каких-либо изменений стандартов идентификации. ^[48]

Смотрите также

Оценка академической эквивалентности
Компьютерная оценка
Концептуальный инвентарь
Обучение, основанное на уверенности, точно измеряет качество знаний учащегося, измеряя как правильность его знаний, так и уверенность человека в этих знаниях.
E-scape — технология и подход, которые уделяют особое внимание оценке креативности и сотрудничества.
Образовательные цели и задачи
Образовательная оценка имеет дело конкретно с оценкой, поскольку она применяется к образовательной среде. В качестве примера она может быть использована в правительственной программе No Child Left Behind (NCLB), учрежденной правительством США
Электронное портфолио — это персональная цифровая запись, содержащая информацию, такую как коллекция артефактов или доказательств, демонстрирующих, что человек знает и умеет делать.
Оценка — это процесс рассмотрения того, что оценивается, чтобы убедиться, что рассматриваются нужные области.
Оценивание — это процесс присвоения учащимся рейтинга (возможно, взаимоисключающего).
Оценка воздействия на здоровье рассматривает потенциальное воздействие политики, программ и проектов на здоровье.
Константа мрака — это теоретическое предубеждение в оценке образования
Образовательное измерение — это процесс оценки или анализа, целью которого является количественное определение уровня достижений или компетентности в указанной области. См. модель Раша для измерения для уточнения концептуальных требований таких процессов, включая те, которые относятся к оценке и использованию необработанных баллов из оценок.
Оценка программы — это, по сути, набор философий и методов, позволяющих определить, «работает» ли программа.
Прогресс тестирования
Психометрия — наука об измерении психологических характеристик.
Психологическое тестирование
Рубрики для оценки
Наука, технологии, общество и экологическое образование
Оценка социального воздействия рассматривает возможные социальные последствия предлагаемых новых инфраструктурных проектов, проектов в области природных ресурсов или мероприятий по развитию.
Стандартизированное тестирование — это любой тест, который используется в различных школах или других ситуациях.
Оценка на основе стандартов
Роберт Э. Стэйк — исследователь в области оценки учебных программ.
Оценка письменной работы
Метрическая фиксация

Ссылки

^ Некоторые педагоги и теоретики образования используют термины «оценка» и «оценивание» для обозначения различных концепций тестирования в процессе обучения с целью его улучшения (для чего предпочтительны столь же однозначные термины «формирующее оценивание» или «формирующее оценивание» ) и тестирования после завершения процесса обучения (для чего предпочтительны столь же однозначные термины «суммативная оценка» или «суммативная оценка» ), но на самом деле они являются синонимами и по сути не означают разные вещи. Большинство словарей не только говорят, что эти термины являются синонимами, но и используют их для определения друг друга. Если термины используются для разных концепций, тщательное редактирование требует как объяснения того, что они обычно являются синонимами, так и разъяснения того, что они используются для обозначения разных концепций в текущем тексте.
^ Аллен, М. Дж. (2004). Оценка академических программ в высшем образовании . Сан-Франциско: Jossey-Bass.
^ Кух, Г. Д.; Янковски, Н.; Айкенберри, С. О. (2014). Знание того, что знают и умеют студенты: текущее состояние оценки результатов обучения в колледжах и университетах США (PDF) . Урбана: Университет Иллинойса и Университет Индианы, Национальный институт оценки результатов обучения.
^ Национальный совет по измерениям в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorA Архивировано 22 июля 2017 г. на Wayback Machine
^ Нельсон, Роберт; Доусон, Филлип (2014). «Вклад в историю оценки: как симулятор разговора искупает сократовский метод». Оценка и анализ в высшем образовании . 39 (2): 195–204. doi :10.1080/02602938.2013.798394. S2CID 56445840.
^ Саски, Линда (2004). Оценка обучения студентов . Болтон, Массачусетс: Anker.
^ Университет Оксфорд Брукс. «Цели и принципы оценки». www.brookes.ac.uk . Архивировано из оригинала 2018-10-09 . Получено 2018-10-09 .
↑ Блэк, Пол и Уильям, Дилан (октябрь 1998 г.). «Внутри черного ящика: повышение стандартов посредством оценки в классе». Phi Beta Kappan. Доступно по адресу http://www.pdkmembers.org/members_online/members/orders.asp?action=results&t=A&desc=Inside+the+Black+Box%3A+Raising+Standards+Through+Classroom+Assessment&text=&lname_1=&fname_1=&lname_2=&fname_2=&kw_1=&kw_2=&kw_3=&kw_4=&mn1=&yr1=&mn2=&yr2=&c1= ^{[ постоянная мертвая ссылка ]} PDKintl.org]. Получено 28 января 2009 г.
^ Мадаус, Джордж Ф.; Айразиан, Питер У. (1969-11-30). «Размещение, формирующая, диагностическая и суммативная оценка обучения в классе». {{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ abcd Mctighe, Jay; O'Connor, Ken (ноябрь 2005 г.). «Семь практик эффективного обучения». Educational Leadership . 63 (3): 10–17. Архивировано из оригинала 6 октября 2019 г. Получено 3 марта 2017 г.
^ Хартелт, Т. и Мартенс, Х. (2024). Влияние самооценки и условных метаконцептуальных знаний на саморегуляцию интуитивных и научных концепций эволюции у студентов. Журнал исследований в области преподавания естественных наук, 61(5), 1134–1180. https://doi.org/10.1002/tea.21938
^ Андраде, HL (2019). Критический обзор исследований самооценки учащихся. Frontiers in Education, 4, статья 87. https://doi.org/10.3389/feduc.2019.00087
^ "Роберт Э. Стэйк, Директор". Архивировано из оригинала 2009-02-08 . Получено 2009-01-29 .
^ Скривен, М. (1991). Тезаурус оценки. 4-е изд. Ньюбери Парк, Калифорния: SAGE Publications . ISBN 0-8039-4364-4 .
^ Эрл, Лорна (2003). Оценка как обучение: использование оценки в классе для максимизации обучения учащихся. Thousand Oaks, CA, Corwin Press. ISBN 0-7619-4626-8
^ Рид, Дэниел. «Диагностическая оценка в преподавании и изучении языков». Центр языкового образования и исследований, доступно на Google.com Архивировано 14 сентября 2011 г. на Wayback Machine . Получено 28 января 2009 г.
^ Объединенный комитет по информационным системам (JISC). "Что мы подразумеваем под электронной оценкой?" JISC InfoNet. Получено 29 января 2009 г. с сайта http://tools.jiscinfonet.ac.uk/downloads/vle/eassessment-printable.pdf Архивировано 16 января 2017 г. на Wayback Machine
^ Образовательные технологии в Virginia Tech. «Цели оценки». VirginiaTech DesignShop: Уроки эффективного обучения, доступно на Edtech.vt.edu Архивировано 26.02.2009 на Wayback Machine . Получено 29 января 2009 г.
^ Валенсия, Шейла В. «Каковы различные формы подлинной оценки?» Понимание подлинной оценки грамотности в классе (1997), доступно на Eduplace.com. Архивировано 28 октября 2019 г. на Wayback Machine . Получено 29 января 2009 г.
^ abcdef Браун, Дуглас; Абейвикрама, Приянвада (2010). Оценка языка, принципы и практика преподавания в классе . Соединенные Штаты Америки: Pearson Longman. ISBN 978-0-13-814931-4.
^ Университет Оксфорд Брукс. «Принципы оценки». www.brookes.ac.uk . Получено 09.10.2018 .
^ Ю, Чонг Хо (2005). «Надежность и валидность». Образовательная оценка. Доступно на Creative-wisdom.com. Получено 29 января 2009 г.
^ ab Fawcett, Alison (2013). Принципы оценки и измерения результатов для эрготерапевтов и физиотерапевтов: теория, навыки и применение . John Wiley & Sons. ISBN 9781118709696.
^ ab "Надежность, валидность и практичность | Преподавай английский | Englishpost.org". Englishpost.org . 2012-06-26 . Получено 2018-10-30 .
^ Москаль, Барбара; Лейденс, Джон (23 ноября 2019 г.). «Разработка рубрик оценки: валидность и надежность». Практическая оценка, исследование и оценка . 7 (1). doi :10.7275/q7rm-gg74.
^ «Понимание оценки: обратная связь и учебное планирование». www.cal.org . Получено 29.10.2018 .
^ Объединенный комитет по стандартам оценки образования. (1988). «Стандарты оценки персонала: как оценивать системы оценки педагогов». Ньюбери Парк, Калифорния: SAGE Publications
^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ , 2-е издание. Ньюбери Парк, Калифорния: SAGE Publications
^ Комитет по стандартам образовательной оценки. (2003). Стандарты оценки учащихся: как улучшить оценку учащихся . Ньюбери Парк, Калифорния: Corwin Press
^ Город и гильдии, Понимание принципов и практики оценки: информационный листок по квалификации, доступ 26 февраля 2020 г.
^ ab Arenson, Karen W. (18 апреля 2004 г.). «Это инфляция оценок или просто студенты стали умнее?». The New York Times . Получено 6 декабря 2015 г.
^ Гурвиц, Майкл и Джейсон Ли. «Инфляция оценок и роль стандартизированного тестирования». Измерение успеха: тестирование, оценки и будущее поступления в колледж (2018): 64-93.
^ Деннинг, Джеффри Т. и др. Почему увеличились показатели окончания колледжа? Анализ повышения оценок. № w28710. Национальное бюро экономических исследований, 2021.
^ Американская психологическая ассоциация. «Уместное использование высокоуровневого тестирования в школах нашей страны». APA Online, доступно на APA.org, получено 24 января 2010 г.
^ (nd) Повторное разрешение NCLB. Департамент образования. Получено 29.01.09.
^ (nd) Что не так со стандартизированным тестированием? FairTest.org. Получено 29 января 2009 г.
^ Dang, Nick (18 марта 2003 г.). «Реформа образования, а не выпускные экзамены». Daily Bruin . Одна из распространенных жалоб от не сдавших тест — то, что их не научили тестируемому материалу в школе. Здесь виновато неадекватное обучение, а не тест. Обвинять тест в своей неудаче — это то же самое, что обвинять автозаправочную станцию в проваленной проверке на смог; это игнорирует основные проблемы в «транспортном средстве обучения».^{[ постоянная мертвая ссылка ]}
^ Вайнкопф, Крис (2002). «Виноват тест: LAUSD отрицает ответственность за низкие баллы». Daily News . Архивировано из оригинала 2017-02-02 . Получено 2010-05-04 . Вина лежит на «тестах с высокими ставками», таких как Stanford 9 и California's High School Exit Exam. Совет ворчит, что опора на такие тесты «несправедливо наказывает учеников, которым не были предоставлены академические инструменты для достижения их наивысшего потенциала на этих тестах».
^ "Blaming The Test". Investor's Business Daily . 11 мая 2006 г. Судья в Калифорнии собирается отменить выпускной экзамен в средней школе этого штата. Почему? Потому что он работает. Он говорит ученикам, что им нужно больше учиться. Мы называем это полезной информацией. Для истцов, которые подают в суд, чтобы прекратить использование теста в качестве требования для выпуска, это нечто другое: доказательство неравного обращения... выпускной экзамен был признан несправедливым, потому что слишком много учеников, которые провалили тест, имели слишком мало сертифицированных учителей. Ну, может быть, так и было, но выдача им диплома, когда у них нет необходимых знаний, только усугубляет несправедливость, оставляя их с бесполезным листком бумаги. ^{[ постоянная мертвая ссылка ]}
^ "ASD.wednet.edu". Архивировано из оригинала 2007-02-25 . Получено 2006-09-22 .
^ ab Bach, Deborah, & Blanchard, Jessica (19 апреля 2005 г.). «WASL беспокоит детей и школы, испытывающих стресс». Seattle Post-Intelligencer. Получено 30 января 2009 г. с Seattlepi.nwsource.com.
^ Фадель, Чарльз, Хани, Маргарет и Пасник, Шелли (18 мая 2007 г.). «Оценка в эпоху инноваций». Education Week. Получено 29 января 2009 г. с сайта http://www.edweek.org/ew/articles/2007/05/23/38fadel.h26.html
^ ЮНЕСКО (2019). Перспективы крупномасштабных оценок обучения: признание ограничений для раскрытия возможностей. ЮНЕСКО. ISBN 978-92-3-100333-2.
^ Гринберг, Д. (2000). Школы 21-го века, отредактированная стенограмма выступления на Международной конференции по обучению в 21-м веке в апреле 2000 года.
^ Гринберг, Д. (1987). Глава 20, Оценка, наконец-то свободна — Школа долины Садбери.
^ Процедура защиты выпускных работ, школа Маунтин Лорел Садбери.
^ abcde "Архивная копия" (PDF) . Архивировано из оригинала (PDF) 2012-05-29 . Получено 2012-04-11 .{{cite web}}: CS1 maint: архивная копия как заголовок ( ссылка )
^ Card, D., & Giuliano, L. (2015). Может ли всеобщий скрининг увеличить представительство малообеспеченных и меньшинств учащихся в одаренном образовании? (Рабочий документ № 21519). Кембридж, Массачусетс: Национальное бюро экономических исследований. Получено с www.nber.org/papers/w21519

Источники

В этой статье использован текст из свободного контента . Лицензия CC BY-SA 3.0 IGO. Текст взят из Обещание масштабных оценок обучения: признание ограничений для раскрытия возможностей, ЮНЕСКО, ЮНЕСКО. ЮНЕСКО.

Дальнейшее чтение

Американская ассоциация образовательных исследований, Американская психологическая ассоциация и Национальный совет по измерениям в образовании. (2014). Стандарты образовательного и психологического тестирования. Вашингтон, округ Колумбия: Американская ассоциация образовательных исследований.
Беннетт, Рэнди Эллиот (март 2015 г.). «Изменение природы образовательной оценки». Обзор исследований в области образования . 39 (1): 370–407. doi :10.3102/0091732x14554179. S2CID 145592665.
Браун, GTL (2018). Оценка успеваемости учащихся. Нью-Йорк: Routledge.
Карлесс, Дэвид. Превосходство в университетской оценке: изучение отмеченной наградами практики . Лондон: Routledge, 2015.
Клингер, Д., МакДивитт, П., Ховард, Б., Роджерс, Т., Муньос, М. и Уайли, К. (2015). Стандарты оценки класса для учителей дошкольного и 12-го классов: Объединенный комитет по стандартам оценки образования.
Кубишин, Т. и Борич, Г. Д. (2012). Образовательное тестирование и измерение: применение и практика в классе (10-е изд.). Нью-Йорк: John Wiley & Sons.
Миллер, Д.М., Линн, Р.Л. и Гронлунд, Н.Е. (2013). Измерение и оценка в преподавании (11-е изд.). Бостон, Массачусетс: Pearson.
Национальный исследовательский совет. (2001). Знание того, что знают студенты: наука и дизайн образовательной оценки. Вашингтон, округ Колумбия: National Academy Press.
Нитко, А. Дж. (2001). Образовательная оценка учащихся (3-е изд.). Аппер Сэддл Ривер, Нью-Джерси: Merrill.
Фелпс, Ричард П., ред. Исправление заблуждений об образовательном и психологическом тестировании . Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008.
Фелпс, Ричард П., Стандартизированное тестирование . Нью-Йорк: Питер Ланг, 2007.
Рассел, МК и Айразиан, ПВ (2012). Оценка в классе: концепции и применение (7-е изд.). Нью-Йорк: McGraw Hill.
Шепард, LA (2006). Оценка в классе. В RL Brennan (ред.), Educational Measurement (4-е изд., стр. 623–646). Westport, CT: Praeger.