Национальная оценка образовательного прогресса ( NAEP ) является крупнейшей постоянной и общенациональной репрезентативной оценкой того, что знают и умеют делать американские учащиеся по различным предметам. NAEP является проектом, утвержденным Конгрессом и администрируемым Национальным центром образовательной статистики (NCES) в Институте педагогических наук (IES) Министерства образования США . Первое национальное управление NAEP произошло в 1969 году. [1] Национальный совет по оценке (NAGB) является независимым двухпартийным советом, который устанавливает политику для NAEP и отвечает за разработку структуры и спецификаций тестов. Национальный совет по оценке, члены которого назначаются министром образования США , включает губернаторов, законодателей штатов, местных и государственных должностных лиц школ, педагогов, представителей бизнеса и членов широкой общественности. Конгресс создал Совет из 26 членов в 1988 году.
Результаты NAEP предназначены для предоставления данных на уровне группы об успеваемости учащихся по различным предметам и публикуются в виде The Nation's Report Card. [2] Результаты для отдельных учащихся, классов или школ отсутствуют. NAEP сообщает результаты для различных демографических групп, включая пол, социально-экономический статус и расу/этническую принадлежность. Оценки чаще всего даются по математике , чтению , естествознанию и письму . Другие предметы, такие как искусство , граждановедение , экономика , география , технология и инженерная грамотность (TEL) и история США оцениваются периодически.
Помимо оценки достижений учащихся по различным предметам, NAEP также опрашивает учащихся, учителей и администраторов школ, чтобы помочь предоставить контекстную информацию. Вопросы о расе или этнической принадлежности участников, посещении школы и академических ожиданиях помогают политикам, исследователям и широкой общественности лучше понять результаты оценки.
Учителя, директора, родители, политики и исследователи используют результаты NAEP для оценки успеваемости учащихся по всей стране и разработки способов улучшения образования в Соединенных Штатах. NAEP предоставляет данные об успеваемости учащихся с 1969 года. [3] [4]
NAEP использует процедуру выборки , которая позволяет оценке быть репрезентативной для географического, расового, этнического и социально-экономического разнообразия школ и учащихся в Соединенных Штатах. [ требуется ссылка ] Также предоставляются данные по учащимся с ограниченными возможностями и изучающим английский язык. Оценки NAEP проводятся для участвующих учащихся с использованием тех же тестовых буклетов и процедур, за исключением приспособлений для учащихся с ограниченными возможностями, [5] [6], поэтому результаты NAEP используются для сравнения штатов и городских округов, которые участвуют в оценке.
Существует два веб-сайта NAEP: веб-сайт NCES NAEP и веб-сайт The Nation's Report Card. Первый сайт подробно описывает программу NAEP в целом, а второй фокусируется в основном на отдельных выпусках данных.
NAEP началась в 1964 году с гранта от Carnegie Corporation на создание Исследовательского комитета по оценке прогресса в образовании (ESCAPE). Первые национальные оценки были проведены в 1969 году. Добровольные оценки для штатов начались в 1990 году на экспериментальной основе, а в 1996 году стали постоянной частью NAEP, проводимой каждые два года. В 2002 году отдельные городские округа приняли участие в оценках на уровне штата на экспериментальной основе и продолжили как Пробная оценка городских округов (TUDA).[нужна ссылка]
В разработке успешной программы NAEP принимали участие многие, включая исследователей, государственных должностных лиц в сфере образования, подрядчиков, политиков, студентов и преподавателей. [7]
Существует два типа оценок NAEP: основная NAEP и долгосрочная тенденция NAEP. Такое разделение позволяет достичь двух целей:
Основные оценки NAEP проводятся по ряду предметов с учениками четвертых, восьмых и двенадцатых классов по всей стране. Чаще всего оценки проводятся по математике, чтению, естествознанию и письму. Другие предметы, такие как искусство, обществознание, экономика, география, технология и инженерная грамотность (TEL) и история США, оцениваются периодически.
Эти оценки следуют предметным рамкам, разработанным NAGB, и используют последние достижения в методологии оценки. [8] В рамках основной NAEP результаты сообщаются на национальном уровне, а в некоторых случаях на уровне штата и округа.
Национальный NAEP сообщает статистическую информацию об успеваемости учащихся и факторах, связанных с успеваемостью в образовании для страны и для конкретных демографических групп населения (например, раса/этническая принадлежность, пол). Он включает учащихся как государственных, так и негосударственных (частных) школ и в зависимости от предмета сообщает результаты для 4, 8 и 12 классов.
Результаты NAEP штата доступны по некоторым предметам для 4 и 8 классов. Это позволяет штатам-участникам отслеживать свой прогресс с течением времени в математике, чтении, науке и письме. Затем они могут сравнивать знания и навыки своих учеников с учениками в других штатах и со страной.
Оценки, выставляемые в штатах, точно такие же, как и на национальном уровне. Традиционно государственный NAEP оценивался только в классах 4 и 8. Однако пилотная программа 2009 [9] позволила 11 штатам (Арканзас, Коннектикут, Флорида, Айдахо, Иллинойс, Айова, Массачусетс, Нью-Гэмпшир, Нью-Джерси, Южная Дакота и Западная Вирджиния) получить баллы на уровне двенадцатого класса.
До 1988 года NAEP отчитывалась только об академических достижениях нации в целом и по демографическим группам населения. В 1988 году Конгресс принял закон, разрешающий добровольную пробную государственную оценку. Отдельные репрезентативные выборки студентов были отобраны из каждого штата или юрисдикции, которые согласились участвовать в государственной NAEP. Пробные государственные оценки проводились в 1990, 1992 и 1994 годах. Начиная с оценки 1996 года, разрешающий закон больше не считал компонент штата «пробным».
Значительное изменение в государственном NAEP произошло в 2001 году с повторным принятием Закона о начальном и среднем образовании , также называемого законом «Ни один ребенок не останется позади» . Этот закон требует, чтобы штаты, получающие финансирование по Разделу I, участвовали в государственных оценках NAEP по математике и чтению в 4 и 8 классах каждые два года. Участие штата в других предметах, оцениваемых государственным NAEP (естественные науки и письмо), остается добровольным.
Как и все оценки NAEP, государственная NAEP не выставляет индивидуальные баллы оцениваемым учащимся или школам.
Trial Urban District Assessment ( TUDA ) — это проект, разработанный для определения возможности использования NAEP для составления отчетов об успеваемости учащихся государственных школ на уровне округа. По решению конгресса NAEP провела оценку по математике, чтению, естественным наукам и письму для выборок учащихся в выбранных городских округах.
Проект TUDA начался в 2002 году с шести городских округов и с тех пор расширился до 27 округов к циклу оценки 2017 года.
Долгосрочная тенденция NAEP периодически проводится для 9-, 13- и 17-летних детей на национальном уровне. Оценки долгосрочных тенденций измеряют успеваемость учащихся по математике и чтению и позволяют сравнивать успеваемость сегодняшних учащихся с успеваемостью учащихся с начала 1970-х годов.
Хотя долгосрочная тенденция и основная NAEP оба оценивают математику и чтение, между ними есть несколько различий. В частности, оценки различаются по оцениваемому содержанию, по тому, как часто проводится оценка, и по тому, как сообщаются результаты. Эти и другие различия означают, что результаты долгосрочной тенденции и основной NAEP нельзя сравнивать напрямую. [10]
Хотя NAEP проводится с 1970-х годов, в 2021 году должностные лица Министерства образования США решили отложить оценку по математике и чтению из-за пандемии COVID-19. Причины отсрочки включают возможность искажения выборок учащихся, а также результаты из-за различных вариантов дистанционного обучения и из-за проблем безопасности для инспекторов и учащихся. [11]
NAGB устанавливает календарь оценок NAEP. Пожалуйста, ознакомьтесь с полным графиком оценок для всех оценок NAEP с 1968 года и тех, которые запланированы до 2017 года.
Основные оценки NAEP обычно проводятся в течение примерно шести недель между концом января и началом марта каждого года. Оценки долгосрочных тенденций обычно проводятся каждые четыре года по возрастным группам между октябрем и маем. Все оценки проводятся сотрудниками NAEP, работающими на местах, по всей стране.
NAEP проводится в партнерстве со штатами. Программа NAEP обеспечивает финансирование постоянного NSC в каждом штате. Он или она выступает в качестве связующего звена между NAEP, образовательным агентством штата и школами, выбранными для участия.
Национальные комитеты по статистике предоставляют множество важных услуг для программы NAEP и отвечают за:
В то время как большинство оценок NAEP проводятся в формате, основанном на бумаге и карандаше, NAEP развивается, чтобы соответствовать меняющемуся образовательному ландшафту посредством перехода к цифровым оценкам. NAEP использует новейшие доступные технологии для предоставления оценок студентам, и по мере развития технологий будет меняться и характер предоставления DBA. Цель состоит в том, чтобы все оценки NAEP были безбумажными к концу десятилетия. Оценка письма 2011 года была первой, которая была полностью компьютеризирована.
В 2009 году ИКТ были введены как часть оценки по науке на бумаге и карандаше. Компьютерная доставка позволяет измерить научные знания, процессы и навыки, которые невозможно оценить другими способами. Задания включали проведение исследований, включающих наблюдения за явлениями, которые в противном случае заняли бы много времени, моделирование явлений в очень больших масштабах или невидимых невооруженным глазом, а также исследование обширных ресурсных документов.
Это специальное исследование многоэтапного тестирования, проведенное в 2011 году, изучало использование принципов адаптивного тестирования в контексте NAEP. Выборке учащихся была предоставлена онлайн-оценка по математике, которая адаптируется к уровню их способностей. Все пункты в исследовании являются существующими пунктами NAEP.
В рамках оценки TEL технологическая и инженерная грамотность описывается как способность использовать, понимать и оценивать технологию, а также понимать технологические принципы и стратегии, необходимые для разработки решений и достижения целей. Три области оценки:
Учащиеся восьмых классов по всей стране прошли оценку зимой 2014 года. Результаты оценки были опубликованы в мае 2016 года.
В 2011 году NAEP перевела свою оценку письма (в 8 и 12 классах) с бумаги и карандаша на компьютерное администрирование, чтобы измерить способность учащихся писать с помощью компьютера. Оценка использует многие возможности современных цифровых технологий, а задания предоставляются в мультимедийных форматах, таких как короткие видео и аудио. Кроме того, в целях охвата как можно большего числа учащихся, система компьютерной оценки письма имеет встроенные в нее несколько универсальных функций дизайна, таких как преобразование текста в речь, регулируемый размер шрифта и электронная проверка орфографии. В 2012 году NAEP опробовала компьютерную оценку для учащихся 4 класса.
Помимо оценок, NAEP координирует ряд связанных специальных исследований, которые часто включают специальные процессы сбора данных, вторичный анализ результатов NAEP и оценку технических процедур.
Разрывы в успеваемости возникают, когда одна группа учащихся превосходит другую группу, и разница в средних баллах для двух групп статистически значима (то есть больше, чем погрешность). В первоначальных отчетах NAEP подчеркивает разрывы в успеваемости между группами учащихся. Однако NAEP также выпускает ряд отчетов и сводок данных, которые подчеркивают разрыв в успеваемости. – Некоторые примеры включают в себя «Состав школы» и «Разрыв в успеваемости черно-белых» и «Разрыв в успеваемости испаноязычных и белых» и «Разрыв в успеваемости черно-белых». [12] Эти публикации используют баллы NAEP по математике и/или чтению для этих групп, чтобы либо предоставить сводки данных, либо осветить закономерности и изменения в этих разрывах с течением времени. Исследовательские отчеты, такие как «Состав школы» и «Разрыв в успеваемости черно-белых», также включают оговорки и предостережения относительно интерпретации данных.
HSTS исследует связь между успеваемостью NAEP в 12 классе и академической карьерой в старшей школе, изучая учебные программы, которым следуют в наших национальных средних школах, и модели прохождения курсов учащимися старших классов с помощью коллекции стенограмм. Недавние исследования сделали акцент на образовании STEM и на том, как оно соотносится с успеваемостью учащихся в оценках NAEP по математике и естественным наукам. [ необходима цитата ]
Исследование тенденций в области международной математики и естественных наук (TIMSS) — это международная оценка Международной ассоциации по оценке образовательных достижений (IEA), которая измеряет успеваемость учащихся в области математики и естественных наук. NCES инициировала исследование связи NAEP-TIMSS, чтобы штаты и выбранные округа могли сравнить успеваемость своих учеников с международными показателями. Исследование связи было проведено в 2011 году в 8 классе по математике и естественным наукам. NCES будет «проецировать» баллы штата и округа по TIMSS по обоим предметам, используя данные NAEP.
NIES — это двухчастное исследование, разработанное для описания состояния образования для американских индейцев/коренных жителей Аляски в Соединенных Штатах. Первая часть исследования состоит из результатов оценки по математике и чтению в 4 и 8 классах. Вторая часть представляет результаты опроса, проведенного среди американских индейцев/коренных жителей Аляски, их учителей и администраторов школ. Опросы сосредоточены на культурном опыте учащихся в школе и за ее пределами.
В соответствии с переутверждением в 2001 году Закона о начальном и среднем образовании (ESEA) 1965 года, штаты разрабатывают свои собственные оценки и устанавливают свои собственные стандарты успеваемости для измерения достижений учащихся. Каждый штат контролирует свои собственные программы оценки, включая разработку своих собственных стандартов, что приводит к большим различиям между штатами в общегосударственных практиках оценки учащихся. Эти различия создают проблему в понимании уровней успеваемости учащихся по всем Соединенным Штатам. С 2003 года NCES поддерживает исследования, которые сравнивают стандарты успеваемости NAEP с таковыми отдельных штатов. Оценки штатов помещаются на общую шкалу, определяемую баллами NAEP, что позволяет сравнивать стандарты успеваемости штатов не только с NAEP, но и друг с другом. NCES опубликовал отчет Mapping State Proficiency Standards, используя данные штатов по математике и чтению за 2003, 2005, 2007, 2009 и совсем недавно, в 2013 году. [13]
За эти годы NCES провела ряд других исследований, связанных с различными аспектами программы NAEP. Ниже перечислены несколько исследований недавнего прошлого:
Интенсивное использование NAEP проверки статистических гипотез вызвало некоторую критику, связанную с интерпретацией результатов. Например, в Nation's Report Card сообщалось, что «мужчины превосходят женщин во всех трех классах в 2005 году» в результате результатов тестов по естественным наукам 100 000 учеников в каждом классе. [14] Хайд и Линн раскритиковали это утверждение, потому что средняя разница составила всего 4 из 300 баллов, что подразумевает небольшой размер эффекта и сильно перекрывающиеся распределения. Они утверждают, что «небольшие различия в результатах в NAEP и других исследованиях получают широкую огласку, усиливая тонкие, устойчивые предубеждения». [15]
Выбор NAEP того, какие ответы отмечать как правильные или неправильные, также подвергся критике, проблема, которая встречается и в других странах. [16] Например, вопрос по истории, заданный о постановлении 1954 года по делу Браун против Совета по образованию , явно ссылался на решение 1954 года, которое определило проблему, а не на решение 1955 года, предписывающее десегрегацию. NAEP попросила студентов «описать условия, которые это решение 1954 года было призвано исправить». Они отметили неправильно студентов, которые упомянули сегрегацию, не упомянув десегрегацию. Фактически, вопрос касался только существующих условий, а не средств правовой защиты, и в любом случае решение 1954 года не предписывало десегрегацию. [17] [18] Страна ждала решения по делу Брауна II 1955 года , чтобы услышать о «полной преднамеренной скорости». Другой вопрос по истории отметил неправильно студентов, которые знали, что США воевали с русскими, а также с китайцами и северокорейцами в Корейской войне . Другие выпущенные вопросы по математике и письму подверглись аналогичной критике. Ответы по математике наказывают студентов, которые понимают отрицательные квадратные корни , проценты по кредитам и ошибки в экстраполяции графика за пределы данных. [19] [20]
Критике подверглось и заявление NAEP об измерении критического мышления. Исследователи из Калифорнийского университета в Лос-Анджелесе обнаружили, что студенты могли выбирать правильные ответы без критического мышления. [21]
NAEP оценивает каждый тест статистическим методом, устанавливает пороговые значения для «базовых» и «умелых» стандартов и приводит примеры того, чего достигли учащиеся на каждом уровне в тесте. Процесс разработки тестов и стандартов подвергся критике со стороны Университета Западного Мичигана (1991), Национальной академии образования (1993), Счетной палаты правительства (1993), Национальной академии наук (1999), [22] [23] Американских институтов исследований и RTI International (2007), [24] Института Брукингса (2007 [25] и 2016 [24] ), Центра тестирования Buros (2009), [22] и Национальной академии наук, инженерии и медицины (2016). [24]
Интерпретация результатов NAEP оказалась сложной: категория NAEP «успевающий» в тесте по чтению, который давали ученикам четвертого класса, отражает учеников, которые хорошо справились с тестом и находятся на уровне седьмого класса. [24] Категория NAEP «успевающий» в тесте по математике, который давали ученикам восьмого класса, отражает учеников, которые хорошо справились с тестом и находятся на уровне двенадцатого класса. [25] Тот факт, что лишь немногие ученики восьмого класса владеют этим стандартом и достигают уровня двенадцатого класса, был неверно истолкован как утверждение, что лишь немногие ученики восьмого класса достигают даже уровня восьмого класса. [26] NAEP заявляет: «Учащиеся, которые могут хорошо владеть предметом, учитывая общепринятое использование термина, могут не соответствовать требованиям к успеваемости на уровне достижений NAEP» [24] Джеймс Харви, главный автор книги «Нация в опасности », говорит: «Трудно не прийти к выводу, что это слово было сознательно выбрано, чтобы запутать политиков и общественность». [24]
{{cite news}}
: CS1 maint: multiple names: authors list (link)