Множественный выбор ( MC ), [1] объективный ответ или MCQ (для вопроса с множественным выбором ) — это форма объективной оценки , в которой респондентам предлагается выбрать только правильный ответ из вариантов, предложенных в виде списка. Формат множественного выбора чаще всего используется в образовательном тестировании, в маркетинговых исследованиях и на выборах , когда человек выбирает между несколькими кандидатами, партиями или политиками.
Хотя Э. Л. Торндайк разработал ранний научный подход к тестированию студентов, именно его помощник Бенджамин Д. Вуд разработал тест с множественным выбором. [2] Тестирование с множественным выбором стало популярным в середине 20-го века, когда были разработаны сканеры и машины для обработки данных, чтобы проверять результаты. Кристофер П. Соул создал первые экзамены с множественным выбором для компьютеров на компьютере Sharp Mz 80 в 1982 году. Он был разработан, чтобы помочь людям с дислексией справляться с сельскохозяйственными предметами, поскольку латинские названия растений могут быть трудны для понимания и написания. [ необходима цитата ]
Single Best Answer ( SBA или One Best Answer ) — это письменная форма экзамена MCQ, широко используемая в медицинском образовании . [3] Эта форма, из которой кандидат должен выбрать лучший ответ, отличается от форм Single Correct Answer , которые могут вызывать путаницу, когда более одного из возможных ответов имеют некоторую обоснованность. Форма SBA четко указывает, что более чем один ответ может иметь элементы, которые являются правильными, но один ответ будет лучшим.
Задания с множественным выбором состоят из основы и нескольких альтернативных ответов. Основа — это начало — проблема, которую нужно решить, заданный вопрос или неполное утверждение, которое нужно завершить. Варианты — это возможные ответы, из которых может выбирать испытуемый, при этом правильный ответ называется ключом , а неправильные — отвлекающими . [4] Только один ответ может быть отмечен как правильный. Это контрастирует с заданиями с множественным выбором, в которых более одного ответа может быть отмечено как правильный.
Обычно правильный ответ приносит определенное количество баллов в общую оценку, а неправильный ответ не приносит ничего. Однако тесты могут также присуждать частичные баллы за неотвеченные вопросы или штрафовать студентов за неправильные ответы, чтобы препятствовать угадыванию. Например, тесты SAT Subject снимают четверть балла с оценки сдающего тест за неправильный ответ.
Для расширенных элементов, таких как элемент прикладных знаний, основа может состоять из нескольких частей. Основа может включать расширенный или вспомогательный материал, такой как виньетка , исследование случая , график , таблица или подробное описание, которое имеет несколько элементов. Может быть включено все, что необходимо для обеспечения максимальной достоверности и подлинности элемента. Основа заканчивается вводным вопросом, объясняющим, как респондент должен ответить. В медицинских элементах с множественным выбором вводной вопрос может спрашивать «Какой наиболее вероятный диагноз?» или «Какой патоген является наиболее вероятной причиной?» со ссылкой на исследование случая, которое было представлено ранее.
Элементы теста с множественным выбором часто в разговорной речи называют «вопросами», но это неправильное название, поскольку многие элементы не сформулированы как вопросы. Например, они могут быть представлены как неполные утверждения, аналогии или математические уравнения. Таким образом, более общий термин «элемент» является более подходящим обозначением. Элементы хранятся в банке элементов .
В идеале вопрос с множественным выбором (MCQ) следует задавать в виде «основы» с возможными вариантами ответов, например:
Если и , то что такое ?
- 12
- 3
- 4
- 10
В уравнении найдите x .
- 4
- 10
- 0,5
- 1.5
- 8
Город, известный как «ИТ-столица Индии»,
- Бангалор
- Мумбаи
- Карачи
- Детройт
(Правильные ответы — B, C и A соответственно.)
Хорошо написанный вопрос с множественным выбором не содержит явно неправильных или неправдоподобных отвлекающих факторов (например, включение неиндейского города Детройт в третий пример), так что вопрос имеет смысл при прочтении с каждым из отвлекающих факторов, а также с правильным ответом.
Более сложный и хорошо написанный вопрос с множественным выбором выглядит следующим образом:
Примите во внимание следующее:
- Шахматная доска восемь на восемь клеток.
- Шахматная доска восемь на восемь клеток с удаленными двумя противоположными углами.
- Шахматная доска восемь на восемь клеток, у которой удалены все четыре угла.
Какую из этих игровых площадок можно выложить с помощью двух костяшек домино (без наложений и зазоров, и с использованием всех костяшек домино, содержащихся на доске)?
- Я только
- только II
- Только I и II
- Только I и III
- Я, II и III
Тесты с множественным выбором имеют несколько преимуществ. Если авторы заданий хорошо обучены, а качество заданий гарантировано, это может быть очень эффективным методом оценки. [5] Если учащиеся проинструктированы о том, как работает формат заданий, и мифы, окружающие тесты, исправлены, они будут лучше сдавать тест. [6] Во многих оценках надежность, как было показано, улучшается с большим количеством заданий в тесте, а при хорошей выборке и заботе о специфичности случая общая надежность теста может быть дополнительно повышена. [7]
Тесты с множественным выбором ответов часто требуют меньше времени для проведения при заданном объеме материала, чем тесты, требующие письменных ответов.
Вопросы с множественным выбором подходят для разработки объективных оценочных пунктов, но без обучения автора вопросы могут быть субъективными по своей природе. Поскольку этот стиль теста не требует от учителя интерпретации ответов, тестируемые оцениваются исключительно по их выбору, что создает меньшую вероятность предвзятости учителя в результатах. [8] Факторы, не имеющие отношения к оцениваемому материалу (такие как почерк и ясность изложения), не вступают в игру при оценке с множественным выбором, и поэтому кандидат оценивается исключительно по его знанию темы. Наконец, если тестируемые знают, как использовать листы ответов или флажки онлайн-экзамена, на их ответы можно полагаться с ясностью. В целом, тесты с множественным выбором являются самыми сильными предикторами общей успеваемости учащихся по сравнению с другими формами оценки, такими как участие в классе, экзамены по конкретным случаям, письменные задания и имитационные игры. [9]
До широкого внедрения SBA в медицинское образование типичной формой экзамена были вопросы типа «верно-неверно». Но в 2000-х годах преподаватели обнаружили, что SBA будут лучше. [3]
Самым серьезным недостатком является ограниченность типов знаний, которые можно оценить с помощью тестов с множественным выбором. Тесты с множественным выбором лучше всего подходят для проверки четко определенных или низкоуровневых навыков. Навыки решения проблем и рассуждения более высокого порядка лучше оценивать с помощью тестов с короткими ответами и эссе. [ необходима цитата ] Однако тесты с множественным выбором часто выбирают не из-за типа оцениваемых знаний, а потому, что они более доступны по цене для тестирования большого количества студентов. Это особенно актуально в Соединенных Штатах и Индии, где тесты с множественным выбором являются предпочтительной формой тестирования с высокими ставками, а размер выборки тестируемых соответственно велик.
Другим недостатком тестов с множественным выбором является возможная неоднозначность в интерпретации экзаменуемым элемента. Неспособность интерпретировать информацию так, как предполагал создатель теста, может привести к «неправильному» ответу, даже если ответ экзаменуемого потенциально действителен. Термин «множественная догадка» использовался для описания этого сценария, поскольку экзаменуемые могут попытаться угадать, а не определить правильный ответ. Тест со свободным ответом позволяет экзаменуемому аргументировать свою точку зрения и потенциально получить зачет.
Кроме того, даже если студенты имеют некоторые знания по вопросу, они не получают зачета за знание этой информации, если они выбирают неправильный ответ, и пункт оценивается дихотомически. Однако вопросы со свободным ответом могут позволить экзаменуемому продемонстрировать частичное понимание предмета и получить частичный зачет. Кроме того, если задается больше вопросов по определенной предметной области или теме, чтобы создать большую выборку, то статистически их уровень знаний по этой теме будет более точно отражен в количестве правильных ответов и окончательных результатах.
Другим недостатком экзаменов с множественным выбором является то, что студент, который не может ответить на конкретный вопрос, может просто выбрать случайный ответ и все равно иметь шанс получить за него оценку. Если случайным образом угадывать ответ, то обычно есть 25-процентный шанс дать его правильно на вопросе с четырьмя вариантами ответов. Это обычная практика для студентов, у которых не осталось времени, давать всем оставшимся вопросам случайные ответы в надежде, что они дадут хотя бы некоторые из них правильно. Многие экзамены, такие как Австралийский конкурс математики и SAT , имеют системы, которые сводят это на нет, в данном случае делая не более выгодным выбор случайного ответа, чем не давать ни одного.
Другая система нейтрализации эффектов случайного выбора — это формула оценки, в которой оценка пропорционально уменьшается на основе количества неправильных ответов и количества возможных вариантов. В этом методе оценка уменьшается на количество неправильных ответов, деленное на среднее количество возможных ответов для всех вопросов в тесте, w / ( c – 1), где w — количество неправильных ответов в тесте , а c — среднее количество возможных вариантов для всех вопросов в тесте . [10] Все экзамены, оцениваемые с помощью трехпараметрической модели теории ответов на вопросы, также учитывают угадывание. Это обычно не является большой проблемой, более того, поскольку шансы студента получить значимые оценки путем угадывания очень низки, когда доступно четыре или более вариантов выбора.
Кроме того, важно отметить, что вопросы, сформулированные двусмысленно, могут сбить с толку тестируемых. Общепринято, что вопросы с множественным выбором допускают только один ответ, где один ответ может инкапсулировать набор предыдущих вариантов. Однако некоторые создатели тестов не знают об этом и могут ожидать, что студент выберет несколько ответов без явного разрешения или предоставления конечных вариантов инкапсуляции.
Критики, такие как философ и сторонник образования Жак Деррида , заявили, что, хотя потребность в распространении и проверке базовых знаний является обоснованной, существуют и другие способы удовлетворения этой потребности, помимо использования шпаргалок . [11]
Несмотря на все недостатки, формат остается популярным, поскольку MCQ легко создавать, оценивать и анализировать. [12]
Теория о том, что ученики должны доверять своему первому инстинкту и придерживаться своего первоначального ответа в тесте с множественным выбором, является мифом, который стоит развеять. Исследователи обнаружили, что хотя некоторые люди считают, что менять ответы плохо, это, как правило, приводит к более высокому результату теста. Данные двадцати отдельных исследований показывают, что процент изменений «правильного на неправильное» составляет 20,2%, тогда как процент изменений «неправильного на правильное» составляет 57,8%, почти утроившись. [13] Изменение с «правильного на неправильное» может быть более болезненным и запоминающимся ( эффект фон Ресторффа ), но, вероятно, хорошей идеей будет изменить ответ после того, как дополнительное размышление укажет на то, что можно сделать лучший выбор. Фактически, первоначальное влечение человека к определенному варианту ответа вполне может исходить из поверхностной правдоподобности, которую автор теста намеренно встроил в отвлекающий фактор (или неправильный выбор ответа). Авторам тестовых заданий поручено делать свои отвлекающие факторы правдоподобными, но явно неверными. Таким образом, первое инстинктивное влечение тестируемого к отвлекающему фактору часто является реакцией, которую, вероятно, следует пересмотреть в свете тщательного рассмотрения каждого из вариантов ответа. Некоторые тестируемые по некоторым предметам экзамена могут иметь точные первые инстинкты относительно конкретного тестового задания, но это не означает, что все тестируемые должны доверять своему первому инстинкту.