stringtranslate.com

тест на герметичность

Студент перетаскивает термины на интерактивную доску, чтобы заполнить закрытый текст

Тест на закрытие (также тест на удаление закрытие или тест на окклюзию ) — это упражнение, тест или оценка, в которых часть текста замаскирована , и участнику предлагается заполнить замаскированную часть текста. Тесты на закрытие требуют способности понимать контекст и словарный запас , чтобы определить правильный язык или часть речи, которая принадлежит удаленным отрывкам. Это упражнение обычно применяется для оценки изучения и преподавания родного и второго языка .

Слово cloze происходит от слова closure в теории гештальта . Упражнение было впервые описано Уилсоном Л. Тейлором в 1953 году. [1]

Слова могут быть удалены из рассматриваемого текста либо механически (каждое n-ное слово), либо выборочно, в зависимости от того, какой именно аспект он предназначен для проверки. Методология является предметом обширной академической литературы; [2] тем не менее, учителя обычно разрабатывают специальные тесты.

Примеры

Преподаватель языка может дать студентам следующий отрывок:

Сегодня я пошёл в ___________ и купил молока и яиц. Я знал, что будет дождь, но забыл взять свой _________, и в итоге промок по дороге.

Затем студентам необходимо будет заполнить пропуски словами, которые лучше всего завершат отрывок. Контекст в терминах языка и содержания важен в большинстве, если не во всех, тестах на закрытие. Первому пропуску предшествует «the»; поэтому за ним должно следовать существительное , прилагательное или наречие . Однако за пропуском следует союз ; предложение было бы грамматически неверным, если бы в пропуске было что-то другое, кроме существительного. Слова «milk and eggs» важны для решения, какое существительное вставить в пропуск; «supermarket» — возможный ответ; однако, в зависимости от студента, первый пропуск может быть store , supermarket , shop , stores , market или grocer , в то время как umbrella , brolly или raincoat могут подойти ко второму. Возможный завершенный отрывок будет выглядеть так:

Сегодня я пошел в супермаркет и купил молока и яиц. Я знал, что будет дождь, но забыл взять зонтик и в итоге промок по дороге.

Помимо проверки владения языком, тест «Клоуз» может также использоваться для проверки фактических знаний, например:

________ — анаэробный катаболизм глюкозы.

Возможные ответы тогда включают брожение молочной кислоты , анаэробный гликолиз и анаэробное дыхание .

Оценка

Определение успеха в данном тесте на закрытие варьируется в зависимости от более широких целей, стоящих за упражнением. Оценка может зависеть от того, является ли упражнение объективным (т. е. учащимся дается список слов для использования в закрытии) или субъективным (т. е. учащиеся должны заполнить закрытие словами, которые сделают данное предложение грамматически правильным).

Я видел, как мужчина положил куртку на лужу, чтобы женщина переходила дорогу. Я подумал, что это очень ______.

Учитывая приведенный выше отрывок, ответы студентов могут варьироваться в зависимости от их словарного запаса и личных мнений. Однако размещение пробела в конце предложения ограничивает возможные слова, которые могут завершить предложение; после наречия и завершения предложения слово, скорее всего, будет прилагательным. Например, на месте пробела могут стоять слова Romantic, chivalrous или gallant, а также foolish или cheesy . Используя эти ответы, учитель может попросить студентов поразмышлять над мнениями, высказанными в данном пробеле.

Недавние исследования с использованием отслеживания взгляда показали, что задания на заполнение пробелов/закрытие пробелов, в которых в качестве вариантов ответа предлагается выбор слов, могут проверять различные виды навыков чтения в зависимости от языковых способностей участников, проходящих тест. [3] Предполагается, что испытуемые с более низкими способностями с большей вероятностью будут концентрироваться на информации, содержащейся в словах, непосредственно окружающих пробел, в то время как испытуемые с более высокими способностями, как полагают, могут использовать более широкое контекстное окно , что также верно для более эффективных больших языковых моделей , таких как ChatGPT , в отличие от менее эффективных старых моделей.

Ряд методологических проблем, на которые указали исследователи в отношении открытого типа клоуз-задания (читатели должны предоставить правильное слово из долговременной памяти, как оценивать приемлемые ответы, которые не являются точной заменой и т. д.), можно решить с помощью тщательно разработанных клоуз-заданий с множественным выбором. См. пример теста и практического задания из пилотного исследования в сельской латиноамериканской общине. [4] Мостоу и его коллеги также показали, как этот подход является как практичным, так и информативным. [5]

Выполнение

Помимо использования в тестировании, удаление клоузов может использоваться в обучении, в частности, изучении языка , но также и в изучении фактов. Это можно сделать вручную — например, закрыв разделы текста бумагой или выделив разделы текста маркером, а затем закрыв линию цветной линейкой дополнительного цвета (например, красной линейкой для зеленого маркера), чтобы выделенный текст исчез; это популярно в Японии, например [ требуется цитата ] . Удаление клоузов также может использоваться как часть программного обеспечения для интервального повторения . Например, приложения SuperMemo и Anki предлагают полуавтоматическое создание тестов клоузов.

Программирование программного обеспечения для принятия всех синонимов слова в качестве допустимых правильных ответов на тест-клоуз является сложной задачей, поскольку необходимо учитывать все потенциальные синонимы. Важной концепцией, которая применяется при автоматическом создании тестов-клоуз программным обеспечением, является закрываемость слов. [6] Закрываемость слов определяется как: «Как часто участники, которые знают это слово, угадывают его правильно, когда оно закрыто в предложении, которое они раньше не видели?»

Слова, имеющие большое количество синонимов, будут иметь низкий показатель закрываемости, поскольку вероятность того, что данное слово будет угадано правильно, снижается. Слова, которые являются конкретными и имеют малое количество синонимов, будут иметь высокий показатель закрываемости.

Удаление заглушки также может быть применено к графическому органайзеру , в котором представлена ​​диаграмма, карта, сетка или изображение, а для заполнения некоторых меток необходимо использовать контекстные подсказки. [7] В частности, при изучении предмета, насыщенного изображениями, например, анатомии, пользователь Anki может использовать окклюзию изображения, чтобы скрыть части изображения. [8]

Сравнение с другими методиками тестирования

Гловер, 1989 сравнил различные формы припоминания и их эффективность после того, как прошло время, чтобы произошло забывание. Гловер назвал тесты на закрытие подсказкой для припоминания, которая оказалась менее эффективной, чем тестирование свободного припоминания (ученику давалась общая подсказка, от ученика ожидалось, что он вспомнит все, что он знал), но более эффективной, чем тесты на узнавание. [9]

Обработка естественного языка

Тест Клоуза часто используется в качестве оценочной задачи в обработке естественного языка (NLP) для оценки производительности обученных языковых моделей . [10] Задачи имеют несколько различных вариантов, например, предсказание ответа на пробел с [11] и без [12] предоставления правильных вариантов, предсказание последнего предложения истории или отрывка [13] и т. д. С момента разработки кодировщика BERT он также используется в предобученных языковых моделях, в этом случае он известен как моделирование языка в маске.

Смотрите также

Ссылки

  1. ^ Тейлор, У. Л. (1953). «Процедура закрытия: новый инструмент для измерения читабельности». Journalism Quarterly . 30 (4): 415–433. doi :10.1177/107769905303000401. S2CID  206666846.
  2. ^ Сакс, Дж.; Тунг, П.; Лам, Р. (1997). «Как построить тест на загадки: уроки тестирования моделей теории измерений». Перспективы . 9. Городской университет Гонконга.
  3. ^ МакКрей, Гарет; Брунфо, Тинеке (ноябрь 2016 г.). «Исследование конструкции, измеренной с помощью банковских элементов для заполнения пробелов: данные слежения за глазами». Тестирование языка . 35 : 51–73. doi : 10.1177/0265532216677105 .
  4. ^ Ширеак, SM.; Фрэнсис, Н. и МакКлюр, Дж. (2019). «Осознание формы и модели при оценке грамотности: применение в классе для первого и второго языка». Матрица чтения , 19 (1), 20—34.
  5. ^ Mostow, J.; Huang, Y.-T.; Jang, H.-J.; Weinstein, A.; Valeri, J. и Gates, D. (2017). Разработка, оценка и совершенствование автоматического генератора диагностических вопросов-запросов с множественным выбором для оценки понимания детьми прочитанного во время чтения. Natural Language Engineering, 23, 245–294.
  6. ^ "Word Clozability - Mandarin Mosaic". mandarinmosaic.com . Получено 18 июня 2024 г. .
  7. ^ Робинсон, ME (1 января 1974 г.). «Процедура Cloze и тесты на пространственное понимание». Area . 6 (2): 137–142. JSTOR  20000851.
  8. ^ "Image Occlusion Enhanced for Anki 2.1 (alpha) - AnkiWeb". ankiweb.net . Получено 7 июля 2020 г. .
  9. ^ Гловер, Джон. «Феномен «тестирования»: не исчез, но почти забыт» (PDF) . Журнал педагогической психологии : 5, 6.
  10. ^ «Вопросы и ответы в НЛП».
  11. ^ "Языковые модели как базы знаний?" (PDF) . Эмпирические методы обработки естественного языка .
  12. ^ Льюис, Патрик; Денуайе, Людовик; Ридель, Себастьян (август 2019 г.). «Неконтролируемый ответ на вопрос с помощью перевода Cloze» (PDF) . Исследование Facebook : 4896–4910. arXiv : 1906.04980 . doi : 10.18653/v1/P19-1484. S2CID  186206974.
  13. ^ «Тест Story Cloze и ROCStories Corpora».

Дополнительная информация