stringtranslate.com

Оптическое распознавание меток

Оптическое распознавание меток ( OMR ) собирает данные от людей, идентифицируя отметки на бумаге . OMR позволяет ежечасно обрабатывать сотни или даже тысячи документов. Распространенное применение этой технологии — экзамены, где студенты отмечают ячейки в качестве своих ответов. Это позволяет очень быстро выполнять автоматическую оценку экзаменационных листов.

Фон

Тестовая форма OMR с регистрационными метками и выпадающими цветами, предназначенная для сканирования специальным OMR-устройством.

Во многих устройствах OMR есть сканер , который освещает форму. Затем устройство смотрит на контрастную отражательную способность света в определенных местах на форме. Оно обнаружит черные метки, поскольку они отражают меньше света, чем пустые области на форме.

Некоторые устройства OMR используют формы, напечатанные на трансоптической бумаге. Затем устройство может измерить количество света, проходящего через бумагу. Оно будет улавливать любые черные отметки с обеих сторон бумаги, поскольку они уменьшают количество проходящего света.

В отличие от специализированного устройства OMR, настольное программное обеспечение OMR позволяет пользователю создавать собственные формы в текстовом процессоре или компьютере и печатать их на лазерном принтере . Затем программное обеспечение OMR работает с обычным настольным сканером изображений с устройством подачи документов для обработки заполненных форм.

OMR в целом отличается от оптического распознавания символов (OCR) тем, что не требуется сложный механизм распознавания образов . То есть, метки конструируются таким образом, что существует небольшая вероятность того, что устройство OMR не будет их правильно считывать. Для этого требуется, чтобы изображение имело высокую контрастность и легко узнаваемую или нерелевантную форму. Связанной с OMR и OCR областью является распознавание штрихкодов , таких как штрихкод UPC, который находится на упаковке продукта.

Одним из наиболее известных применений OMR является использование оптических бланков ответов с пузырьками карандаша № 2 (HB в Европе) на экзаменах с несколькими вариантами ответов . Студенты отмечают свои ответы или другую личную информацию, закрашивая кружки на бланках. Затем лист оценивается сканирующей машиной.

Ромбовидные отметки представляют собой более позднюю технологию, которую легче маркировать и легче стирать. Большие «пузырьковые» отметки являются устаревшей технологией очень ранних машин OMR , которые были настолько нечувствительны, что для надежности требовалась большая отметка. В большинстве азиатских стран для заполнения оптического листа ответов используется специальный маркер . Учащиеся также отмечают ответы или другую информацию, затемняя кружки, отмеченные на предварительно напечатанном листе. Затем лист автоматически оценивается сканирующей машиной.

Многие из современных приложений OMR предполагают заполнение людьми специализированных форм. Эти формы оптимизированы для компьютерного сканирования, с тщательной регистрацией при печати и тщательной разработкой, чтобы свести неоднозначность к минимуму. Благодаря чрезвычайно низкому уровню ошибок, низкой стоимости и простоте использования OMR является популярным методом подсчета голосов. [1] [2] [3] [4] [5 ] [6] [7] [8] [9] [10]

Метки OMR также добавляются к печатным почтовым отправлениям, чтобы можно было использовать оборудование для вставки папок. Метки добавляются к каждой (обычно разворотной/нечетной) странице почтового документа и состоят из последовательности черных черточек, которые оборудование для вставки папок сканирует, чтобы определить, когда почтовое отправление должно быть сложено, а затем вложено в конверт .

Оптический лист ответов

Ответ на математический вопрос SAT , отмеченный на оптическом бланке ответов

Оптический лист ответов или лист с пузырьками — это особый тип формы , используемый в экзаменах с несколькими вариантами ответов. OMR используется для обнаружения ответов. Scantron Corporation создает множество оптических листов ответов, хотя для некоторых видов использования требуется собственная настраиваемая система. [ необходима цитата ]

Оптические листы ответов обычно имеют набор пустых овалов или ячеек, которые соответствуют каждому вопросу, часто на отдельных листах бумаги. Штрихкоды могут отмечать лист для автоматической обработки, и каждая серия заполненных овалов будет возвращать определенное значение при считывании. Таким образом, ответы студентов могут быть записаны в цифровом виде или идентифицированы.

Чтение

Первые оптические листы ответов считывались путем пропускания света через лист и измерения того, сколько света было заблокировано с помощью фотоэлементов на противоположной стороне. [11] Поскольку некоторые фотоэлементы в основном чувствительны к синей части видимого спектра , [12] синие ручки не могли использоваться, так как синие чернила отражают и пропускают синий свет. Из-за этого для заполнения пузырьков приходилось использовать карандаши номер два — графит — очень непрозрачное вещество, которое поглощает или отражает большую часть света, который на него попадает. [11]

Современные оптические листы ответов считываются на основе отраженного света, измеряя светлоту и темноту. Их не нужно заполнять карандашом номер два, хотя они рекомендуются по сравнению с другими типами (это связано с более светлыми отметками, сделанными карандашами с более высоким номером, и пятнами от карандашей номер 1). Черные чернила будут считываться, хотя многие системы будут игнорировать отметки того же цвета, что и форма, напечатанная в ней. [11] Это также позволяет оптическим листам ответов быть двусторонними, поскольку отметки, сделанные на противоположной стороне, не будут мешать показаниям отражательной способности так сильно, как показаниям непрозрачности.

Большинство систем учитывают человеческие ошибки, связанные с неточным заполнением овалов, — пока они не затрагивают другие овалы и овал почти заполнен, сканер определит его как заполненный.

Дизайн и печать

Существуют определенные размеры проектирования листов OMR с точностью 0,05 мм по шкале. Если размеры не соответствуют точности масштаба, точность листа OMR может варьироваться, поэтому лист должен быть разработан, напечатан и вырезан идеально.

Ошибки

Оптические листы ответов могут быть напечатаны неправильно, так что все овалы будут считаны как заполненные. Это происходит, если контур овалов слишком толстый или неровный. Во время президентских выборов в США 2008 года это произошло с более чем 19 000 открепительных удостоверений в округе Гвиннетт в Джорджии и было обнаружено после того, как около 10 000 уже были возвращены. Небольшая разница не была очевидна невооруженным глазом и не была обнаружена до тех пор, пока в конце октября не был проведен тестовый запуск. Для этого потребовалось, чтобы все бюллетени были переведены в правильно напечатанные, изолированными работниками избирательной комиссии под пристальным наблюдением членов Демократической и Республиканской (но не других ) политических партий и заместителей шерифа округа . Передача, по закону, не могла произойти до дня выборов (4 ноября). [ необходима цитата ]

программное обеспечение OMR

Форма обследования OMR на обычной бумаге, без регистрационных меток и выпадающих цветов, предназначенная для сканирования сканером изображений и программным обеспечением OMR

Программное обеспечение OMR — это компьютерное приложение, которое делает возможным OMR на настольном компьютере, используя сканер изображений для обработки опросов, тестов, табелей посещаемости, контрольных списков и других форм на обычной бумаге, напечатанных на лазерном принтере.

Программное обеспечение OMR используется для сбора данных с листов OMR. При сборе данных сканирующие устройства фокусируются на многих факторах, таких как толщина бумаги, размеры листа OMR и шаблон проектирования.

Коммерческое программное обеспечение OMR

Одним из первых пакетов программного обеспечения OMR, который использовал изображения с обычных сканеров изображений, был Remark Office OMR, созданный Gravic, Inc. (первоначально называвшийся Principia Products, Inc.). Remark Office OMR 1.0 был выпущен в 1991 году.

Потребность в программном обеспечении OMR возникла из-за того, что ранние системы оптического распознавания меток использовали специальные сканеры и специальные предварительно напечатанные формы с выпадающими цветами и регистрационными метками. Такие формы обычно стоят от 0,10 до 0,19 долларов США за страницу. [13] Напротив, пользователи программного обеспечения OMR разрабатывают собственные формы с метками с помощью текстового процессора или встроенного редактора форм, распечатывают их локально на принтере и могут сэкономить тысячи долларов на большом количестве форм. [14]

Идентификация оптических меток в форме, например, для обработки форм переписи населения , предлагалась многими компаниями по обработке форм (Batch Transaction Capture) с конца 1980-х годов. В основном это основано на двухтональном изображении и количестве пикселей с минимальным и максимальным количеством пикселей для устранения посторонних меток, таких как те, которые были стерты грязным ластиком, которые при преобразовании в черно-белое изображение (двухтональное) могут выглядеть как законная метка. Поэтому этот метод может вызвать проблемы, когда пользователь меняет свое решение, и поэтому некоторые продукты начали использовать оттенки серого, чтобы лучше определить намерение маркера — внутренние сканеры scantron и NCS использовали оттенки серого .

Программное обеспечение OMR также используется для добавления меток OMR к почтовым документам, чтобы их можно было сканировать с помощью оборудования для вставки папок. Примером программного обеспечения OMR является Mail Markup от британского разработчика Funasset Limited. Это программное обеспечение позволяет пользователю настраивать и выбирать последовательность OMR, а затем применять метки OMR к почтовым документам перед печатью.

История

Оптическое распознавание меток (OMR) — это сканирование бумаги для обнаружения наличия или отсутствия метки в заданном положении. [4] Оптическое распознавание меток развилось из нескольких других технологий. В начале 19-го и 20-го века были выданы патенты на машины, которые должны были помогать слепым. [2]

В настоящее время OMR используется в качестве устройства ввода данных. Две ранние формы OMR — это бумажная лента и перфокарты , которые используют настоящие отверстия, пробитые в носителе, а не закрашенные карандашом круги на носителе. Бумажная лента использовалась еще в 1857 году в качестве устройства ввода для телеграфа. [10] Перфокарты были созданы в 1890 году и использовались в качестве устройств ввода для компьютеров. Использование перфокарт значительно сократилось в начале 1970-х годов с появлением персональных компьютеров. [8] В современной OMR, где распознается наличие заполненного карандашом пузыря, распознавание выполняется с помощью оптического сканера.

Первым сканером с функцией распознавания меток была машина IBM 805 Test Scoring Machine ; она считывала метки, считывая электропроводность графитового грифеля карандаша с помощью пар проволочных щеток, которые сканировали страницу. В 1930-х годах Ричард Уоррен из IBM экспериментировал с оптическими системами распознавания меток для оценки тестов, как описано в патентах США 2,150,256 (подана в 1932 году, выдана в 1939 году) и 2,010,653 (подана в 1933 году, выдана в 1935 году). Первый успешный оптический сканер с функцией распознавания меток был разработан Эвереттом Франклином Линдквистом , как описано в патенте США 3,050,248 (подана в 1955 году, выдана в 1962 году). Линдквист разработал множество стандартизированных образовательных тестов и нуждался в более совершенной машине для подсчета результатов тестов, чем стандартная на тот момент IBM 805. Права на патенты Линдквиста принадлежали Исследовательскому центру измерений до 1968 года, когда Университет Айовы продал предприятие корпорации Westinghouse .

В тот же период IBM также разработала успешную оптическую машину для проверки и подсчета меток, как описано в патенте США 2,944,734 (поданном в 1957 году, выданном в 1960 году). IBM выпустила ее на рынок как оптический считыватель меток IBM 1230 в 1962 году. Эта и ряд связанных с ней машин позволили IBM перенести широкий спектр приложений, разработанных для ее машин для проверки меток, на новую оптическую технологию. Эти приложения включали в себя различные формы управления запасами и сообщения о неполадках, большинство из которых имели размеры стандартной перфокарты .

В то время как другие игроки на арене образовательного тестирования сосредоточились на продаже услуг сканирования, Scantron Corporation, основанная в 1972 году, [15] имела другую модель; она распространяла недорогие сканеры в школах и получала прибыль от продажи тестовых форм. В результате многие люди стали думать обо всех формах с отметками (независимо от того, оптически считываемых или нет) как о формах скантрона .

В 1983 году Westinghouse Learning Corporation была приобретена National Computer Systems (NCS). В 2000 году NCS была приобретена Pearson Education , где технология OMR легла в основу группы управления данными Pearson. В феврале 2008 года M&F Worldwide приобрела группу управления данными у Pearson; теперь эта группа является частью бренда Scantron. [16]

OMR использовался во многих ситуациях, как указано ниже. Использование OMR в системах инвентаризации было переходом между перфокартами и штрихкодами и не используется так часто для этой цели. [8] OMR все еще широко используется для обследований и тестирования.

Использование

Использование OMR не ограничивается школами или агентствами по сбору данных ; многие предприятия и учреждения здравоохранения используют OMR для оптимизации своих процессов ввода данных и уменьшения ошибок ввода. Технологии OMR, OCR и ICR предоставляют средства сбора данных с бумажных форм. OMR также может быть выполнено с использованием сканера OMR (дискретная считывающая головка) или сканера изображений. [17]

Приложения

Форма ставок OMR, используемая на ипподроме Фукусима Японской ассоциации скачек , Япония.
Билет для ставок, используя эту форму.

Существует множество других применений OMR, например:

Типы полей

OMR имеет различные поля для предоставления формата, который желает спрашивающий. Эти поля включают:

Возможности/требования

В прошлом и в настоящее время некоторые системы OMR требуют специальной бумаги, специальных чернил и специального считывателя ввода (Bergeron, 1998). Это ограничивает типы вопросов, которые можно задать, и не допускает большой вариативности при вводе формы. Прогресс в OMR теперь позволяет пользователям создавать и распечатывать собственные формы и использовать сканер (предпочтительно с устройством подачи документов) для считывания информации. [18] Пользователь может упорядочить вопросы в формате, который соответствует его потребностям, при этом сохраняя возможность легко вводить данные. [19] Системы OMR приближаются к стопроцентной точности и в среднем тратят всего 5 миллисекунд на распознавание отметок. [18] Пользователи могут использовать квадраты, круги, эллипсы и шестиугольники для зоны отметки. Затем программное обеспечение можно настроить на распознавание заполненных пузырьков, крестиков или галочек.

OMR также может использоваться для личного использования. На рынке есть принтеры «все в одном», которые печатают фотографии, выбранные пользователем путем заполнения кружков для выбора размера и бумаги на распечатанном индексном листе. После заполнения листа пользователь помещает его на сканер для сканирования, и принтер печатает фотографии в соответствии с указанными отметками. [ необходима цитата ]

Недостатки

Существуют также некоторые недостатки и ограничения OMR. Если пользователь хочет собрать большие объемы текста, то OMR усложняет сбор данных. [20] Также существует вероятность пропуска данных в процессе сканирования, а неправильно или не пронумерованные страницы могут привести к их сканированию в неправильном порядке. Кроме того, если не приняты меры безопасности, страница может быть повторно отсканирована, что приведет к дублированию данных и искажению данных. [18]

В результате широкого распространения и простоты использования OMR стандартизированные экзамены могут состоять в основном из вопросов с несколькими вариантами ответов, что меняет характер проверяемого материала.

Смотрите также

Списки

Ссылки

  1. ^ "Оптическое распознавание меток". Архивировано из оригинала 13 июня 2006 г. Получено 13 июня 2006 г.
  2. ^ ab Research Оптическое распознавание символов | Научная библиотека Macmillan: Компьютерные науки. Bookrags.com. 2010-11-02 . Получено 2015-07-03 .
  3. ^ "Оптические сканирующие системы —". Aceproject.org . Получено 2015-07-03 .
  4. ^ ab Haag, S., Cummings, M., McCubbrey, D., Pinsonnault, A., Donovan, R. (2006). Системы управленческой информации для информационной эпохи (3-е изд.). Канада: McGraw-Hill Ryerson.
  5. ^ "Statisticians' Lib: Using Scanners and OMR Software for Affordable Data Input". Архивировано из оригинала 10 ноября 2005 г. Получено 13 июня 2006 г.
  6. ^ "Сбор данных по дешевке". Июль 2015 г. Архивировано из оригинала (PPT) 22-07-2015 . Получено 21-07-2015 .
  7. ^ "Remark Office OMR от Gravic (Principia Products) работает с популярными сканерами изображений для сканирования опросов, тестов и других форм на обычной бумаге". Omrsolutions.com . Получено 03.07.2015 .
  8. ^ abc Palmer, Roger C. (1989, сентябрь) Основы автоматической идентификации [Электронная версия]. Canadian Datasystems, 21 (9), 30-33
  9. ^ "Технология обработки форм". Tkvision.com. Архивировано из оригинала 2008-05-11 . Получено 2015-07-03 .
  10. ^ ab Устройства ввода данных для исследований | Научная библиотека Macmillan: Компьютерные науки. Bookrags.com. 2010-11-02 . Получено 2015-07-03 .
  11. ^ abc Bloomfield, Louis A (29 мая 2006 г.). «Вопрос 1529: Почему тесты типа скантрона считывают только карандаши № 2? Могут ли работать другие карандаши?». HowEverythingWorks.org.
  12. ^ Технический справочник Малларда, том 4, раздел 4: Фотоэмиссионные элементы (издание 1960 г.)
  13. ^ "Архивная копия" (PDF) . Архивировано из оригинала (PDF) 2009-03-20 . Получено 12-03-2009 .{{cite web}}: CS1 maint: archived copy as title (link)
  14. ^ Майкл Вагенхайм. «Оценка экзаменов по биологии в крупном государственном университете». RemarkSoftware.com . Получено 21 июля 2015 г.
  15. ^ "Рынок образовательного тестирования". Bc.edu . Получено 2015-07-03 .
  16. ^ "NCS Pearson, Inc". Архивировано из оригинала 14 июня 2010 г. Получено 14 июня 2010 г.
  17. ^ http://datamanagement.scantron.com/pdf/icr-ocr-omr.pdf [ мертвая ссылка ]
  18. ^ abc Бержерон, [ кто? ]
  19. ^ LoPresti, 1996 [ кто? ]
  20. ^ Грин, 2000 [ кто? ]