stringtranslate.com

Наложенный код

Карточка с надрезом по краю с данными для библиографической записи. Края еще не надрезаны.

Наложенный код, такой как Zatocoding, представляет собой разновидность хэш-кода , который был популярен в маргинальных системах с перфокартами .

Перфорированные системы

Многие названия, некоторые из которых являются товарными знаками, использовались для систем с маргинальными перфокартами: карты с надрезами по краю, карты с прорезями, EZ Sort, Zatocards, McBee, McBee Keysort, Flexisort, Velom, Rocket и т. д. В центре каждой карты содержалась соответствующая информация — обычно название и автор книги, исследовательской работы или журнальной статьи на ближайшей полке; а также список предметов и ключевых слов. Некоторые наборы карт содержали всю информацию, необходимую пользователю, на самой карте, написанную от руки, напечатанную на машинке или на микрофильме ( апертурная карта ). Каждая карта в стопке имела одинаковый набор предварительно пробитых отверстий. Пользователь находил конкретные карты, соответствующие поиску, выравнивая отверстия в наборе карт (используя держатель карт или лоток для карт), вставляя один или несколько стержней, похожих на спицы, по всей стопке, так что нужные карты (которые были надрезаны или разрезаны) выпадали из нерелевантных карт в коллекции (остались ненадрезанными), которые оставались на спице(ах). Пользователь мог повторять этот выбор много раз, чтобы сформировать сложный логический поисковый запрос. Карта, которая была релевантна 2 или более субъектам, имела бы вырезанные слоты для каждого из этих субъектов, так что эта карта выпадала бы, когда был выбран один или другой или оба субъекта. Системы кодирования «наложенного кода», такие как Zatocoding, экономили место, вводя несколько или все субъекты в одно и то же поле; такой «наложенный код» хранит гораздо больше информации в меньшем пространстве, но ценой случайных «ложных» выборов. [1]

Как только у вас есть коллекция карточек, по одной на книгу, исследовательскую работу или журнальную статью в библиотеке, со списком ключевых слов (тем), обсуждаемых в конкретной книге, записанных на карточке этой книги, «очевидный способ» кодирования этих тем — подсчитать общее количество тем, используемых во всей коллекции R, сделать ряд отверстий R в верхней части каждой карточки и для каждой темы, фактически обсуждаемой в конкретной книге, вырезать прорезь из отверстия, соответствующего этой теме, на карточке, соответствующей этой книге. [2] Естественно, это также требует отдельного списка каждой темы, используемой в коллекции, который указывает, какое отверстие пробито для каждой темы. К сожалению, в коллекции могут быть тысячи различных тем, и непрактично пробивать тысячи отверстий в каждой карточке. Хотя может показаться невозможным использовать менее 1 отверстия на тему, системы наложенных кодов могут решить эту проблему.

Наложенные коды

Система поиска информации Zatocoding была разработана Кэлвином Мурсом в 1947 году. [3]

Кэлвин Мурс изобрел Zatocoding в Массачусетском технологическом институте, механическую систему поиска информации, основанную на наложенных кодах, и основал компанию Zator в 1947 году для коммерциализации ее приложений. [4] Конкретный наложенный код, используемый в этой системе, называется Zatocoding , в то время как система поиска информации с помощью перфокарт на полях в целом называется « Zator ». [5]

Настройка наложенного кода для конкретной библиотеки выглядит примерно так:

Позже, когда нам нужно найти книги по какой-то конкретной теме, мы ищем эту тему в нашем списке всех R тем, находим соответствующую схему прорезей из n прорезей и прокладываем n игл по всей стопке в этой схеме. Все карты, вырезанные по этой схеме, выпадут. Возможно, что также выпадут несколько других нежелательных карт — карты с несколькими темами, схемы отверстий которых перекрываются таким образом, чтобы имитировать желаемую схему. Вероятность F того, что некоторая нежелательная карта с v прорезями в ней провалится, когда мы выбираем некоторую схему из n игл, составляет приблизительно . Большинство систем имеют достаточно большое N и достаточно малое r, так что v < N/2 (т. е. карта пробита менее чем наполовину), так что вероятность проваливания нежелательной карты меньше . [2]

Существует несколько различных способов выбора отверстий, которые будут прорезаны для каждого предмета.

(Было разработано несколько вариантов Zatocoding. Борн описывает вариант «для новых поисковых систем, требующих высокой производительности наложенной системы кодирования» [6] , используя подход, опубликованный Мурсом в 1959 году [7] )

Zatocode

Настройка Zatocode для определенного списка предметов R выглядит примерно так: [2]

Другие наложенные коды

Zatocode требует кодовую книгу, которая перечисляет все предметы и случайно сгенерированный код выемки, связанный с каждым из них. Другие «прямые» наложенные коды имеют фиксированную хэш-функцию для преобразования букв в (одном написании) предмета в код выемки. Такие коды требуют гораздо более короткой кодовой книги, которая описывает перевод букв в слове в соответствующий код выемки, и в принципе могут легко добавлять новые предметы без изменения кодовой книги. [5]

Фильтр Блума можно считать своего рода наложенным кодом. [8]

Ссылки

  1. ^ Роберт В. Уильямс. «Перфокарты: краткое руководство». computing now 2002.
  2. ^ abcd W. Ross Ashby. Журнал W. Ross Ashby: Zato-coding 1960 22 сентября. стр. 6208-6222
  3. ^ «Об обложке». Новости колледжей и исследовательских библиотек, апрель 2008 г. [1][2]
  4. ^ Юджин Гарфилд . «Сохраняющаяся актуальность наложенного кодирования». Журнал информационной науки 8 (1984) 181.
  5. ^ ab Герберт Марвин Олман . «Частоты букв подлежащего-слова с применением к супервложенному кодированию». Труды Международной конференции по научной информации (1959).
  6. ^ Борн, Чарльз П. (1963). Методы обработки информации . John Wiley & Sons, Inc. стр. 67.
  7. ^ Mooers, Calvin N. (апрель 1959 г.). Применение простого отбора включения шаблонов к крупномасштабным системам поиска информации . Компания Zator.
  8. ^ Джеймс Блюстейн; и Амаль Эль-Маазави. «Фильтры Блума — Учебное пособие, анализ и обзор». стр. 11.

Внешние ссылки