Информационное поле — это цифровая или физическая таблица, используемая для сбора и представления подмножества информации о ее предмете, например, документе . Это структурированный документ, содержащий набор пар атрибут-значение , [1] и в Википедии представляет собой сводку информации о предмете статьи . [ 2] Таким образом, они сопоставимы с таблицами данных в некоторых аспектах. При представлении в более крупном документе, который он резюмирует, информационное поле часто представляется в формате боковой панели .
Информационное поле можно реализовать в другом документе, включив его в этот документ и указав некоторые или все пары атрибут-значение, связанные с этим информационным полем, что называется параметризацией .
Информационное поле может использоваться для обобщения информации статьи в Википедии . [3] Они используются в похожих статьях для обеспечения согласованности представления путем использования общего формата. [4] [2] Первоначально информационные поля (и шаблоны в целом) использовались для целей макета страницы . [2] Информационное поле может быть включено в статью путем указания значения для некоторых или всех его параметров . [5] Используемое имя параметра должно быть таким же, как указано в шаблоне информационного поля, но с ним может быть связано любое значение. [5] Имя отделяется от значения знаком равенства . [5] Имя параметра может рассматриваться как атрибут темы статьи. [6]
В Википедии инфобокс включается в статью путем заключения его имени и пар атрибут-значение в двойные фигурные скобки . Затем программное обеспечение MediaWiki, на котором работает Википедия, анализирует документ, для которого инфобокс и другие шаблоны обрабатываются процессором шаблонов . Это шаблонизатор , который создает веб-документ и таблицу стилей , используемую для представления документа. Это позволяет отделить дизайн инфобокса от содержимого, которым он манипулирует; [2] то есть дизайн шаблона может быть обновлен без влияния на информацию в нем, и новый дизайн будет автоматически распространяться на все статьи, которые включают инфобокс. [4] Обычно инфобоксы форматируются так, чтобы отображаться в правом верхнем углу статьи Википедии в десктопном представлении [3] или в верхней части в мобильном представлении.
Размещение инфобокса в викитексте статьи важно для обеспечения доступности . [7] Лучше всего размещать их после шаблонов устранения неоднозначности (тех, которые направляют читателей к статьям по темам со схожими названиями) и шаблонов обслуживания (например, тех, которые отмечают статью как не имеющую ссылок), но перед всем остальным содержимым . [8] [9]
Баеза-Йейтс и Кинг говорят, что некоторые редакторы считают шаблоны, такие как информационные поля, сложными, [10] поскольку шаблон может скрывать текст о свойстве или ресурсе, который редактор хочет изменить; это усугубляется цепочками шаблонов, то есть шаблонами, включенными в другие шаблоны. [10]
По состоянию на август 2009 года английская Википедия использовала около 3000 шаблонов инфобоксов, которые в совокупности использовали более 20 000 атрибутов. [11] С тех пор многие из них были объединены, чтобы уменьшить избыточность. По состоянию на июнь 2013 года было не менее 1 345 446 трансляций родительского шаблона инфобокса , [12] использовавшегося некоторыми, но не всеми инфобоксами, в 4 251 127 статьях.
Имя инфобокса обычно «Инфобокс [жанр]»; однако широко используемые инфобоксы могут иметь более короткие имена, например «таксобокс» для таксономии. [8]
Около 44,2% статей Википедии содержали инфобокс в 2008 году [13] и около 33% в 2010 году [14] Автоматизированное извлечение семантических знаний с использованием алгоритмов машинного обучения используется для «извлечения машинно-обрабатываемой информации при относительно низкой стоимости сложности». [1] Однако низкий охват усложняет задачу, хотя это можно частично преодолеть, дополняя данные статьи данными из категорий , в которые включена статья. [13] Французская Википедия инициировала проект Infobox Version 2 в мае 2011 года. [15] [16]
Знания, полученные с помощью машинного обучения, можно использовать для улучшения статьи, например, с помощью автоматизированных программных предложений редакторам по добавлению данных инфобокса. [13] Проект iPopulator создал систему для добавления значения к параметру инфобокса статьи посредством автоматизированного анализа текста этой статьи. [11]
DBpedia использует структурированный контент, извлеченный из информационных блоков [2] с помощью алгоритмов машинного обучения, для создания ресурса связанных данных в семантической паутине ; Тим Бернерс-Ли описал его как «один из самых известных» компонентов проекта связанных данных. [17]
Машинное извлечение создает тройку, состоящую из субъекта, предиката или отношения и объекта. [1] Каждая пара атрибут-значение информационного поля используется для создания RDF- утверждения с использованием онтологии . [18] Этому способствует более узкий разрыв между Википедией и онтологией, чем существующий между неструктурированным или свободным текстом и онтологией. [19]
Семантическая связь между субъектом и объектом устанавливается предикатом. [1] В примере информационного поля тройка ("crostata", тип, "tart") указывает, что crostata является типом tart . Тема статьи используется в качестве субъекта, имя параметра используется в качестве предиката, а значение параметра - в качестве объекта. [18] [1] Каждый тип информационного поля сопоставляется с классом онтологии, а каждое свойство (параметр) внутри информационного поля сопоставляется со свойством онтологии. [20] Эти сопоставления используются при анализе статьи Википедии для извлечения данных.
Представление основных фактов статьи в информационном поле также позволяет представлять факты в удобном для машин виде, что обеспечивает дополнительную функциональность, например, когда ссылка на Википедию вставляется в совместимую программу, вместо публикации только самой ссылки также публикуется другая информация, например изображение статьи.
{{cite book}}
: |work=
проигнорировано ( помощь )