stringtranslate.com

Инфобокс

Реальный информационный блок из вагона 43185 класса 43 компании British Rail, эксплуатируемого компанией First Great Western.

Информационное поле — это цифровая или физическая таблица, используемая для сбора и представления подмножества информации о ее предмете, например, документе . Это структурированный документ, содержащий набор пар атрибут-значение , [1] и в Википедии представляет собой сводку информации о предмете статьи . [ 2] Таким образом, они сопоставимы с таблицами данных в некоторых аспектах. При представлении в более крупном документе, который он резюмирует, информационное поле часто представляется в формате боковой панели .

Информационное поле можно реализовать в другом документе, включив его в этот документ и указав некоторые или все пары атрибут-значение, связанные с этим информационным полем, что называется параметризацией .

Википедия

Информационное поле может использоваться для обобщения информации статьи в Википедии . [3] Они используются в похожих статьях для обеспечения согласованности представления путем использования общего формата. [4] [2] Первоначально информационные поля (и шаблоны в целом) использовались для целей макета страницы . [2] Информационное поле может быть включено в статью путем указания значения для некоторых или всех его параметров . [5] Используемое имя параметра должно быть таким же, как указано в шаблоне информационного поля, но с ним может быть связано любое значение. [5] Имя отделяется от значения знаком равенства . [5] Имя параметра может рассматриваться как атрибут темы статьи. [6]

Информационное поле для статьи Википедии Crostata, отображаемое движком веб-браузера на настольном компьютере

В Википедии инфобокс включается в статью путем заключения его имени и пар атрибут-значение в двойные фигурные скобки . Затем программное обеспечение MediaWiki, на котором работает Википедия, анализирует документ, для которого инфобокс и другие шаблоны обрабатываются процессором шаблонов . Это шаблонизатор , который создает веб-документ и таблицу стилей , используемую для представления документа. Это позволяет отделить дизайн инфобокса от содержимого, которым он манипулирует; [2] то есть дизайн шаблона может быть обновлен без влияния на информацию в нем, и новый дизайн будет автоматически распространяться на все статьи, которые включают инфобокс. [4] Обычно инфобоксы форматируются так, чтобы отображаться в правом верхнем углу статьи Википедии в десктопном представлении [3] или в верхней части в мобильном представлении.

Размещение инфобокса в викитексте статьи важно для обеспечения доступности . [7] Лучше всего размещать их после шаблонов устранения неоднозначности (тех, которые направляют читателей к статьям по темам со схожими названиями) и шаблонов обслуживания (например, тех, которые отмечают статью как не имеющую ссылок), но перед всем остальным содержимым . [8] [9]

Баеза-Йейтс и Кинг говорят, что некоторые редакторы считают шаблоны, такие как информационные поля, сложными, [10] поскольку шаблон может скрывать текст о свойстве или ресурсе, который редактор хочет изменить; это усугубляется цепочками шаблонов, то есть шаблонами, включенными в другие шаблоны. [10]

По состоянию на август 2009 года английская Википедия использовала около 3000 шаблонов инфобоксов, которые в совокупности использовали более 20 000 атрибутов. [11] С тех пор многие из них были объединены, чтобы уменьшить избыточность. По состоянию на июнь 2013 года было не менее 1 345 446 трансляций родительского шаблона инфобокса , [12] использовавшегося некоторыми, но не всеми инфобоксами, в 4 251 127 статьях.

Имя инфобокса обычно «Инфобокс [жанр]»; однако широко используемые инфобоксы могут иметь более короткие имена, например «таксобокс» для таксономии. [8]

Машинное обучение

Около 44,2% статей Википедии содержали инфобокс в 2008 году [13] и около 33% в 2010 году [14] Автоматизированное извлечение семантических знаний с использованием алгоритмов машинного обучения используется для «извлечения машинно-обрабатываемой информации при относительно низкой стоимости сложности». [1] Однако низкий охват усложняет задачу, хотя это можно частично преодолеть, дополняя данные статьи данными из категорий , в которые включена статья. [13] Французская Википедия инициировала проект Infobox Version 2 в мае 2011 года. [15] [16]

Знания, полученные с помощью машинного обучения, можно использовать для улучшения статьи, например, с помощью автоматизированных программных предложений редакторам по добавлению данных инфобокса. [13] Проект iPopulator создал систему для добавления значения к параметру инфобокса статьи посредством автоматизированного анализа текста этой статьи. [11]

DBpedia использует структурированный контент, извлеченный из информационных блоков [2] с помощью алгоритмов машинного обучения, для создания ресурса связанных данных в семантической паутине ; Тим Бернерс-Ли описал его как «один из самых известных» компонентов проекта связанных данных. [17]

Машинное извлечение создает тройку, состоящую из субъекта, предиката или отношения и объекта. [1] Каждая пара атрибут-значение информационного поля используется для создания RDF- утверждения с использованием онтологии . [18] Этому способствует более узкий разрыв между Википедией и онтологией, чем существующий между неструктурированным или свободным текстом и онтологией. [19]

Семантическая связь между субъектом и объектом устанавливается предикатом. [1] В примере информационного поля тройка ("crostata", тип, "tart") указывает, что crostata является типом tart . Тема статьи используется в качестве субъекта, имя параметра используется в качестве предиката, а значение параметра - в качестве объекта. [18] [1] Каждый тип информационного поля сопоставляется с классом онтологии, а каждое свойство (параметр) внутри информационного поля сопоставляется со свойством онтологии. [20] Эти сопоставления используются при анализе статьи Википедии для извлечения данных.

Метаданные

Скриншот ссылки на эту статью, размещенной в группах по работе с приложениями Microsoft
Ссылка на эту статью, размещенная в Microsoft Teams и приложении, с использованием метаданных из информационного поля, чтобы сделать ссылку более полной, добавив изображение и краткий текст.

Представление основных фактов статьи в информационном поле также позволяет представлять факты в удобном для машин виде, что обеспечивает дополнительную функциональность, например, когда ссылка на Википедию вставляется в совместимую программу, вместо публикации только самой ссылки также публикуется другая информация, например изображение статьи.

Цитаты

  1. ^ abcde Баеза-Йейтс и Кинг 2009, стр. 31.
  2. ^ abcde Liyang 2011, стр. 385.
  3. ^ ab Broughton 2008, стр. 357.
  4. ^ ab Broughton 2008, стр. 17.
  5. ^ abc Broughton 2008, стр. 18.
  6. ^ Баеза-Йейтс и Кинг 2009, стр. 30.
  7. ^ Бротон 2008, стр. 234.
  8. ^ ab Broughton 2008, стр. 235.
  9. ^ Политика английской Википедии о доступности указана в Wikipedia:Manual of Style/Accessibility . Политика о макете викитекста указана в Wikipedia:Manual of Style/Layout и Wikipedia:Manual of Style/Lead section .
  10. ^ ab Baeza-Yates & King 2009, стр. 345.
  11. ^ аб Ланге, Бём и Науманн 2010, стр. 7.
  12. ^ "Jarry1250's Toolsserver Tools - Template transclusion count". Список проектов Wikimedia . 7 июня 2013 г. Получено 7 июня 2013 г.
  13. ^ abc Baeza-Yates & King 2009, стр. 28.
  14. ^ Ланге, Бём и Науманн 2010, с. 5.
  15. ^ Гертман, Рейнхардт и Топпен 2011, стр. 493.
  16. ^ Проект размещен на странице французской Википедии Infobox/V2.
  17. ^ Миллер 2008.
  18. ^ ab Liyang 2011, стр. 387.
  19. ^ Вирвоу и Мацуура 2012, с. 315.
  20. ^ Лиян 2011, стр. 395.

Цитируемые работы

Дальнейшее чтение