Микроданные — это спецификация HTML WHATWG , используемая для вложения метаданных в существующий контент на веб-страницах. [1] Поисковые системы , веб-сканеры и браузеры могут извлекать и обрабатывать микроданные с веб-страницы и использовать их для предоставления пользователям более широких возможностей просмотра. Поисковые системы получают большую выгоду от прямого доступа к микроданным, поскольку это позволяет им понимать информацию на веб-страницах и предоставлять пользователям более релевантные результаты . [2] [3] Микроданные используют вспомогательный словарь для описания элемента и пар имя-значение для присвоения значений его свойствам. [4] Микроданные — это попытка предоставить более простой способ аннотирования HTML-элементов машиночитаемыми тегами, чем аналогичные подходы с использованием RDFa и микроформатов .
В 2013 году, поскольку рабочая группа W3C HTML не смогла найти кого-то, кто мог бы работать в качестве редактора спецификации Microdata HTML , ее разработка была прекращена с «Примечанием». [5] [6] Однако с тех пор были выбраны два новых редактора и были опубликованы пять новых версий рабочего проекта, [7] [8] [9] [10] самой последней из которых был рабочий проект от 26 апреля. 2018. [10]
Словари микроданных не предоставляют семантику или значение элемента. [11] Веб-разработчики могут создавать собственный словарь или использовать словари, доступные в Интернете. Коллекция часто используемых словарей разметки предоставляется схемами Schema.org , которые включают в себя: Person , « Place », Event , Organization , Product , Review , Review-aggregate , Breadcrumb , Offer , Offer-aggregate . Веб-сайт Schema.org был создан такими операторами поисковых систем, как Google , Microsoft , Yahoo! и Яндекс , которые используют разметку микроданных для улучшения результатов поиска. [12] : 85
Для некоторых целей достаточно специального словаря. Для других потребуется разработать словарь. Там, где это возможно, авторам рекомендуется повторно использовать существующие словари, поскольку это облегчает повторное использование контента. [1]
В некоторых случаях поисковые системы, охватывающие определенные регионы, могут предоставлять расширения микроданных с учетом местной специфики. Например, Яндекс , крупная поисковая система в России, поддерживает такие микроформаты , как hCard (контактная информация компании), hRecipe (рецепт еды), hReview (обзоры рынка) и hProduct (данные о продукте), а также предоставляет собственный формат для определения терминов. и энциклопедические статьи. Это расширение было сделано для решения проблем транслитерации между кириллицей и латиницей. После реализации дополнительных параметров из словаря Schema [13] индексация информации на русскоязычных веб-страницах стала более успешной.
itemscope
– Создает элемент и указывает, что потомки этого элемента содержат информацию о нем. [1]itemtype
– Действительный URL-адрес словаря, описывающего элемент и контекст его свойств.itemid
– Указывает уникальный идентификатор элемента.itemprop
– Указывает, что содержащий его тег содержит значение указанного свойства элемента. Имя свойства и контекст значения описываются словарем элемента. Значения свойств обычно состоят из строковых значений, но также могут использовать URL-адреса, использующие a
элемент и его href
атрибут, img
элемент и его src
атрибут или другие элементы, которые ссылаются на внешние ресурсы или встраивают их. [1]itemref
– Свойства, которые не являются потомками элемента с itemscope
атрибутом, могут быть связаны с элементом с помощью этого атрибута. Предоставляет список идентификаторов элементов (не itemid
идентификаторов) с дополнительными свойствами в другом месте документа. [1]datetime
– Указывает дату или продолжительность в соответствии со стандартом ISO 8601 .Следующую разметку HTML5 можно найти на типичной странице «О нас», содержащей информацию о человеке:
< раздел > Здравствуйте, меня зовут Джон Доу, я научный сотрудникУниверситет мечты.Мои друзья зовут меня Джонни.Вы можете посетить мою домашнюю страницу по адресу <a href = "http://www.example.com/~JohnnyD" > www.example.com/~JohnnyD < / a > .Я живу по адресу 1234 Пич Драйв, Уорнер Робинс, Джорджия. </ раздел >
Вот та же разметка с добавленными микроданными Schema.org [14] [15] [16] :
< раздел itemscope itemtype = "http://schema.org/Person" > Привет меня зовут< span itemprop = " name" > Джон Доу </span> ,Я< span itemprop = "jobTitle" > дипломированный научный сотрудник </ span > в< span itemprop = "affiliation " > Университет мечты </span> .Мои друзья называют меня< span itemprop = " additionalName " > Джонни </span> .Вы можете посетить мою домашнюю страницу по адресу< a href = "http://www.example.com/~JohnnyD" itemprop = "url" > www.example.com/~JohnnyD </ a > . < раздел itemprop = "адрес" itemscope itemtype = "http://schema.org/PostalAddress" >я живу в< span itemprop = " streetAddress" > 1234 Peach Drive </span> , < span itemprop = " addressLocality " > Warner Robins </span> , < span itemprop = "addressRegion" > Georgia </span> . </ раздел > </ раздел >
Как показано в приведенном выше примере, элементы микроданных могут быть вложенными. В этом случае элемент типа http://schema.org/PostalAddress вложен в элемент типа http://schema.org/Person.
В следующем тексте показано, как Google анализирует микроданные из приведенного выше примера кода. Разработчики могут тестировать страницы, содержащие микроданные, с помощью инструмента тестирования расширенных фрагментов Google . [17]
Элемент Тип: http://schema.org/Person. имя = Джон Доу jobTitle = дипломированный научный сотрудник принадлежность = Университет мечты дополнительноеИмя = Джонни url = http://www.example.com/~JohnnyD [ постоянная неработающая ссылка ] адрес = Товар(1)Пункт 1 Введите: http://schema.org/PostalAddress. streetAddress = 1234 Пич Драйв адреслокальность = Уорнер Робинс адресРегион = Грузия
Одни и те же машиночитаемые термины могут использоваться не только в микроданных HTML, но и в других аннотациях, таких как RDFa или JSON-LD в разметке, или во внешнем файле RDF при сериализации, такой как RDF/XML , Notation3 или Turtle. .
{{cite AV media}}
: |author=
имеет общее имя ( справка )