Микроданные — это спецификация HTML WHATWG, используемая для вложения метаданных в существующий контент на веб-страницах. [1] Поисковые системы , веб-сканеры и браузеры могут извлекать и обрабатывать микроданные с веб-страницы и использовать их для предоставления пользователям более широких возможностей просмотра. Поисковые системы получают большую выгоду от прямого доступа к микроданным, поскольку это позволяет им понимать информацию на веб-страницах и предоставлять пользователям более релевантные результаты . [2] [3] Микроданные используют вспомогательный словарь для описания элемента и пары «имя-значение» для назначения значений его свойствам. [4] Микроданные — это попытка предоставить более простой способ аннотирования элементов HTML с помощью машиночитаемых тегов, чем аналогичные подходы с использованием RDFa и микроформатов .
В 2013 году, поскольку рабочая группа W3C HTML не смогла найти кого-то, кто мог бы стать редактором спецификации Microdata HTML , ее разработка была прекращена с пометкой «Примечание». [5] [6] Однако с тех пор было выбрано два новых редактора и опубликовано пять новых версий рабочего проекта, [7] [8] [9] [10] последней из которых является рабочий проект от 26 апреля 2018 года. [10]
Словари микроданных не предоставляют семантику или значение элемента. [11] Веб-разработчики могут разработать собственный словарь или использовать словари, доступные в Интернете. Коллекция часто используемых словарей разметки предоставляется схемами Schema.org , которые включают: Person , " Place ", Event , Organization , Product , Review , Review-aggregate , Breadcrumb , Offer , Offer-aggregate . Веб-сайт schema.org был создан операторами поисковых систем, такими как Google , Microsoft , Yahoo! и Yandex , которые используют разметку микроданных для улучшения результатов поиска. [12] : 85
Для некоторых целей достаточно специального словаря. Для других же необходимо разработать словарь. По возможности авторам рекомендуется повторно использовать существующие словари, так как это упрощает повторное использование контента. [1]
В некоторых случаях поисковые системы, охватывающие определенные регионы, могут предоставлять локально-специфичные расширения микроданных. Например, Yandex , крупнейшая поисковая система в России, поддерживает такие микроформаты , как hCard (контактная информация компании), hRecipe (рецепт еды), hReview (обзоры рынка) и hProduct (данные о продуктах), а также предоставляет собственный формат для определения терминов и энциклопедических статей. Это расширение было сделано для решения проблем транслитерации между кириллицей и латиницей. После внедрения дополнительных параметров из словаря Schema [13] индексация информации на русскоязычных веб-страницах стала более успешной.
itemscope
– Создает элемент и указывает, что потомки этого элемента содержат информацию о нем. [1]itemtype
– Действительный URL-адрес словаря, описывающего элемент и контекст его свойств.itemid
– Указывает уникальный идентификатор элемента.itemprop
– Указывает, что содержащий его тег содержит значение указанного свойства элемента. Имя свойства и контекст значения описываются словарем элемента. Значения свойств обычно состоят из строковых значений, но также могут использовать URL-адреса с использованием элемента a
и его href
атрибута, img
элемента и его src
атрибута или других элементов, которые ссылаются на внешние ресурсы или встраивают их. [1]itemref
– Свойства, которые не являются потомками элемента с itemscope
атрибутом, могут быть связаны с элементом с помощью этого атрибута. Предоставляет список идентификаторов элементов (не itemid
s) с дополнительными свойствами в другом месте документа. [1]datetime
– Указывает дату или продолжительность, как указано в стандарте ISO 8601 .На типичной странице «О нас», содержащей информацию о человеке, можно найти следующую разметку HTML5:
< div > Здравствуйте, меня зовут Джон Доу, я аспирант-исследователь вУниверситет Мечты.Мои друзья называют меня Джонни.Вы можете
посетить мою домашнюю страницу по адресу <a href="http://www.example.com/~JohnnyD"> www.example.com/~JohnnyD </a> . Я
живу по адресу 1234 Peach Drive, Warner Robins, Джорджия . </div>
Вот та же разметка с добавленными микроданными Schema.org [14] [15] [16] :
< div itemscope itemtype = "http://schema.org/Person" > Привет, меня зовут< span itemprop = "name" > Джон Доу </ span > ,Я есть< span itemprop = "jobTitle" > научный сотрудник аспирантуры </ span > в< span itemprop = "affiliation" > Университет мечты </ span > .Мои друзья называют меня< span itemprop = "additionalName" > Джонни </ span > .Вы можете посетить мою домашнюю страницу по адресу< a href = "http://www.example.com/~JohnnyD" itemprop = "url" > www.example.com/~JohnnyD </ a > . < div itemprop = "address" itemscope itemtype = "http://schema.org/PostalAddress" >Я живу в< span itemprop = "streetAddress" > 1234 Peach Drive </ span > , < span itemprop = "addressLocality" > Warner Robins </ span > , < span itemprop = "addressRegion" > Джорджия </ span > . </ div > </ div >
Как показывает пример выше, элементы микроданных могут быть вложенными. В этом случае элемент типа http://schema.org/PostalAddress вложен в элемент типа http://schema.org/Person.
Следующий текст показывает, как Google анализирует микроданные из приведенного выше примера кода. Разработчики могут тестировать страницы, содержащие микроданные, с помощью инструмента тестирования Rich Snippet Testing Tool от Google . [17]
Элемент Тип: http://schema.org/Person имя = Джон Доу jobTitle = научный сотрудник аспирантуры принадлежность = Университет Мечты дополнительноеИмя = Джонни URL-адрес = http://www.example.com/~JohnnyD адрес = Элемент(1)Пункт 1 Тип: http://schema.org/PostalAddress Адрес улицы = 1234 Peach Drive addressLocality = Уорнер Робинс адресРегион = Грузия
Одни и те же машиночитаемые термины можно использовать не только в микроданных HTML, но и в других аннотациях, таких как RDFa или JSON-LD в разметке, или во внешнем файле RDF в сериализации, такой как RDF/XML , Notation3 или Turtle .
{{cite AV media}}
: |author=
имеет общее название ( помощь )