stringtranslate.com

Wikipedia:Управление индексацией поисковых систем

Существует множество способов, с помощью которых Wikipedia пытается контролировать индексацию поисковой системой , обычно называемую в Wikipedia "noindexing". Поведение по умолчанию заключается в том, что статьи старше 90 дней индексируются. Все методы основаны на использовании HTML- тега noindex , который сообщает поисковым системам не индексировать определенные страницы. Соблюдение тега, особенно в плане удаления уже проиндексированного контента, является прерогативой отдельной поисковой системы, и теоретически тег может быть полностью проигнорирован.

Методы контроля:

  1. Управление всем пространством имен с помощью настроек программного обеспечения MediaWiki
  2. Управление классами страниц через MediaWiki:Robots.txt ( файл Robots.txt Википедии )
  3. Управление отдельными страницами путем добавления в них __NOINDEX__ волшебного слова , либо напрямую, либо с помощью шаблона {{ NOINDEX }} , однако статьи являются особым случаем, см. #Индексирование статей ("mainspace").
  4. Управление несколькими страницами путем добавления __NOINDEX__волшебного слова в стандартные шаблоны, используемые в определенных ситуациях (та же оговорка, что и в третьем пункте).

Индексация статей («mainspace»)

Статьи старше 90 дней автоматически индексируются. [1] Волшебное __NOINDEX__слово и шаблон {{ NOINDEX }} на них не действуют. Статьи моложе 90 дней не индексируются, если только они не были проверены и не имеют __NOINDEX__волшебного слова или шаблона {{ NOINDEX }} (или шаблона, который включает шаблон {{ NOINDEX }} , например шаблоны быстрого удаления). [2] [3] [4] Обратите внимание, что &action=info будет неправильно указывать, что они индексируются. [5] Статьи, которые включают шаблон {{ NOINDEX }} , перечислены в Category:Noindexed articles .

Такое патрулирование может выполняться программным обеспечением автоматически, как в случае статей, созданных редакторами с правами пользователя «автопатрулирование» или другим редактором с правами пользователя «рецензент новой страницы» (не путать с правами пользователя «рецензент ожидающих изменений» ).

Другие пространства имен и robots.txt

Управление пространством имен

В английской Википедии все User:[6] пространства имен , User talk:и пространства имен автоматически не индексируются с помощью программной настройки. [7]Draft:Draft talk:

В то же время __NOINDEX__и __INDEX__отключены, в дополнение к пространству статей , в пространстве имен Draft и пространстве имен Draft talk; они не имеют там никакого эффекта. [8]

Robots.txt неиндексируется

MediaWiki:Robots.txt запрещает аналитическим инструментам посещать чувствительные или потенциально чувствительные типы страниц, в первую очередь в пространстве имен Wikipedia – например, дебаты об удалении . Побочным эффектом не посещения обычно является то, что страница не может быть проиндексирована. По возможности, вы должны дополнительно использовать __NOINDEX__для этих страниц.

Волшебное слово NOINDEX

Отдельные страницы

Отдельные страницы можно сделать неиндексируемыми, добавив __NOINDEX__ волшебное слово на эту страницу, либо напрямую, либо с помощью шаблона {{ NOINDEX }} . Как объяснялось выше, это волшебное слово не работает в mainspace (в статьях).

Страницы с ключевым словом перечислены в категории:Неиндексированные страницы . [9]

Стандартный шаблон noindexing

Некоторые стандартные шаблоны включают __NOINDEX__ключевое слово, тем самым запрещая индексацию страниц, к которым применяются шаблоны. Такие шаблоны должны быть перечислены в категории:Шаблоны Википедии, которые применяют NOINDEX .

Биографии ныне живущих людей, страница обсуждения noindexing

Шаблоны {{ BLP }} и {{ BLP others }} включают параметр {{ NOINDEX }} . Шаблон {{ BLP }} автоматически добавляется шаблоном страницы обсуждения {{ WikiProject Biography }} , если указан параметр |living=yes; см. документацию этого шаблона для получения более подробной информации. Страницы, использующие эти шаблоны, автоматически классифицируются в категории: Статьи о биографиях ныне живущих людей .

Другие шаблоны

Эти шаблоны включают {{ NOINDEX }} :

См. также Категория:Шаблоны Википедии, которые применяют NOINDEX .

ИНДЕКС волшебное слово

Отдельные страницы

Отдельные страницы могут переопределять noindexing пространства имен, добавляя __INDEX__ волшебное слово на эту страницу, либо напрямую, либо с помощью шаблона {{ INDEX }} . Такие страницы отображаются в Category:Indexed pages . Однако INDEX не переопределяет noindexing через MediaWiki:Robots.txt . [10] Как объяснялось выше, это волшебное слово не работает в mainspace (в статьях).

Возможность добавления магического слова INDEX в пользовательские пространства (Пользователь:, Обсуждение пользователя:) была ограничена фильтром редактирования для расширенного числа подтвержденных пользователей после обсуждения в сообществе. [11]

HTML-атрибут Nofollow

С 2007 года все ссылки на другие сайты из английской Википедии имеют установленный HTML-атрибут nofollow . [12] Это означает, что на страницах, индексируемых поисковыми системами, любые ссылки, найденные поисковой системой на этих страницах, не должны влиять на рейтинг цели ссылки в индексе поисковой системы.

Прошлые обсуждения

Обсуждения пространства имен

Индивидуальные обсуждения шаблонов

Смотрите также

Примечания

  1. ^ 2017 переход с 30 на 90 дней
  2. ^ Т147544
  3. ^ Исходный код PageTriage
  4. ^ Значение $wgRCMaxAge на вики WMF
  5. ^ См. T157747
  6. ^ Решено в Wikipedia:Village pump (proposals)/Архив 126#Черновики страниц пользователей, отображаемые в поисковых системах , реализовано в phab:T104797.
  7. ^ Это $wgNamespaceRobotPolicies. См. настройку $wgNamespaceRobotPolicies Викимедиа для enwiki
  8. ^ Это контролируется настройкой программного обеспечения MediaWiki $wgExemptFromUserRobotsControl. В других проектах пространства имен, освобожденные от ограничений, совпадают с $wgContentNamespaces, который установлен на основное пространство почти во всех проектах Wikimedia – см. здесь и здесь.
  9. ^ Список составлен MediaWiki, отслеживающим ключевое слово. Название категории определяется MediaWiki:Noindex-category .
  10. ^ Он переопределяет mw:Manual:$wgArticleRobotPolicies, но это не используется в английской Википедии: настройка Викимедиа $wgArticleRobotPolicies для enwiki
  11. ^ Special:PermaLink/862856598#Запретить_новым_пользователям_индексировать_страницы_пользователей_поисковой_системой
  12. ^ Управляется $wgNoFollowLinks, установлено значение true в [файле настроек Wikimedia для enwiki]