Существует множество способов, с помощью которых Wikipedia пытается контролировать индексацию поисковой системой , обычно называемую в Wikipedia "noindexing". Поведение по умолчанию заключается в том, что статьи старше 90 дней индексируются. Все методы основаны на использовании HTML- тега noindex , который сообщает поисковым системам не индексировать определенные страницы. Соблюдение тега, особенно в плане удаления уже проиндексированного контента, является прерогативой отдельной поисковой системы, и теоретически тег может быть полностью проигнорирован.
Методы контроля:
__NOINDEX__
волшебного слова , либо напрямую, либо с помощью шаблона {{ NOINDEX }} , однако статьи являются особым случаем, см. #Индексирование статей ("mainspace").__NOINDEX__
волшебного слова в стандартные шаблоны, используемые в определенных ситуациях (та же оговорка, что и в третьем пункте).Статьи старше 90 дней автоматически индексируются. [1] Волшебное __NOINDEX__
слово и шаблон {{ NOINDEX }} на них не действуют. Статьи моложе 90 дней не индексируются, если только они не были проверены и не имеют __NOINDEX__
волшебного слова или шаблона {{ NOINDEX }} (или шаблона, который включает шаблон {{ NOINDEX }} , например шаблоны быстрого удаления). [2] [3] [4] Обратите внимание, что &action=info будет неправильно указывать, что они индексируются. [5] Статьи, которые включают шаблон {{ NOINDEX }} , перечислены в Category:Noindexed articles .
Такое патрулирование может выполняться программным обеспечением автоматически, как в случае статей, созданных редакторами с правами пользователя «автопатрулирование» или другим редактором с правами пользователя «рецензент новой страницы» (не путать с правами пользователя «рецензент ожидающих изменений» ).
В английской Википедии все User:
[6] пространства имен , User talk:
и пространства имен автоматически не индексируются с помощью программной настройки. [7]Draft:
Draft talk:
В то же время __NOINDEX__
и __INDEX__
отключены, в дополнение к пространству статей , в пространстве имен Draft и пространстве имен Draft talk; они не имеют там никакого эффекта. [8]
MediaWiki:Robots.txt запрещает аналитическим инструментам посещать чувствительные или потенциально чувствительные типы страниц, в первую очередь в пространстве имен Wikipedia – например, дебаты об удалении . Побочным эффектом не посещения обычно является то, что страница не может быть проиндексирована. По возможности, вы должны дополнительно использовать __NOINDEX__
для этих страниц.
Отдельные страницы можно сделать неиндексируемыми, добавив __NOINDEX__
волшебное слово на эту страницу, либо напрямую, либо с помощью шаблона {{ NOINDEX }} . Как объяснялось выше, это волшебное слово не работает в mainspace (в статьях).
Страницы с ключевым словом перечислены в категории:Неиндексированные страницы . [9]
Некоторые стандартные шаблоны включают __NOINDEX__
ключевое слово, тем самым запрещая индексацию страниц, к которым применяются шаблоны. Такие шаблоны должны быть перечислены в категории:Шаблоны Википедии, которые применяют NOINDEX .
Шаблоны {{ BLP }} и {{ BLP others }} включают параметр {{ NOINDEX }} . Шаблон {{ BLP }} автоматически добавляется шаблоном страницы обсуждения {{ WikiProject Biography }} , если указан параметр |living=yes
; см. документацию этого шаблона для получения более подробной информации. Страницы, использующие эти шаблоны, автоматически классифицируются в категории: Статьи о биографиях ныне живущих людей .
Эти шаблоны включают {{ NOINDEX }} :
См. также Категория:Шаблоны Википедии, которые применяют NOINDEX .
Отдельные страницы могут переопределять noindexing пространства имен, добавляя __INDEX__
волшебное слово на эту страницу, либо напрямую, либо с помощью шаблона {{ INDEX }} . Такие страницы отображаются в Category:Indexed pages . Однако INDEX не переопределяет noindexing через MediaWiki:Robots.txt . [10] Как объяснялось выше, это волшебное слово не работает в mainspace (в статьях).
Возможность добавления магического слова INDEX в пользовательские пространства (Пользователь:, Обсуждение пользователя:) была ограничена фильтром редактирования для расширенного числа подтвержденных пользователей после обсуждения в сообществе. [11]
С 2007 года все ссылки на другие сайты из английской Википедии имеют установленный HTML-атрибут nofollow . [12] Это означает, что на страницах, индексируемых поисковыми системами, любые ссылки, найденные поисковой системой на этих страницах, не должны влиять на рейтинг цели ссылки в индексе поисковой системы.