Пересечение категорий — это возможность находить все статьи, которые принадлежат более чем одной категории. Это требует изменения программного обеспечения MediaWiki, а также существенного изменения политик, связанных с тем, как заполняются категории. Есть надежда, что эти изменения решат некоторые давние проблемы категоризации и положат конец некоторым распространенным конфликтам между редакторами Википедии. Пересечение категорий также предлагает возможность добавления нескольких новых функций, которые принесут пользу пользователям, добавив ценные инструменты для исследования и индексирования, а также упростив управление системой категорий.
Многие существующие категории логически являются пересечением атрибутов, для которых существуют "первичные" категории, например, Категория:Американские актеры логически является пересечением Категории:Актёры и Категории:Американские люди . Хотя эти "первичные" категории сегодня обычно подразделяются на подкатегории, если бы они были напрямую (полностью) заполнены, "перекрестные категории" могли бы быть сгенерированы автоматически. Категории в немецкой Википедии уже организованы в полностью заполненные первичные категории.
Это предложение пытается представить изменения, необходимые для того, чтобы пересечение категорий стало реальностью. Оно призвано дополнить текущую систему категоризации, а не заменить ее.
Когда категории были первоначально добавлены в Википедию в 2004 году, не было механизма ограничения результатов поиска для больших категорий. Очень большие категории вызывали проблемы с производительностью, и было внесено изменение в программное обеспечение, чтобы ограничить результаты поиска 200 записями за раз. Если записей больше 200, пользователи должны перемещаться по нескольким страницам, чтобы увидеть все записи. Этот механизм постраничной навигации становится непрактичным с большими категориями, так как требуется слишком много времени, чтобы увидеть записи в конце алфавита. Соображения производительности больших категорий и постраничной навигации ускорили политику сокращения численности больших категорий до более мелких подкатегорий.
В середине 2005 года был создан шаблон таблицы содержания категории {{ CategoryTOC }}. С таблицей содержания стало возможным перемещаться по очень большим категориям несколькими щелчками. Благодаря сочетанию изменения производительности и CategoryTOC больше нет причин, по которым категории должны быть маленькими.
Многокатегорийные таксономии были частью схемы категоризации с самого начала. Можно взять категорию и подкатегоризовать ее многими различными способами. Использование этих категорий «подмножеств» затрудняет поиск всех членов категории «более высокого уровня»; либо статьи должны быть добавлены как в категории «подмножества», так и в категории «более высокого уровня», либо члены «подкатегорий» (и, рекурсивно, их подкатегории) должны быть перечислены. Точное определение обстоятельств, при которых статьи должны быть добавлены как в категории «более низкого уровня», так и в категории «более высокого уровня», и даже то, является ли это когда-либо уместным, остается источником продолжающихся дискуссий среди редакторов (см., например, Wikipedia:Categorization/Categories and subcategories и Wikipedia talk:Categorization/Archive 7 ).
Эта история привела к появлению нескольких пересекающихся взглядов на цель категорий Википедии и к созданию нескольких различных видов категорий:
Пересечение категорий было желанной функцией в течение довольно долгого времени. Просматривая архивы рассылки wikitech-l, кто-то даже написал код, реализующий версию пересечения категорий. Этот комментарий указывает на его ограничение: "Я не вижу, как это может быть более чем минимально полезным, если только оно также не ищет все подкатегории на бесконечной глубине (с рекурсивными проверками?!)".
Можно использовать параметр поиска incategory: для поиска пересечений категорий; однако эта возможность не ищет внутри подкатегорий. Чтобы найти пересечение категорий, введите incategory:"CategoryName"
в поле поиска для каждой интересующей категории. Например, incategory:"German films" incategory:"1998 films" вернет статьи, которые являются общими для обеих категорий – немецкие фильмы, выпущенные в 1998 году. Аналогичные результаты можно также найти с помощью службы запросов Wikidata .
Для наилучшего пересечения категорий многие категории должны быть полностью заполнены. Категории должны быть заполнены ВСЕМИ статьями, которые соответствуют определению категории, или не иметь НИ ОДНОЙ статьи, поскольку они могут быть найдены в подкатегориях. Если категория полностью заполнена, она будет называться « Основной ». Основные категории должны соответствовать тематическим статьям. Это означает, что для категории есть или может быть одноименная статья. Примером этого является Film director .
Общее правило будет следующим: если категория может быть полностью и целиком выражена как пересечение других категорий, она не является первичной категорией и должна быть определена только как это пересечение. Например, Категория: Американские режиссеры может быть определена как пересечение Категории: Кинорежиссеры и Категории: Американцы , которые, в свою очередь, будут полностью заполненными первичными категориями. Категория: Американские режиссеры не будет существовать как «обычная» категория и никогда не будет отображаться как категория в какой-либо статье. Статьи в обеих категориях будут отображаться при выборе просмотра их пересечения. Если есть статьи, которые относятся к теме пересечения, но по какой-то причине не находятся в одной или нескольких пересекающихся категориях, они могут отображаться как обычные вики-ссылки в разделе «См. также» в текстовом описании категории пересечения. Например, может быть комментарий для просмотра статьи под названием Американские режиссеры в пересечении, соответствующем Категории: Американские режиссеры .
Все существующие категории, которые являются пересечениями, будут депопулированы, а их члены перемещены в более крупные первичные категории. Некоторые первичные категории будут довольно большими (например, Category:American people ). Поскольку они полностью заполнены, каждая первичная категория будет полным индексом всех статей в Википедии, которые относятся к теме.
Это предложение изменит список категорий, которые появляются в статьях. Будут отображаться только основные (полностью заполненные) категории. Например, статья Лоуренса Фишберна в настоящее время содержит следующие категории:
Согласно этому предложению, оно будет содержать:
Есть несколько вещей, которые следует отметить по этому поводу. Определение некоторых из этих категорий может быть запутанным. Категории «Люди из» в настоящее время определяются как люди, которые имеют заметную связь с местом, но могут не быть гражданами более крупной страны. Это означает, что как меньшие, так и большие подразделения являются основными категориями. Для облегчения категорий пересечения, вероятно, было бы полезно полностью заполнить все географические подразделения от уровня национальности и ниже. Аналогично, невозможно определить киноактеров как пересечение «фильма» (или кинолюдей) и «актеров», потому что (например) человек может быть известным театральным актером, который позже стал кинорежиссером. Статьи могут принадлежать к этим двум категориям, НО НЕ принадлежать к категории «пересечение», что означает, что «киноактеры» не являются кандидатом на категорию пересечения. По этой причине может быть решено сделать «актера» и все категории «актеров по среде» основными категориями.
Будет новое пространство имен для создания пересечений категорий. Страницы в этом пространстве имен, возможно, называемые "Index" или "Intersection", будут выглядеть очень похоже на список статей категории. В этом предложении используются оба имени, но при реализации этого предложения можно выбрать любое другое имя. Страницы пересечений можно создавать на лету, просто вводя имя пересечения, которое вы ищете. Например, вы можете перейти на страницу Intersection:Actor::American people::People of African descent . Аналогично, это будет разметка для создания ссылки на страницу пересечения. (Примечание: точная разметка и URL могут отличаться от этих.) Таким образом, вы можете добавить ссылку на страницу пересечения, добавив:
на страницу. Как и любая другая ссылка, эти ссылки могут быть "перенаправлены", так что текст, отображаемый пользователю, не обязательно должен быть "сырой" ссылкой. Ссылка будет отображаться как "синяя" ссылка (страница существует) не на основе того, есть ли существующая страница в пространстве имен пересечения, а на основе того, существуют ли все пересекаемые категории в пространстве имен категорий. Это означает, что любое пересечение существующих категорий будет казаться существующим, независимо от того, "создал" ли пользователь ранее страницу пересечения или нет.
Страницы пересечения будут выглядеть более или менее как страницы категорий. Будет отображаться заголовок страницы, за которым, возможно, последует вручную сгенерированный контент (добавленный нажатием кнопки «изменить»), затем первые 200 автоматически сгенерированных ссылок на подкатегории и статьи, которые являются членами всех пересекающихся категорий (почти как обычный список категорий), за которыми, возможно, последует механизм расширения или дальнейшего ограничения пересечения.
В заголовке страницы будут перечислены пересекающиеся категории в порядке, указанном в URL-адресе, используемом для доступа к странице. Поскольку категория A, пересекающаяся с категорией B, совпадает с категорией B, пересекающейся с категорией A, страницы пересечения имеют ряд встроенных синонимов. Подробнее об этом позже.
Пользователи смогут создавать пересечения категорий несколькими способами:
Четвертый (и пятый) вариант будет новой и мощной функцией. Используя ту же статью Лоуренса Фишберна в качестве примера, вместо существующего списка категорий категории могут отображаться следующим образом:
Такое расположение очень похоже на то, как работают теги на Flickr.com, Delicious.com и Movie keywords Analyzer IMDb. Существующий список категорий будет иметь флажок, добавленный рядом с каждой категорией. Любой пользователь сможет просмотреть результат пересечения категорий, отметив флажки рядом с категориями, а затем нажав на ссылку, чтобы просмотреть набор пересечений. В этом случае три отмеченных флажка приведут к списку пересечений, который функционально очень похож на текущую Category:African-American actors , но динамически генерируется на основе пересечения выбранных категорий, а не заполняется вручную. Многие существующие категории могут быть заменены пересечениями, и с этой системой возможно любое пересечение, включая те, которые ранее были не одобрены и/или удалены через WP:CFD .
Это добавляет небольшое количество "загромождения" категорий, но добавляет возможность создания пересечения любых двух или более категорий. Может быть несколько больше "основных" категорий, чем сейчас, но в целом в конечном итоге может быть меньше категорий, перечисленных в статье. ВСЕ категории, появляющиеся в нижней части статьи, будут полностью заполненными основными категориями и поэтому будут полезны в качестве компонентов пересечений. Вы сможете увидеть пересечения, даже если никто явно не создал для нее страницу пересечения, например, что теперь должно быть Категория: Афроамериканские киноактеры из Огасты, Джорджия, которые выиграли премию "Тони". Это создает эффект наличия десятков категорий без загромождения статей.
Поиск в пространстве имен Intersection будет осуществляться путем сортировки пересекающихся категорий в алфавитном порядке перед выполнением запроса к базе данных для поиска существующего пересечения. Таким образом, любая перестановка порядка категорий в URL или ссылке будет соответствовать соответствующей странице пересечения.
Существует несколько вариантов этого предложения. Аспекты, которые различаются, касаются:
Для каждого варианта предусмотрены макеты и подстраница с более подробной информацией.
Эта опция тесно связывает пересечения с категориями. Категории, которые можно определить как пересечения, будут депопулированы, но все равно останутся в структуре категорий. Вместо добавления статей в категорию страница пересечения будет связана со страницей категории путем присвоения ей имени категории. После присвоения имени страница пересечения будет привязана к связанной категории и автоматически включена в нее. Текущая структура категоризации не будет затронута этой опцией. Все существующие в настоящее время категории останутся, некоторые из них будут «обычными» категориями, а некоторые будут переопределены как категории «пересечения».
Основные характеристики этого варианта:
Макеты:
Этот параметр смоделирован по образцу индекса, который можно найти в книге. В этом параметре пространство пересечения использует имя «Индекс», а его страницы содержат индексы статей, а также ссылки на другие страницы индекса. Как и в параметре выше, страницам «индекса» можно давать имена. В отличие от параметра выше, страницы «индекса» не связаны с категориями и не включены в них. Категории, которые можно определить как пересечения, будут удалены после переклассификации статей в соответствующие первичные категории. Удаленные категории заменяются индексами, которые можно категоризовать или вручную связать со страницами категорий. Страницы «индекса» имеют наборы ссылок на другие индексы, которые автоматически генерируются с использованием подкатегорий пересекаемых категорий. Это позволяет пользователям легко переходить от одного индекса к другим связанным индексам. Страницы в пространстве имен индекса можно редактировать (так же, как можно редактировать категории), что позволяет пользователям аннотировать страницу индекса описательным текстом, добавлять страницы индекса в категории и добавлять ссылки на другие связанные индексы.
Основные характеристики этого варианта:
Макеты:
В этом варианте пространство имен «пересечение» будет полностью отделено от пространства имен «категория». Категории, которые можно было бы определить как пересечения, будут удалены после перераспределения статей по соответствующим основным категориям. Каждая страница в пространстве имен пересечения будет включать автоматически сгенерированную таблицу выбора пересечений , что позволит пользователям легко переходить от одного пересечения к другим связанным пересечениям. Страницы в пространстве имен пересечения можно будет редактировать (так же, как можно редактировать категории), что позволит пользователям аннотировать страницу пересечения описательным текстом и добавлять страницы пересечений в категории.
Основные характеристики этого варианта:
Макеты:
Возможны и другие варианты. Можно комбинировать, менять и удалять функции из трех вариантов выше, чтобы создавать другие варианты. Мы приглашаем участников этого обсуждения добавлять любые идеи, которые у них могут быть.
Это предложение, если какой-либо из вариантов будет реализован, окажет большое влияние на политику категоризации . Некоторые из этих изменений можно предвидеть, а некоторые будут развиваться по мере того, как все будут привыкать к новой системе. Также необходимо провести значительное размышление и планирование перед внедрением изменения.
После внедрения новой системы необходимо будет пересмотреть политику категоризации. Многие аспекты новой системы, скорее всего, будут спорными, и, скорее всего, будут оживленные обсуждения. Также возможно, что споров будет меньше, чем в случае с текущей системой.
Основным изменением политики станет концепция основной категории , как описано выше. Основные категории должны быть помечены как таковые, чтобы редакторы знали, что их нужно полностью заполнить. Некоторые категории, возможно, придется разделить, поскольку они являются как основными категориями, так и навигационными категориями. Навигационная категория — это категория, которая содержит подкаталоги. Примером этого является Category:American people by profession . Навигационные категории не должны содержать никаких статей. В настоящее время Category:American people функционирует как основная категория и навигационная категория. Вероятно, ее следует разделить на Category:American people (которая будет полностью заполнена статьями об американцах) и Category:American people by type или что-то подобное (которая будет содержать все или большинство подкатегорий. Category:American people by type тогда будет подкатегорией Category:American people . Это упростит навигацию по подкатегориям, особенно когда основные категории очень большие и имеют много подкатегорий.
Текущие руководящие принципы говорят, что категории в первую очередь предназначены для просмотра статей по теме. Это руководство не нуждается в изменении.
Поскольку основные категории будут полностью заполнены, они также будут функционировать как полный индекс своей темы. Эта функция больше не будет противоречить другим функциям категорий. Страницы пересечения добавят дополнительные возможности индексации.
Вместо классификации статей путем поиска наиболее специфической подкатегории для статьи, они будут классифицированы путем поиска всех основных категорий, к которым они принадлежат. Их классификация по сути является набором пересечений, выбирающим все их категории. В большинстве случаев не будет никаких других статей с тем же набором основных категорий.
Многие подкатегории были исключены или удалены, поскольку они не считались важными подклассификациями существующих категорий. Это больше не будет проблемой с новой системой. Добавление атрибутов к людям, таким как пол ( Категория:Мужчины или Категория:Женщины ) или религия ( Категория:Методисты ) больше не должно вызывать споров, поскольку подкатегории, использующие эти атрибуты, будут видны только в том случае, если люди будут их искать. Это позволит нескольким таксономиям сосуществовать.
В настоящее время предпочтительными являются определенные таксономии, такие как подкатегории по национальности и роду занятий. Этого больше не будет. Ни одна таксономия не будет казаться лучшей, чем любая другая. Конечно, таксономии все еще могут быть удалены, если они покажутся неэнциклопедическими. Удаление этих таксономий потребует удаления только одной основной категории. После удаления страницы пересечения больше не будут показывать никаких статей. Любые ссылки на пересечение, использующие удаленную основную категорию, будут красными. В первом варианте любая категория с пересечением, имеющая красную ссылку, должна быть кандидатом на быстрое удаление. Во всех вариантах любая страница пересечения, имеющая красную ссылку на основную категорию, также должна быть быстро удалена. Этот процесс, вероятно, можно автоматизировать с помощью бота.
Эта система, как и система на flickr.com, позволяет легко находить статьи, которые похожи желаемым образом. По одному актеру из Огайо пользователь сможет найти всех актеров из Огайо. По одному английскому поэту, родившемуся в 1883 году, вы сможете найти всех английских поэтов, родившихся в 1883 году. По одному подвесному мосту в Нью-Йорке вы сможете найти все подвесные мосты в Нью-Йорке. В настоящее время это невозможно для большинства поисков.
В настоящее время существует четкий консенсус не помещать людей в Category:Entertainers , а вместо этого помещать их в подкатегории Entertainments. Иногда может быть полезно увидеть полный индекс того, что находится в Category:Entertainers , включая все содержимое подкатегорий. Будущее обновление может добавить возможность просматривать любую категорию в виде структуры. Возможно, в верхней части каждой категории будет ссылка «Просмотреть как структуру». При нажатии на ссылку вид категории переключится на вид структуры. Все подкатегории и статьи будут отображаться как единый алфавитный список. Подкатегории будут отформатированы иначе, чем статьи (возможно, жирным шрифтом или более крупным). Также будет еще одна опция «Показать содержимое всех подкатегорий». Нажатие на нее добавит содержимое подкатегорий в категорию или список. Если выбраны оба варианта, содержимое подкатегории будет иметь отступ и будет указано непосредственно под заголовком подкатегории. Индексное представление будет охватывать только определенное количество уровней и не будет отображать содержимое категорий, определенных как пересечения. Возможно, глубина индекса может быть пользовательским предпочтением. Также может быть способ «выровнять» схему, чтобы содержимое всех подкатегорий было объединено в один алфавитный список.
Интерфейс поиска можно расширить, включив в него возможность поиска статей в определенных категориях.
В Semantic MediaWiki есть функция под названием «Концепции», которая решает проблемы, которые пытается решить пересечение категорий , одновременно расширяя концепцию.
Расширение "Multi-Category Search" представляет новую специальную страницу, которая позволяет пользователям находить страницы, которые включены в несколько указанных категорий одновременно. Также доступно включение результатов поиска.
Магнус Манске написал инструмент для пересечения категорий:
Поиск Википедии, основанный на Elasticsearch, страницы принимают параметры "incategory", которые позволяют сузить поиск по категории. Объединяя несколько параметров incategory, можно пересекать категории.
Например:
Для поиска Mediawiki vanilla, через https://webapps.stackexchange.com/questions/28412/search-within-a-category-on-a-mediawiki-site, работает
"[[Категория:Спортсмены (легкая атлетика) на летних Олимпийских играх 1984 года]]" "[[Категория:Французские бегуньи-спринтеры]]"
Пожалуйста, ответьте на странице обсуждения .