Таксономия – это практика и наука категоризации или классификации .
Таксономия (или таксономическая классификация) — это схема классификации, особенно иерархическая классификация , в которой вещи организованы в группы или типы. Помимо прочего, таксономию можно использовать для организации и индексирования знаний (хранящихся в виде документов, статей, видео и т. д.), например, в форме библиотечной системы классификации или таксономии поисковых систем , чтобы пользователям было легче найти информацию, которую они ищут. Многие таксономии представляют собой иерархии (и, следовательно, имеют внутреннюю древовидную структуру ), но не все таксономии.
Первоначально таксономия относилась только к категоризации организмов или к определенной классификации организмов. В более широком и общем смысле это может относиться к категоризации вещей или понятий, а также к принципам, лежащим в основе такой категоризации. Таксономия организует таксономические единицы, известные как «таксоны» (единственное число «таксон»)».
Таксономия отличается от мерономии , которая занимается категоризацией частей целого.
Это слово было придумано в 1813 году швейцарским ботаником А. П. де Кандолем и состоит из греческого τάξις , таксис «порядок», и νόμος , номос «закон», соединенных французской формой -о- ; правильной формой будет таксономия , как она используется в греческом перезаимствовании ταξινομία . [1] [2]
Категории Википедии образуют таксономию, [3] которую можно извлечь автоматически. [4] По состоянию на 2009 год [update]было показано, что таксономия, созданная вручную, такая как таксономия вычислительных лексиконов, таких как WordNet , может использоваться для улучшения и реструктуризации таксономии категорий Википедии. [5]
В более широком смысле таксономия также применима к схемам отношений, отличным от иерархий «родитель-потомок», например к сетевым структурам . Таксономии могут затем включать одного ребенка с несколькими родителями, например, «Автомобиль» может отображаться с обоими родителями «Транспортное средство» и «Стальные механизмы»; однако для некоторых это просто означает, что «автомобиль» является частью нескольких различных таксономий. [6] Таксономия может также представлять собой просто организацию видов вещей в группы или алфавитный список; здесь, однако, более уместен термин словарь. В современном использовании в управлении знаниями таксономии считаются более узкими, чем онтологии , поскольку онтологии применяют большее разнообразие типов отношений. [7]
С математической точки зрения иерархическая таксономия представляет собой древовидную структуру классификаций для данного набора объектов. Ее также называют иерархией сдерживания . Наверху этой структуры находится единая классификация, корневой узел, который применяется ко всем объектам. Узлы ниже этого корня представляют собой более конкретные классификации, которые применяются к подмножествам общего набора классифицированных объектов. Ход рассуждения идет от общего к более частному.
Напротив, в контексте юридической терминологии используется открытая контекстуальная таксономия — таксономия, применимая только по отношению к конкретному контексту. В сценариях, взятых из юридической области, моделируется формальный учет открытой текстуры юридических терминов, что предполагает различные понятия «ядра» и «полутени» значений понятия. Ход рассуждений идет от частного к более общему. [8]
Антропологи заметили, что таксономии обычно встроены в местные культурные и социальные системы и выполняют различные социальные функции. Пожалуй, самым известным и влиятельным исследованием народной систематики является работа Эмиля Дюркгейма « Элементарные формы религиозной жизни» . Более позднюю трактовку народных таксономий (включая результаты нескольких десятилетий эмпирических исследований) и обсуждение их связи с научной таксономией можно найти в книге Скотта Атрана « Когнитивные основы естественной истории». Было обнаружено, что народная систематика организмов в значительной степени согласуется с научной классификацией, по крайней мере, для более крупных и очевидных видов, а это означает, что народная систематика не основана исключительно на утилитарных характеристиках. [9]
В семнадцатом веке немецкий математик и философ Готфрид Лейбниц , следуя работе майоркского философа тринадцатого века Рамона Луллия над его Ars Generalis ultima , системой процедурного генерирования концепций путем объединения фиксированного набора идей, стремился разработать алфавит человеческая мысль . Лейбниц задумал свою универсальную характеристику как «алгебру», способную выразить всю концептуальную мысль. Идея создания такого « универсального языка » часто рассматривалась в 17 веке, в частности, английским философом Джоном Уилкинсом в его работе «Эссе о реальном характере и философском языке» (1668), на основе которой была взята классификационная схема Роже . В конечном итоге возникает тезаурус .
Таксономия в биологии включает описание, идентификацию, номенклатуру и классификацию организмов. Использование таксономии включает:
Использование таксономии в бизнесе и экономике включает:
Вегас и др. [10] приводят убедительные аргументы в пользу расширения знаний в области разработки программного обеспечения посредством использования таксономии. Аналогичным образом, Оре и др. [11] предоставляют систематическую методологию подхода к построению таксономии в темах, связанных с разработкой программного обеспечения.
В исследованиях по тестированию программного обеспечения было предложено несколько таксономий для классификации методов, инструментов, концепций и артефактов. Ниже приведены некоторые примеры таксономий:
Энгстрем и др. [14] предлагают и оценивают использование таксономии для налаживания связей между исследователями и практиками, занимающимися тестированием программного обеспечения. Они также разработали веб-инструмент [15] для облегчения и поощрения использования таксономии. Инструмент и его исходный код доступны для публичного использования. [16]
Использование таксономии в образовании включает:
Использование таксономии в целях безопасности включает:
Ссылаясь на неадекватность существующей практики перечисления авторов статей в медицинских исследовательских журналах, Драммонд Ренни и соавторы обратились к статье 1997 года в JAMA , журнале Американской медицинской ассоциации для
радикальные концептуальные и систематические изменения, призванные отразить реалии множественного авторства и усилить подотчетность. Мы предлагаем отказаться от устаревшего понятия «автор» в пользу более полезного и реалистичного понятия «соавтор». [17] : 152
С 2012 года несколько крупных академических и научных издательств внедрили проект CRediT для разработки контролируемого словаря ролей участников. [18] Известная как CRediT (Таксономия ролей участников) , это пример плоской, неиерархической таксономии; однако он включает необязательную широкую классификацию степени вклада: ведущий , равный или поддерживающий . Эми Брэнд и соавторы резюмируют предполагаемый результат следующим образом:
Выявление конкретного вклада в опубликованные исследования приведет к соответствующему признанию, меньшему количеству споров между авторами и меньшему количеству препятствий для сотрудничества и обмена данными и кодом. [17] : 151
По состоянию на середину 2018 года эта таксономия, очевидно, ограничивает свою сферу применения результатами исследований , в частности журнальными статьями; однако он весьма необычно «надеется… поддержать идентификацию рецензентов». [18] (Таким образом, в нем еще не определены термины для таких ролей, как редактор или автор главы в сборнике результатов исследований.) Версия 1, созданная первой рабочей группой (северной) осенью 2014 г., определяет 14 конкретных ролей участников с использованием следующих определенных терминов:
Прием был неоднозначным: несколько крупных издателей и журналов планируют внедрить CRediT к концу 2018 года, хотя почти столько же не убеждены в необходимости или ценности его использования. Например,
Национальная академия наук создала веб-страницу TACS (Прозрачность вклада авторов в науку), на которой перечислены журналы, которые обязуются устанавливать стандарты авторства, определять обязанности соответствующих авторов, требовать идентификаторы ORCID и принимать таксономию CRediT. [19]
На той же веб-странице есть таблица со списком 21 журнала (или семейств журналов), из которых:
Таксономия представляет собой открытый стандарт, соответствующий принципам OpenStand [20] и публикуется под лицензией Creative Commons . [18]
Веб-сайты с хорошо продуманной таксономией или иерархией легко понятны пользователям благодаря возможности разработки мысленной модели структуры сайта. [21]
Рекомендации по написанию таксономии для Интернета включают:
Двумя преобладающими типами отношений в системах представления знаний являются предикация и универсально квантифицированный кондиционал . Отношения предикации выражают представление о том, что отдельная сущность является примером определенного типа (например, Джон — холостяк ), в то время как универсально квантифицированные кондиционалы выражают представление о том, что тип является подтипом другого типа (например, « Собака — это млекопитающее» , что означает то же самое, что « Все собаки — млекопитающие» ). [22]
Отношения «имеет» совершенно иные: у слона есть хобот; хобот - это часть, а не подвид слона. Изучением отношений части и целого называется мереология .
Таксономии часто представляются как is- иерархии , где каждый уровень более специфичен, чем уровень выше него (на математическом языке это «подмножество» уровня выше). Например, базовая биологическая таксономия будет включать такие понятия, как « млекопитающее» , которое является подмножеством животных , и «собаки и кошки» , которые являются подмножествами млекопитающих . Таксономия такого типа называется моделью есть, поскольку конкретные объекты рассматриваются как экземпляры концепции. Например, Фидо — это экземпляр концепта « собака» , а Пушистик — это кот . [23]
В лингвистике отношения есть-а называются гипонимией . Когда одно слово описывает категорию, а другое — некоторое подмножество этой категории, больший термин называется гиперонимом по отношению к меньшему, а меньший — «гипонимом» по отношению к большему. Такой гипоним, в свою очередь, может иметь дополнительные подкатегории, для которых он является гиперонимом. В простом примере из биологии собака является гипернимом по отношению к своей подкатегории колли , которая, в свою очередь, является гипернимом по отношению к Фидо , который является одним из ее гипонимов. Однако обычно гипероним используется для обозначения подкатегорий, а не отдельных лиц.
Исследователи сообщили, что большие группы населения постоянно разрабатывают очень похожие системы категорий. Это может иметь отношение к лексическим аспектам крупных коммуникационных сетей и культур, таким как фольксономия и язык или человеческое общение, а также к смыслообразованию в целом. [24] [25]