Таксономия — это практика и наука, связанные с классификацией или категоризацией. Обычно она состоит из двух частей: разработка базовой схемы классов (таксономии) и распределение вещей по классам ( классификация ).
Первоначально таксономия относилась только к классификации организмов на основе общих характеристик. Сегодня она также имеет более общий смысл. Она может относиться к классификации вещей или концепций, а также к принципам, лежащим в основе такой работы. Таким образом, таксономия может использоваться для организации видов, документов, видео или чего-либо еще.
Таксономия организует таксономические единицы, известные как «таксоны» (единственное число «таксон»). Многие из них представляют собой иерархии .
Одна из функций таксономии — помочь пользователям легче находить то, что они ищут. Это может быть достигнуто способами, включающими библиотечную классификационную систему и таксономию поисковой системы .
Слово было придумано в 1813 году швейцарским ботаником А. П. Декандолем и представляет собой нерегулярное соединение греческих слов τάξις , taxis «порядок» и νόμος , nomos «закон», соединенных французской формой -o- ; правильной формой было бы taxinomy , как это используется в греческом заимствовании ταξινομία . [1] [2]
Категории Википедии формируют таксономию, [3] которая может быть извлечена автоматическими средствами. [4] По состоянию на 2009 год [обновлять]было показано, что вручную созданная таксономия, например, вычислительные лексиконы, такие как WordNet , может быть использована для улучшения и реструктуризации таксономии категорий Википедии. [5]
В более широком смысле таксономия также применяется к схемам отношений, отличным от иерархий родитель-потомок, таким как сетевые структуры . Тогда таксономии могут включать одного потомка с несколькими родителями, например, «Автомобиль» может появляться с обоими родителями «Транспортное средство» и «Стальные механизмы»; для некоторых, однако, это просто означает, что «автомобиль» является частью нескольких различных таксономий. [6] Таксономия также может быть просто организацией видов вещей в группы или алфавитным списком; здесь, однако, более уместен термин «словарь». В текущем использовании в управлении знаниями таксономии считаются более узкими, чем онтологии , поскольку онтологии применяют большее разнообразие типов отношений. [7]
Математически иерархическая таксономия представляет собой древовидную структуру классификаций для заданного набора объектов. Она также называется иерархией включения . На вершине этой структуры находится единственная классификация, корневой узел, который применяется ко всем объектам. Узлы ниже этого корня представляют собой более конкретные классификации, которые применяются к подмножествам общего набора классифицированных объектов. Ход рассуждений идет от общего к более частному.
Напротив, в контексте юридической терминологии используется открытая контекстуальная таксономия — таксономия, имеющая место только в отношении определенного контекста. В сценариях, взятых из юридической области, моделируется формальный отчет об открытой текстуре юридических терминов, что предполагает различные понятия «ядра» и «полутени» значений концепции. Ход рассуждения идет от частного к более общему. [8]
Антропологи заметили, что таксономии, как правило, встроены в местные культурные и социальные системы и выполняют различные социальные функции. Возможно, наиболее известным и влиятельным исследованием народных таксономий является работа Эмиля Дюркгейма «Элементарные формы религиозной жизни» . Более позднюю трактовку народных таксономий (включая результаты нескольких десятилетий эмпирических исследований) и обсуждение их связи с научной таксономией можно найти в работе Скотта Атрана « Когнитивные основы естественной истории». Было обнаружено, что народные таксономии организмов в значительной степени согласуются с научной классификацией, по крайней мере, для более крупных и очевидных видов, что означает, что народные таксономии не основаны исключительно на утилитарных характеристиках. [9]
В семнадцатом веке немецкий математик и философ Готфрид Лейбниц , следуя работе майоркского философа тринадцатого века Рамона Луллия над его Ars generalis ultima , системой для процедурного генерирования концепций путем объединения фиксированного набора идей, стремился разработать алфавит человеческой мысли . Лейбниц намеревался, чтобы его characteristics universalis была «алгеброй», способной выразить всю концептуальную мысль. Концепция создания такого « универсального языка » часто рассматривалась в XVII веке, в частности, английским философом Джоном Уилкинсом в его работе An Essay towards a Real Character and a Philosophical Language (1668), из которой в конечном итоге вытекает схема классификации в Thesaurus Роже .
Таксономия в биологии охватывает описание, идентификацию, номенклатуру и классификацию организмов. Использование таксономии включает:
Применение таксономии в бизнесе и экономике включает:
Вегас и др. [10] приводят убедительные доводы в пользу продвижения знаний в области программной инженерии посредством использования таксономий. Аналогичным образом, Оре и др. [11] предлагают систематическую методологию подхода к построению таксономии в темах, связанных с программной инженерией.
В исследовании тестирования программного обеспечения было предложено несколько таксономий для классификации методов, инструментов, концепций и артефактов. Ниже приведены некоторые примеры таксономий:
Энгстрём и др. [14] предлагают и оценивают использование таксономии для моста между исследователями и практиками, занятыми в области тестирования программного обеспечения. Они также разработали веб-инструмент [15] для облегчения и поощрения использования таксономии. Инструмент и его исходный код доступны для публичного использования. [16]
Использование таксономии в образовании включает:
Использование таксономии в области безопасности включает:
Ссылаясь на несоответствия в текущей практике перечисления авторов статей в медицинских исследовательских журналах, Драммонд Ренни и соавторы в статье 1997 года в JAMA , журнале Американской медицинской ассоциации, призвали
радикальное концептуальное и систематическое изменение, чтобы отразить реалии множественного авторства и укрепить подотчетность. Мы предлагаем отказаться от устаревшего понятия автора в пользу более полезного и реалистичного понятия соавтора. [17] : 152
В 2012 году несколько крупных академических и научных издательских организаций запустили проект CRediT для разработки контролируемого словаря ролей участников. [18] Известный как CRediT ( таксономия ролей участников ) , это пример плоской, неиерархической таксономии; однако он включает необязательную, широкую классификацию степени вклада: ведущий , равный или поддерживающий . Эми Брэнд и соавторы резюмируют свой предполагаемый результат следующим образом:
Выявление конкретных вкладов в опубликованные исследования приведет к надлежащему признанию, уменьшению количества споров между авторами и уменьшению препятствий для сотрудничества и обмена данными и кодом. [17] : 151
CRediT включает в себя 14 конкретных ролей участников, использующих следующие определенные термины:
Таксономия является открытым стандартом, соответствующим принципам OpenStand, [19] и публикуется по лицензии Creative Commons . [18]
Веб-сайты с хорошо продуманной таксономией или иерархией легко понятны пользователям, поскольку у них есть возможность разработать ментальную модель структуры сайта. [20]
Рекомендации по написанию таксономии для Интернета включают в себя:
Фредерик Зуппе [21] различал два смысла классификации: широкий смысл, который он называл «концептуальной классификацией», и узкий смысл, который он называл «систематической классификацией».
О концептуальной классификации Зуппе писал: [21] : 292 «Классификация присуща использованию языка, а значит, и большинству, если не всем коммуникациям. Всякий раз, когда мы используем номинативные фразы, мы классифицируем обозначенный субъект как существенно схожий с другими сущностями, имеющими то же обозначение; то есть мы классифицируем их вместе. Аналогично использование предикативных фраз классифицирует действия или свойства как относящиеся к определенному виду. Мы называем это концептуальной классификацией, поскольку она относится к классификации, связанной с концептуализацией нашего опыта и окружения».
О систематической классификации Зуппе писал: [21] : 292 «Второе, более узкое значение классификации — это систематическая классификация, связанная с разработкой и использованием таксономических схем, таких как биологическая классификация животных и растений по родам и видам.
Два из преобладающих типов отношений в системах представления знаний — это предикация и универсально квантифицированные условные отношения . Предикативные отношения выражают представление о том, что отдельная сущность является примером определенного типа (например, Джон — холостяк ), в то время как универсально квантифицированные условные отношения выражают представление о том, что тип является подтипом другого типа (например, « Собака — млекопитающее» , что означает то же самое, что и « Все собаки — млекопитающие» ). [22]
Отношение «имеет-а» совершенно иное: у слона есть хобот; хобот — это часть, а не подтип слона. Изучением отношений часть-целое занимается мереология .
Таксономии часто представляются как иерархии is-a , где каждый уровень более конкретен, чем уровень выше (на математическом языке это «подмножество» уровня выше). Например, базовая биологическая таксономия будет иметь такие понятия, как млекопитающее , которое является подмножеством животного , и собаки и кошки , которые являются подмножествами млекопитающего . Этот вид таксономии называется моделью is-a, потому что конкретные объекты рассматриваются как экземпляры концепции. Например, Fido is-an instance of the concept dog , а Fluffy is-a cat . [23]
В лингвистике отношения is-a называются гипонимией . Когда одно слово описывает категорию, а другое описывает некоторое подмножество этой категории, больший термин называется гипернимом по отношению к меньшему, а меньший называется «гипонимом» по отношению к большему. Такой гипоним, в свою очередь, может иметь дополнительные подкатегории, для которых он является гипернимом. В простом примере из биологии собака является гипернимом по отношению к своей подкатегории колли , которая, в свою очередь, является гипернимом по отношению к Фидо , который является одним из ее гипонимов. Однако обычно гиперним используется для обозначения подкатегорий, а не отдельных особей.
Исследователи сообщили, что большие популяции последовательно развивают очень похожие системы категорий. Это может быть релевантно лексическим аспектам больших коммуникационных сетей и культур, таких как фолксономии и язык или человеческое общение, а также осмысление в целом. [24] [25]
Халл (1998) предположил: «Основными элементами любой классификации являются ее теоретические обязательства, основные единицы и критерии упорядочивания этих основных единиц в классификацию» [26] .
В организации знаний и смежных областях широко распространено мнение, что такие классы соответствуют концепциям. Например, мы можем классифицировать «водоплавающих птиц» в классы «утки», «гуси» и «лебеди»; однако мы также можем сказать, что концепция «водоплавающая птица» является более широким общим термином по отношению к концепциям «утки», «гуси» и «лебеди». Этот пример демонстрирует тесную связь между теорией классификации и теорией концепций. Главным противником концепций как единиц является Барри Смит. [27] Арп, Смит и Спир (2015) обсуждают онтологии и критикуют концептуалистское понимание. [28] : 5ff В книге говорится (7): «Код, назначенный Франции, например, ISO 3166 – 2:FR, и код назначен самой Франции — стране, которая иначе называется Frankreich или Ranska. Он не назначен концепции Франции (какой бы она ни была)». Альтернатива Смита концепциям как единицам основана на реалистической ориентации: когда ученые делают успешные заявления о типах сущностей, которые существуют в реальности, они ссылаются на объективно существующие сущности, которые реалистические философы называют универсалиями или естественными видами. Главный аргумент Смита, с которым согласны многие последователи теории концепций, по-видимому, заключается в том, что классы не могут быть определены интроспективными методами, но должны основываться на научных и академических исследованиях. Независимо от того, называются ли единицы концепциями или универсалиями, проблема заключается в том, чтобы решить, когда вещь (например, «черный дрозд») следует считать естественным классом. Например, в случае черных дроздов недавний анализ ДНК пересмотрел концепцию (или универсалию) «черный дрозд» и обнаружил, что то, что раньше считалось одним видом (с подвидами), на самом деле является многими разными видами, которые просто выбрали схожие характеристики для принятия в своих экологических нишах. [29] : 141
Важным аргументом в пользу рассмотрения концепций как основы классификации является то, что концепции подвержены изменениям и что они меняются, когда происходят научные революции. Наши концепции многих птиц, например, изменились с недавним развитием анализа ДНК и влиянием кладистической парадигмы - и потребовали новых классификаций. Пример Смита с Францией требует объяснения. Во-первых, Франция - это не общая концепция, а индивидуальная концепция. Далее, юридическое определение Франции определяется соглашениями, которые Франция заключила с другими странами. Однако это все еще концепция, как показывает Леклерк (1978) с соответствующей концепцией Европа . [30]
Халл (1998) продолжил: [26] «Два принципиально различных вида классификации — это те, которые отражают структурную организацию, и те, которые систематически связаны с историческим развитием». Речь идет о том, что в биологической классификации анатомические черты организмов — это один вид классификации, классификация по отношению к эволюции видов — это другой (в разделе ниже мы расширяем эти два фундаментальных вида классификации до четырех). Халл добавляет, что в биологической классификации эволюция обеспечивает теоретическую ориентацию. [26]
Эрешефски (2000) представил и обсудил три общие философские школы классификации: «эссенциализм, кластерный анализ и историческая классификация. Эссенциализм сортирует сущности в соответствии с причинно-следственными связями, а не с их внутренними качественными характеристиками». [31]
Однако эти три категории можно считать частями более широких философий. Можно выделить четыре основных подхода к классификации: (1) логические и рационалистические подходы, включая «эссенциализм»; (2) эмпиристские подходы, включая кластерный анализ (важно отметить, что эмпиризм — это не то же самое, что эмпирическое исследование, а некий идеал проведения эмпирических исследований. За исключением логических подходов, все они основаны на эмпирических исследованиях, но основывают свои исследования на разных философских принципах). (3) исторические и герменевтические подходы, включая «историческую классификацию» Эрешефского и (4) прагматический, функционалистский и телеологический подходы (не охваченные Эрешефским). Кроме того, существуют комбинированные подходы (например, так называемая эволюционная таксономия », которая смешивает исторические и эмпирические принципы).
Логическое деление [32] (классификация сверху вниз или нисходящая классификация) — это подход, который делит класс на подклассы, а затем делит подклассы на их подклассы и т. д., что в конечном итоге формирует дерево классов. Корень дерева — это исходный класс, а листья дерева — это конечные классы. Платон отстаивал метод, основанный на дихотомии, который был отвергнут Аристотелем и заменен методом определений, основанных на роде, виде и видовом различии. [33] Метод анализа граней (ср., фасетная классификация ) в первую очередь основан на логическом делении. [34] Этот подход имеет тенденцию классифицировать в соответствии с «существенными» характеристиками, широко обсуждаемая и критикуемая концепция (ср., эссенциализм ). Эти методы могут в целом быть связаны с рационалистической теорией познания.
«Одного эмпиризма недостаточно: здоровый прогресс в таксономии зависит от прочной теоретической основы» [35] : 548
Фенетика или числовая таксономия [36] — это, напротив, классификация снизу вверх, где отправной точкой является набор элементов или индивидов, которые классифицируются путем помещения тех, у кого общие характеристики, в качестве членов узкого класса и продвижения вверх. Числовая таксономия — это подход, основанный исключительно на наблюдаемых, измеримых сходствах и различиях вещей, которые должны быть классифицированы. Классификация основана на общем сходстве: элементы, которые наиболее похожи по большинству атрибутов, классифицируются вместе. Но она основана на статистике и, следовательно, не соответствует критериям логического разделения (например, для создания классов, которые являются взаимоисключающими и совместно совпадающими с классом, который они разделяют). Некоторые люди будут утверждать, что это вообще не классификация/таксономия, но такой аргумент должен учитывать определения классификации (см. выше). Эти методы могут в целом быть связаны с эмпирической теорией познания.
Генеалогическая классификация — это классификация элементов в соответствии с их общим наследием. Это также должно быть сделано на основе некоторых эмпирических характеристик, но эти характеристики разрабатываются теорией эволюции. Главный вклад Чарльза Дарвина [37] в теорию классификации заключается не только в его утверждении «... всякая истинная классификация является генеалогической ...», но и в том, что он предоставил операциональное руководство для классификации. [38] : 90–92 Генеалогическая классификация не ограничивается биологией, но также широко используется, например, в классификации языков и может считаться общим подходом к классификации». Эти методы в целом могут быть связаны с исторической теорией познания. Одной из основных школ исторической классификации является кладистика , которая сегодня доминирует в биологической таксономии, но также применяется и в других областях.
Исторический и герменевтический подходы не ограничиваются развитием объекта классификации (например, видов животных), но также касаются субъекта классификации (классификаторов) и их укорененности в научных традициях и других человеческих культурах.
Прагматическая классификация (а также функциональная [39] и телеологическая классификация) — это классификация предметов, которая подчеркивает цели, задачи, последствия, [40] интересы, ценности и политику классификации. Например, это классификация животных на диких животных, вредителей, одомашненных животных и домашних животных. Также кухонная утварь (инструменты, утварь, приборы, посуда и кухонная утварь, используемые при приготовлении пищи или подаче пищи) является примером классификации, которая не основана ни на одном из трех вышеупомянутых методов, но явно на прагматических или функциональных критериях. Bonaccorsi, et al. (2019) посвящена общей теории функциональной классификации и применению этого подхода для патентной классификации. [39] Хотя примеры могут предполагать, что прагматические классификации примитивны по сравнению с устоявшимися научными классификациями, их следует рассматривать в связи с прагматической и критической теорией познания, которая рассматривает все знания как влияние интересов. [41] Ридли (1986) писал: [42] : 191 «телеологическая классификация. Классификация групп по их общим целям или функциям в жизни — где цель может быть отождествлена с адаптацией. Несовершенно разработанный, изредка предлагаемый, теоретически возможный принцип классификации, который отличается от двух основных таких принципов — фенетической и филогенетической классификации ».
Естественная классификация — это концепция, тесно связанная с концепцией естественного рода . Карла Линнея часто признают первым ученым, который четко разграничил «искусственные» и «естественные» классификации [43] [44] Естественная классификация — это, используя метафору Платона, «разрезание природы на ее сочленениях» [45] Хотя Линней считал естественную классификацию идеалом, он признавал, что его собственная система (по крайней мере частично) представляет собой искусственную классификацию.
Джон Стюарт Милль объяснил искусственную природу классификации Линнея и предложил следующее определение естественной классификации:
«Расположение Линнея отвечает цели заставить нас думать вместе обо всех тех видах растений, которые обладают одинаковым числом тычинок и пестиков; но думать о них таким образом бесполезно, поскольку мы редко можем утверждать что-либо общее о растениях, которые имеют данное число тычинок и пестиков». [46] : 498 «Цели научной классификации достигаются наилучшим образом, когда объекты объединены в группы, относительно которых может быть сделано большее число общих положений, и эти положения более важны, чем могли бы быть сделаны относительно любых других групп, в которые могут быть распределены те же самые вещи». [46] : 499 «Классификация, сформированная таким образом, является собственно научной или философской и обычно называется Естественной, в отличие от Технической или Искусственной классификации или расположения». [46] : 499
Ридли (1986) дал следующие определения: [42]
Стамос (2004) [47] : 138 писал: «Дело в том, что современные ученые классифицируют атомы на элементы на основе числа протонов, а не чего-либо еще, потому что только это является причинно-привилегированным фактором [золото имеет атомный номер 79 в периодической таблице, потому что в его ядре 79 протонов]. Таким образом, сама природа предоставила причинно-следственный монистический эссенциализм. Ученые, в свою очередь, просто открывают и следуют (где «просто» ≠ «легко»)».
Периодическая таблица — это классификация химических элементов, которая, в частности, связана с Дмитрием Менделеевым (см. История периодической таблицы ). Авторитетная работа по этой системе — Scerri (2020). [48] Hubert Feger (2001; добавлен пронумерованный список) писал об этом: [49] : 1967–1968 «Хорошо известной, все еще используемой и расширяющейся классификацией является Таблица элементов Менделеева. Ее можно рассматривать как прототип всех таксономий, поскольку она удовлетворяет следующим оценочным критериям:
Однако Берстен (2020) писал: «Хеплер-Смит, историк химии, и я, философ, чьи работы часто опираются на химию, нашли общий язык в общем разочаровании акцентами наших дисциплин на химических элементах как стереотипном примере естественного вида. Разочарование, которое мы разделяли, заключалось в том, что, хотя элементы действительно демонстрировали многие отличительные черты парадигматического вида, элементы не были теми видами, которые создавали интересные проблемы для классификации в химии, и даже не были теми видами, которые занимали большую часть современной критической химической мысли. Соединения, комплексы, пути реакций, субстраты, растворы — это были виды химической лаборатории, и редко, если вообще когда-либо, они аккуратно вписывались в таксономии в упорядоченном порядке классификации, предложенном Периодической таблицей элементов. Сосредоточение на рациональной и исторической основе развития Периодической таблицы сделало общепринятый взгляд на химическую классификацию гораздо более первозданным и гораздо менее интересным, чем любой из нас полагал». [50]
Таксономия Линнея — это особая форма биологической классификации (таксономии), созданная Карлом Линнеем , как изложено в его Systema Naturae (1735) и последующих работах. Основная дискуссия в научной литературе заключается в том, может ли система, созданная до теории эволюции Чарльза Дарвина, быть плодотворной и отражать развитие жизни. [51] [52]
Астрономия является прекрасным примером того, как теория научных революций (или сдвигов парадигм) Куна (1962) влияет на классификацию. [53] Например:
Хорнбостель–Сакс — система классификации музыкальных инструментов, разработанная Эрихом Морицем фон Хорнбостелем и Куртом Саксом и впервые опубликованная в 1914 году. [54] В оригинальной классификации верхними категориями являются:
Пятая высшая категория,
Каждая высшая категория подразделяется, и Hornbostel-Sachs — это очень полная классификация музыкальных инструментов с широким применением. В Википедии, например, все музыкальные инструменты организованы в соответствии с этой классификацией.
В отличие, например, от представленных выше астрономических и биологических классификаций, классификация Хорнбостеля-Сакса, по-видимому, очень мало подвержена влиянию исследований в области музыковедения и органологии . Она основана на огромных коллекциях музыкальных инструментов, но кажется скорее системой, навязанной вселенной инструментов, чем системой с органическими связями с научной теорией. Поэтому ее можно интерпретировать как систему, основанную на логическом разделении и рационалистической философии.
Диагностическое и статистическое руководство по психическим расстройствам (DSM) — это классификация психических расстройств, опубликованная Американской психиатрической ассоциацией (APA). Первое издание DSM было опубликовано в 1952 году, [55] а новейшее, пятое издание было опубликовано в 2013 году . [56] В отличие, например, от периодической таблицы и классификации Хорнбостеля-Сакса, принципы классификации сильно изменились за время ее существования. Первое издание было создано под влиянием психодинамической теории, DSM-III, опубликованное в 1980 году [57], приняло атеоретический, «описательный» подход к классификации [58] Система очень важна для всех людей, занимающихся психиатрией, будь то пациенты, исследователи или терапевты (в дополнение к страховым компаниям), но система подвергается резкой критике и не имеет научного статуса, как многие другие классификации. [59]