- Даман с ошейником
- Галка с кольцевым меченым кольцом
- Маркированная янтарная улитка Читтенанго яйцевидной формы
- Помечено как Обыкновенное колечко
Метод маркировки и повторной поимки обычно используется в экологии для оценки размера популяции животных , когда нецелесообразно подсчитывать каждую особь. [1] Часть популяции отлавливается, маркируется и выпускается. Позже отлавливается другая часть, и подсчитывается количество маркированных особей в выборке. Поскольку количество маркированных особей во второй выборке должно быть пропорционально количеству маркированных особей во всей популяции, оценку общего размера популяции можно получить, разделив количество маркированных особей на долю маркированных особей во второй выборке. Метод предполагает, справедливо или нет, что вероятность поимки одинакова для всех особей. [2] Другие названия этого метода или тесно связанные методы включают в себя: захват-повторная поимка , захват-маркировка-повторная поимка , маркировка-повторная поимка, прицел-повторная поимка , прицел-вызов , отметка-выпуск-повторная поимка , оценка множественных систем , восстановление полосы , метод Петерсена , [3] и метод Линкольна .
Другое важное применение этих методов — эпидемиология , [4] где они используются для оценки полноты установления регистров заболеваний. Типичные приложения включают оценку числа людей, нуждающихся в определенных услугах (например, услуги для детей с трудностями в обучении , услуги для пожилых людей с ограниченными возможностями, живущих в обществе), или с определенными условиями (например, наркоманы, люди, инфицированные ВИЧ и т. д.). [5]
Обычно исследователь посещает исследуемую территорию и использует ловушки, чтобы поймать группу особей живыми. Каждая из этих особей помечается уникальным идентификатором (например, пронумерованной меткой или полосой), а затем выпускается невредимой обратно в окружающую среду. Метод повторной поимки был впервые использован для экологического исследования в 1896 году К. Г. Йоханнесом Петерсеном для оценки популяции камбалы Pleuronectes platessa . [2]
Необходимо дать достаточно времени, чтобы меченые особи перераспределились среди немеченой популяции. [2]
Затем исследователь возвращается и захватывает еще одну выборку особей. Некоторые особи во второй выборке будут помечены во время первого визита и теперь известны как повторные поимки. [6] Другие организмы, пойманные во время второго визита, не будут пойманы во время первого визита в исследуемую область. Этим немаркированным животным обычно дают метку или кольцо во время второго визита, а затем отпускают. [2]
Размер популяции можно оценить всего за два посещения исследуемой территории. Обычно посещений совершается больше двух, особенно если требуются оценки выживаемости или перемещения. Независимо от общего числа посещений исследователь просто записывает дату каждого захвата каждой особи. Полученные «истории захвата» анализируются математически для оценки размера популяции, выживаемости или перемещения. [2]
При отлове и маркировке организмов экологи должны учитывать благополучие организмов. Если выбранный идентификатор наносит вред организму, его поведение может стать нерегулярным.
Позволять
Биолог хочет оценить размер популяции черепах в озере. Она ловит 10 черепах во время своего первого визита к озеру и помечает их спины краской. Через неделю она возвращается к озеру и ловит 15 черепах. У пяти из этих 15 черепах на спинах есть краска, что указывает на то, что они являются повторно пойманными животными. Этот пример: (n, K, k) = (10, 15, 5). Задача состоит в оценке N .
Метод Линкольна–Петерсена [7] (также известный как индекс Петерсена–Линкольна [2] или индекс Линкольна ) можно использовать для оценки размера популяции, если было совершено только два визита в исследуемую область. Этот метод предполагает, что исследуемая популяция «закрыта». Другими словами, два визита в исследуемую область достаточно близки по времени, так что ни одна особь не умирает, не рождается и не перемещается в исследуемую область или из нее между визитами. Модель также предполагает, что никакие метки не опадают с животных между визитами исследователя на полевой участок, и что исследователь правильно регистрирует все метки.
С учетом этих условий предполагаемая численность популяции составляет:
Предполагается [8] , что все особи имеют одинаковую вероятность быть пойманными во второй выборке, независимо от того, были ли они ранее пойманы в первой выборке (при наличии только двух выборок это предположение невозможно проверить напрямую).
Это означает, что во второй выборке доля пойманных помеченных особей ( ) должна равняться доле помеченной популяции ( ). Например, если бы половина помеченных особей была поймана повторно, можно было бы предположить, что половина популяции была включена во вторую выборку.
В символах,
Перестановка этого дает
формула, используемая для метода Линкольна–Петерсена. [8]
В примере (n, K, k) = (10, 15, 5) метод Линкольна–Петерсена оценивает, что в озере находится 30 черепах.
Оценка Линкольна-Петерсена асимптотически несмещена, когда размер выборки стремится к бесконечности, но смещена при малых размерах выборки. [9] Альтернативная менее смещенная оценка размера популяции дается оценщиком Чепмена : [9]
Пример (n, K, k) = (10, 15, 5) дает
Обратите внимание, что ответ, полученный с помощью этого уравнения, должен быть усечен, а не округлен. Таким образом, метод Чепмена оценивает 28 черепах в озере.
Удивительно, но оценка Чепмена была одной из гипотез из ряда возможных оценок: «На практике оценкой будет целое число, которое сразу меньше ( K +1)( n +1)/( k +1) или даже Kn /( k +1). Вышеуказанная форма более удобна для математических целей». [9] (см. сноску, стр. 144). Чепмен также обнаружил, что оценка может иметь значительное отрицательное смещение для малых Kn / N [9] (стр. 146), но его это не беспокоило, поскольку оцененные стандартные отклонения были большими для этих случаев.
Приблизительный доверительный интервал для размера популяции N можно получить следующим образом:
где соответствует квантилю стандартной нормальной случайной величины, а
Пример ( n, K, k ) = (10, 15, 5) дает оценку N ≈ 30 с 95% доверительным интервалом от 22 до 65.
Было показано, что этот доверительный интервал имеет фактические вероятности охвата, которые близки к номинальному уровню даже для небольших популяций и экстремальных вероятностей захвата (близких к 0 или 1), в которых другие доверительные интервалы не достигают номинальных уровней охвата. [10]
Среднее значение ± стандартное отклонение равно
где
Вывод можно найти здесь: Обсуждение:Маркировка и повторная регистрация#Статистическая обработка .
Пример ( n, K, k ) = (10, 15, 5) дает оценку N ≈ 42 ± 21,5
Вероятность поимки относится к вероятности обнаружения отдельного животного или человека, представляющего интерес, [11] и используется как в экологии, так и в эпидемиологии для обнаружения заболеваний животных или человека, [12] соответственно.
Вероятность поимки часто определяется как модель с двумя переменными, в которой f определяется как доля конечного ресурса, выделенного на обнаружение интересующего животного или человека из сектора высокого риска популяции животных или людей, а q — это частота времени, когда проблема (например, болезнь животных) возникает в секторе высокого риска по сравнению с сектором низкого риска. [13] Например, применение модели в 1920-х годах заключалось в обнаружении носителей брюшного тифа в Лондоне, которые либо прибывали из зон с высоким уровнем заболеваемости туберкулезом (вероятность q того, что пассажир с заболеванием прибыл из такой области, где q > 0,5), либо с низким уровнем (вероятность 1− q ). [14] Было установлено, что только 5 из 100 путешественников могут быть обнаружены, и 10 из 100 были из зоны высокого риска. Тогда вероятность поимки P определялась как:
где первый член относится к вероятности обнаружения (вероятности захвата) в зоне высокого риска, а последний член относится к вероятности обнаружения в зоне низкого риска. Важно, что формулу можно переписать как линейное уравнение относительно f :
Поскольку это линейная функция, из этого следует, что для определенных версий q , для которых наклон этой линии (первый член, умноженный на f ) положителен, все ресурсы обнаружения должны быть направлены на популяцию с высоким риском ( f следует установить равным 1, чтобы максимизировать вероятность захвата), тогда как для других значений q , для которых наклон линии отрицателен, все ресурсы обнаружения должны быть направлены на популяцию с низким риском ( f следует установить равным 0. Мы можем решить приведенное выше уравнение для значений q, для которых наклон будет положительным, чтобы определить значения, для которых f следует установить равным 1, чтобы максимизировать вероятность захвата:
что упрощается до:
Это пример линейной оптимизации . [13] В более сложных случаях, когда более одного ресурса f выделяется более чем двум областям, часто используется многомерная оптимизация с помощью симплексного алгоритма или его производных.
Литература по анализу исследований захвата-повторного захвата расцвела с начала 1990-х годов [ требуется ссылка ] . Существуют очень сложные статистические модели, доступные для анализа этих экспериментов. [15] Простая модель, которая легко вмещает исследование с тремя источниками или тремя визитами, - это подгонка модели регрессии Пуассона . Сложные модели отметки-повторного захвата могут быть подогнаны с несколькими пакетами для языка программирования с открытым исходным кодом R. К ним относятся "Spatially Explicit Capture-Recapture (secr)", [16] "Loglinear Models for Capture-Recapture Experiments (Rcapture)", [17] и "Mark-Recapture Distance Sampling (mrds)". [18] Такие модели также могут быть подогнаны с помощью специализированных программ, таких как MARK [19] или E-SURGE. [20]
Другие часто используемые родственные методы включают модель Джолли–Себера (используется в открытых популяциях и для множественных оценок переписи) и оценщики Шнабеля [21] (расширение метода Линкольна–Петерсена для закрытых популяций). Они подробно описаны Сазерлендом. [22]
Моделирование данных по меткам-повторным поимкам имеет тенденцию к более интегративному подходу, [23] который объединяет данные по меткам-повторным поимкам с моделями динамики популяции и другими типами данных. Интегрированный подход более требователен к вычислениям, но извлекает больше информации из данных, улучшая параметры и оценки неопределенности . [24]