Логистическая функция или логистическая кривая — это обычная S-образная кривая ( сигмоидальная кривая ) с уравнением
где
Логистическая функция имеет область определения действительные числа , предел при равен 0 и предел при равен .
Стандартная логистическая функция , изображенная справа, где , имеет уравнение
и иногда просто называется сигмоидой . [2] Иногда ее также называют экспитом , поскольку она является обратной функцией логита . [ 3] [4]
Логистическая функция находит применение в различных областях, включая биологию (особенно экологию ), биоматематику , химию , демографию , экономику , геонауки , математическую психологию , вероятность , социологию , политологию , лингвистику , статистику и искусственные нейронные сети . Существуют различные обобщения, в зависимости от области.
Логистическая функция была введена в серии из трех статей Пьера Франсуа Ферхюльста между 1838 и 1847 годами, который разработал ее как модель роста населения путем корректировки модели экспоненциального роста под руководством Адольфа Кетле . [5] Ферхюльст впервые разработал функцию в середине 1830-х годов, опубликовав краткую заметку в 1838 году, [1] затем представил расширенный анализ и назвал функцию в 1844 году (опубликовано в 1845 году); [a] [6] в третьей статье был скорректирован поправочный член в его модели роста населения Бельгии. [7]
Начальная стадия роста приблизительно экспоненциальна (геометрична); затем, по мере насыщения, рост замедляется до линейного (арифметического), а в зрелости рост приближается к пределу с экспоненциально затухающим разрывом, как на начальной стадии наоборот.
Ферхюльст не объяснил выбор термина «логистический» (фр. logistique ), но, по-видимому, он противопоставляется логарифмической кривой, [8] [b] и по аналогии с арифметикой и геометрией. Его модель роста предшествует обсуждению арифметического роста и геометрического роста (кривую которого он называет логарифмической кривой , вместо современного термина экспоненциальная кривая ), и, таким образом, «логистический рост» предположительно назван по аналогии, логистический происходит от древнегреческого : λογῐστῐκός , романизированного : logistikós , традиционного раздела греческой математики . [c]
Как слово, произошедшее от древнегреческих математических терминов, [9] название этой функции не связано с военным и управленческим термином «логистика» , который, напротив, происходит от французского : logis «жилье», [10] хотя некоторые полагают, что греческий термин также оказал влияние на логистику ; [9] подробности см . в разделе «Логистика» § «Происхождение» .
TheСтандартная логистическая функция — это логистическая функция с параметрами,,, которая дает
На практике, в силу природы экспоненциальной функции , часто бывает достаточно вычислить стандартную логистическую функцию для небольшого диапазона действительных чисел, например, диапазона, содержащегося в [−6, +6], поскольку она быстро сходится очень близко к своим значениям насыщения 0 и 1.
Логистическая функция обладает свойством симметрии, которое заключается в том, что
Это отражает тот факт, что рост от 0 при малом значении симметричен уменьшению зазора до предела (1) при большом значении.
Далее, — нечетная функция .
Сумма логистической функции и ее отражения относительно вертикальной оси равна
Логистическая функция, таким образом, вращательно симметрична относительно точки (0, 1/2). [11]
Логистическая функция является обратной натуральной логарифмической функцией.
и таким образом преобразует логарифм шансов в вероятность . Преобразование из логарифма отношения правдоподобия двух альтернатив также принимает форму логистической кривой.
Логистическая функция представляет собой смещенную и масштабированную функцию гиперболического тангенса : или
Это следует из
Соотношение гиперболического тангенса приводит к другой форме производной логистической функции:
который связывает логистическую функцию с логистическим распределением .
Геометрически, функция гиперболического тангенса является гиперболическим углом на единичной гиперболе , который факторизуется как , и, таким образом, имеет асимптоты прямых, проходящих через начало координат с наклоном и с наклоном , и вершиной в , соответствующей диапазону и средней точке ( ) tanh. Аналогично, логистическую функцию можно рассматривать как гиперболический угол на гиперболе , который факторизуется как , и, таким образом, имеет асимптоты прямых, проходящих через начало координат с наклоном и с наклоном , и вершиной в , соответствующей диапазону и средней точке ( ) логистической функции.
Параметрически гиперболический косинус и гиперболический синус дают координаты на единичной гиперболе: [d] , с частным гиперболическим тангенсом. Аналогично, параметризует гиперболу , с частным логистической функцией. Они соответствуют линейным преобразованиям (и изменению масштаба параметризации) гиперболы , с параметризацией : параметризация гиперболы для логистической функции соответствует и линейному преобразованию , в то время как параметризация единичной гиперболы (для гиперболического тангенса) соответствует линейному преобразованию .
Стандартная логистическая функция имеет легко вычисляемую производную . Производная известна как плотность логистического распределения :
из которого все высшие производные могут быть получены алгебраически. Например, .
Логистическое распределение — это семейство местоположения–масштаба , которое соответствует параметрам логистической функции. Если фиксировано, то средняя точка — это местоположение, а наклон — это масштаб.
Наоборот, ее первообразную можно вычислить путем подстановки , поскольку
Итак (опуская постоянную интегрирования )
В искусственных нейронных сетях это известно как функция softplus и (с масштабированием) является плавной аппроксимацией функции рампы , так же как логистическая функция (с масштабированием) является плавной аппроксимацией ступенчатой функции Хевисайда .
Уникальная стандартная логистическая функция является решением простого нелинейного обыкновенного дифференциального уравнения первого порядка
с граничным условием . Это уравнение является непрерывной версией логистического отображения . Обратите внимание, что обратная логистическая функция является решением простого линейного обыкновенного дифференциального уравнения первого порядка. [12]
Качественное поведение легко понять в терминах фазовой линии : производная равна 0, когда функция равна 1; и производная положительна для значений между 0 и 1 и отрицательна для значений выше 1 или меньше 0 (хотя отрицательные популяции, как правило, не согласуются с физической моделью). Это дает неустойчивое равновесие при 0 и устойчивое равновесие при 1, и, таким образом, для любого значения функции больше 0 и меньше 1 она возрастает до 1.
Логистическое уравнение является частным случаем дифференциального уравнения Бернулли и имеет следующее решение:
Выбор константы интегрирования дает другую известную форму определения логистической кривой:
Более количественно, как видно из аналитического решения, логистическая кривая демонстрирует ранний экспоненциальный рост для отрицательного аргумента, который достигает линейного роста с наклоном 1/4 для аргумента, близкого к 0, а затем приближается к 1 с экспоненциально затухающим разрывом.
Выведенное выше дифференциальное уравнение является частным случаем общего дифференциального уравнения, которое моделирует только сигмоидальную функцию для . Во многих приложениях моделирования может быть желательной более общая форма [13] . Ее решением является смещенная и масштабированная сигмоидальная функция .
Когда емкость , значение логистической функции находится в диапазоне и может быть интерпретировано как вероятность p . [e] Более подробно, p можно интерпретировать как вероятность одной из двух альтернатив (параметр распределения Бернулли ); [f] две альтернативы являются дополнительными, поэтому вероятность другой альтернативы равна и . Две альтернативы кодируются как 1 и 0, что соответствует предельным значениям как .
В этой интерпретации вход x — это логарифм шансов для первой альтернативы (относительно другой альтернативы), измеренный в «логистических единицах» (или логитах ), — это шансы для первого события (относительно второго), и, вспоминая, что заданные шансы для ( против 1 ), вероятность — это отношение для к (за плюс против), , мы видим, что — это вероятность первой альтернативы. И наоборот, x — это логарифм шансов против второй альтернативы, — это логарифм шансов для второй альтернативы, — это шансы для второй альтернативы, — это вероятность второй альтернативы.
Это можно сформулировать более симметрично в терминах двух входов, и , что затем естественным образом обобщается на более чем две альтернативы. При наличии двух действительных числовых входов, и , интерпретируемых как логиты, их разность является логарифмом шансов для варианта 1 (логарифмом шансов против варианта 0), является шансом, является вероятностью варианта 1, и аналогично является вероятностью варианта 0.
Эта форма немедленно обобщается на большее количество альтернатив, таких как функция softmax , которая является векторной функцией, i -я координата которой равна .
Более тонко, симметричная форма подчеркивает интерпретацию входных данных x как и, таким образом, относительно некоторой точки отсчета, неявно к . Примечательно, что функция softmax инвариантна при добавлении константы ко всем логитам , что соответствует разнице, являющейся логарифмическими шансами для варианта j против варианта i , но отдельные логиты не являются логарифмическими шансами сами по себе. Часто один из вариантов используется в качестве ссылки («опорный»), и его значение фиксируется как 0 , поэтому другие логиты интерпретируются как шансы относительно этого ссылки. Это обычно делается с первой альтернативой, отсюда и выбор нумерации: , а затем — логарифмические шансы для варианта i против варианта 0 . Поскольку , это дает член во многих выражениях для логистической функции и обобщений. [g]
В моделировании роста существует множество обобщений, включая обобщенную логистическую кривую , функцию Гомперца , кумулятивную функцию распределения смещенного распределения Гомперца и гиперболическую функцию типа I.
В статистике, где логистическая функция интерпретируется как вероятность одной из двух альтернатив, обобщением на три или более альтернатив является функция softmax , которая является векторной, поскольку она дает вероятность каждой альтернативы.
Типичным применением логистического уравнения является общая модель роста популяции (см. также динамика популяции ), первоначально предложенная Пьером-Франсуа Ферхюльстом в 1838 году, где скорость воспроизводства пропорциональна как существующей популяции, так и количеству доступных ресурсов, при прочих равных условиях. Уравнение Ферхюльста было опубликовано после того, как Ферхюльст прочитал работу Томаса Мальтуса « Очерк о принципе народонаселения» , в которой описывается мальтузианская модель роста простого (неограниченного) экспоненциального роста. Ферхюльст вывел свое логистическое уравнение для описания самоограничивающегося роста биологической популяции . Уравнение было заново открыто в 1911 году А. Г. Маккендриком для роста бактерий в бульоне и экспериментально проверено с использованием метода нелинейной оценки параметров. [14] Уравнение также иногда называют уравнением Ферхюльста-Перла после его повторного открытия в 1920 году Рэймондом Перлом (1879–1940) и Лоуэллом Ридом (1888–1966) из Университета Джонса Хопкинса . [15] Другой ученый, Альфред Дж. Лотка, снова вывел уравнение в 1925 году, назвав его законом роста населения .
Если представить численность популяции ( в экологии часто используется вместо этого), а представить время, то эта модель формализуется дифференциальным уравнением :
где константа определяет скорость роста , а — грузоподъемность .
В уравнении ранняя, беспрепятственная скорость роста моделируется первым членом . Значение скорости представляет собой пропорциональное увеличение популяции за единицу времени. Позже, по мере роста популяции, модуль второго члена (который при умножении равен ) становится почти таким же большим, как и первый, поскольку некоторые члены популяции мешают друг другу, конкурируя за некоторые критические ресурсы, такие как еда или жизненное пространство. Этот антагонистический эффект называется бутылочным горлышком и моделируется значением параметра . Конкуренция уменьшает совокупную скорость роста, пока значение не перестанет расти (это называется зрелостью популяции). Решение уравнения (при этом исходная популяция) имеет вид
где
где — предельное значение , наибольшее значение, которого популяция может достичь за бесконечное время (или приблизиться к достижению за конечное время). Пропускная способность асимптотически достигается независимо от начального значения , а также в случае, когда .
В экологии виды иногда называют -стратегами или -стратегами в зависимости от селективных процессов, которые сформировали их стратегии жизненного цикла . Выбор переменных измерений таким образом, чтобы измерять популяцию в единицах пропускной способности, а измерять время в единицах , дает безразмерное дифференциальное уравнение
Первообразную экологической формы логистической функции можно вычислить путем подстановки , поскольку
Поскольку условия окружающей среды влияют на грузоподъемность, она может изменяться со временем, что приводит к следующей математической модели:
Особенно важным случаем является случай, когда грузоподъемность периодически меняется с течением времени :
Можно показать [16], что в таком случае, независимо от начального значения , будет стремиться к единственному периодическому решению , период которого равен .
Типичное значение составляет один год: в таком случае может отражаться периодические изменения погодных условий.
Другое интересное обобщение заключается в том, чтобы считать, что пропускная способность является функцией популяции в более раннее время, фиксируя задержку в том, как популяция изменяет свою среду. Это приводит к логистическому уравнению задержки [17] , которое имеет очень богатое поведение, с бистабильностью в некотором диапазоне параметров, а также монотонным спадом до нуля, плавным экспоненциальным ростом, прерывистым неограниченным ростом (т. е. множественными S-образными формами), прерывистым ростом или чередованием до стационарного уровня, колебательным приближением к стационарному уровню, устойчивыми колебаниями, конечными временными сингулярностями, а также конечной временной смертью.
Логистические функции используются в статистике в нескольких ролях. Например, они являются кумулятивной функцией распределения логистического семейства распределений , и они, немного упрощенно, используются для моделирования шансов шахматиста победить своего противника в рейтинговой системе Эло . Далее следуют более конкретные примеры.
Логистические функции используются в логистической регрессии для моделирования того, как вероятность события может зависеть от одной или нескольких объясняющих переменных : примером может служить модель
где — объясняющая переменная, — параметры модели, подлежащие подгонке, — стандартная логистическая функция.
Логистическая регрессия и другие логлинейные модели также широко используются в машинном обучении . Обобщением логистической функции на множественные входы является функция активации softmax , используемая в полиномиальной логистической регрессии .
Другое применение логистической функции — модель Раша , используемая в теории ответов на вопросы . В частности, модель Раша формирует основу для оценки максимального правдоподобия местоположений объектов или лиц на континууме , основанную на наборах категориальных данных , например, способностей лиц на континууме, основанных на ответах, которые были классифицированы как правильные и неправильные.
Логистические функции часто используются в искусственных нейронных сетях для введения нелинейности в модель или для фиксации сигналов в пределах заданного интервала . Популярный элемент нейронной сети вычисляет линейную комбинацию своих входных сигналов и применяет ограниченную логистическую функцию в качестве функции активации к результату; эту модель можно рассматривать как «сглаженный» вариант классического порогового нейрона .
Обычный выбор для функций активации или «сжатия», используемых для ограничения больших величин с целью ограничения реакции нейронной сети, [18 ]
что является логистической функцией.
Эти отношения приводят к упрощенным реализациям искусственных нейронных сетей с искусственными нейронами . Практики предупреждают, что сигмоидальные функции, которые являются антисимметричными относительно начала координат (например, гиперболический тангенс ), приводят к более быстрой сходимости при обучении сетей с обратным распространением . [19]
Логистическая функция сама по себе является производной от другой предложенной функции активации — softplus .
Другое применение логистической кривой — медицина, где логистическое дифференциальное уравнение используется для моделирования роста опухолей. Это применение можно считать расширением вышеупомянутого использования в рамках экологии (см. также Обобщенную логистическую кривую , допускающую больше параметров). Обозначая с размером опухоли в момент времени , ее динамика регулируется
который относится к типу
где - скорость пролиферации опухоли.
Если химиотерапия начинается с логарифмического эффекта гибели, уравнение можно пересмотреть следующим образом:
где - смертность, вызванная терапией. В идеализированном случае очень длительной терапии можно смоделировать как периодическую функцию (периода ) или (в случае непрерывной инфузионной терапии) как постоянную функцию, и получается, что
т.е. если средний уровень смертности, вызванный терапией, превышает базовый уровень пролиферации, то происходит искоренение заболевания. Конечно, это слишком упрощенная модель как роста, так и терапии (например, она не учитывает феномен клональной резистентности).
Новый инфекционный патоген, к которому у населения нет иммунитета, обычно распространяется экспоненциально на ранних стадиях, в то время как запас восприимчивых людей обилен. Вирус SARS-CoV-2, вызывающий COVID-19, продемонстрировал экспоненциальный рост на ранних стадиях инфекции в нескольких странах в начале 2020 года. [20] Факторы, включая отсутствие восприимчивых хозяев (через продолжающееся распространение инфекции до тех пор, пока она не преодолеет порог коллективного иммунитета ) или снижение доступности потенциальных хозяев из-за мер физического дистанцирования, могут привести к экспоненциально выглядящим эпидемическим кривым, которые сначала линеаризуются (воспроизводя переход от «логарифмического» к «логистическому», впервые отмеченный Пьером-Франсуа Верхюльстом , как отмечено выше), а затем достигают максимального предела. [21]
Логистическая функция или связанные с ней функции (например, функция Гомпертца ) обычно используются в описательной или феноменологической манере, поскольку они хорошо подходят не только для раннего экспоненциального роста, но и для окончательного выравнивания пандемии по мере того, как население вырабатывает коллективный иммунитет. Это контрастирует с реальными моделями пандемий, которые пытаются сформулировать описание, основанное на динамике пандемии (например, частота контактов, время инкубации, социальное дистанцирование и т. д.). Однако были разработаны некоторые простые модели, которые дают логистическое решение. [22] [23] [24]
Обобщенная логистическая функция , также называемая кривой роста Ричардса, была применена для моделирования ранней фазы вспышки COVID-19 . [25] Авторы подгоняют обобщенную логистическую функцию под совокупное число инфицированных случаев, здесь называемое траекторией инфекции . В литературе существуют различные параметризации обобщенной логистической функции . Одной из часто используемых форм является
где — действительные числа, а — положительное действительное число. Гибкость кривой обусловлена параметром : (i) если , то кривая сводится к логистической функции, и (ii) по мере приближения к нулю кривая сходится к функции Гомпертца . В эпидемиологическом моделировании , , и представляют собой окончательный размер эпидемии, уровень заражения и лаг-фазу соответственно. На правой панели показан пример траектории заражения, когда установлено значение .
Одним из преимуществ использования функции роста, такой как обобщенная логистическая функция , в эпидемиологическом моделировании является ее относительно простое применение в многоуровневой структуре модели , где информация из разных географических регионов может быть объединена.
Концентрация реагентов и продуктов в автокаталитических реакциях подчиняется логистической функции. Деградация катализатора реакции восстановления кислорода (ORR) без металлов платиновой группы (без МПГ) в катодах топливных элементов подчиняется логистической функции распада, [26] что предполагает механизм автокаталитической деградации.
Логистическая функция определяет статистическое распределение фермионов по энергетическим состояниям системы, находящейся в тепловом равновесии. В частности, это распределение вероятностей того, что каждый возможный энергетический уровень занят фермионом, согласно статистике Ферми–Дирака .
Логистическая функция также находит применение в оптике, в частности, при моделировании таких явлений, как миражи . При определенных условиях, таких как наличие градиента температуры или концентрации из-за диффузии и балансировки с гравитацией, может возникнуть поведение логистической кривой. [27] [28]
Мираж, возникающий из-за градиента температуры, который изменяет показатель преломления, связанный с плотностью/концентрацией материала на расстоянии, можно смоделировать с помощью жидкости с градиентом показателя преломления, обусловленным градиентом концентрации. Этот механизм можно приравнять к модели предельного роста популяции, где концентрированная область пытается диффундировать в область с более низкой концентрацией, одновременно стремясь к равновесию с гравитацией, тем самым получая кривую логистической функции. [27]
См. Диффузионная сварка .
В лингвистике логистическая функция может использоваться для моделирования языковых изменений : [29] инновация, которая поначалу является незначительной, со временем начинает распространяться быстрее, а затем медленнее по мере того, как она становится более общепринятой.
Логистическая S-образная кривая может быть использована для моделирования реакции урожая на изменения факторов роста. Существует два типа функций отклика: положительные и отрицательные кривые роста. Например, урожайность урожая может увеличиваться с увеличением значения фактора роста до определенного уровня (положительная функция) или уменьшаться с увеличением значений фактора роста (отрицательная функция из-за отрицательного фактора роста), что требует перевернутой S-образной кривой.
Логистическую функцию можно использовать для иллюстрации процесса распространения инновации на протяжении ее жизненного цикла.
В «Законах подражания» (1890) Габриэль Тард описывает возникновение и распространение новых идей через подражательные цепи. В частности, Тард выделяет три основные стадии, через которые распространяются инновации: первая соответствует трудному началу, в течение которого идея должна бороться во враждебной среде, полной противостоящих привычек и верований; вторая соответствует собственно экспоненциальному взлету идеи, с ; наконец, третья стадия является логарифмической, с , и соответствует времени, когда импульс идеи постепенно замедляется, в то время как одновременно появляются новые идеи-оппоненты. Последующая ситуация останавливает или стабилизирует прогресс инновации, который приближается к асимптоте.
В суверенном государстве субнациональные единицы (государства-члены или города) могут использовать кредиты для финансирования своих проектов. Однако этот источник финансирования обычно подчиняется строгим правовым правилам, а также ограничениям дефицита экономики , особенно ресурсам, которые банки могут ссужать (из-за их собственных или базельских лимитов). Эти ограничения, которые представляют собой уровень насыщения, наряду с экспоненциальным натиском в экономической конкуренции за деньги, создают диффузию государственных финансов кредитных требований, а совокупный национальный ответ представляет собой сигмоидальную кривую . [32]
Исторически сложилось так, что при появлении новых продуктов проводится интенсивное количество исследований и разработок , что приводит к резкому улучшению качества и снижению стоимости. Это приводит к периоду быстрого роста отрасли. Вот некоторые из наиболее известных примеров: железные дороги, лампы накаливания, электрификация , автомобили и авиаперевозки. В конце концов, возможности резкого улучшения и снижения стоимости исчерпываются, продукт или процесс широко используются, а потенциальных новых клиентов остается мало, и рынки становятся насыщенными.
Логистический анализ использовался в работах нескольких исследователей Международного института прикладного системного анализа ( IIASA ). Эти работы посвящены распространению различных инноваций, инфраструктур и замене источников энергии, а также роли труда в экономике и длительному экономическому циклу. Длительные экономические циклы исследовал Роберт Айрес (1989). [33] Чезаре Маркетти опубликовал работы о длительных экономических циклах и распространении инноваций. [34] [35] В книге Арнульфа Грюблера (1990) дается подробный отчет о распространении инфраструктур, включая каналы, железные дороги, автомагистрали и авиалинии, показывающий, что их распространение следовало логистическим кривым. [36]
Карлота Перес использовала логистическую кривую для иллюстрации длинного ( кондратьевского ) делового цикла со следующими обозначениями: начало технологической эры как вторжение , подъем как безумие , быстрое наращивание как синергия и завершение как зрелость . [37]
Регрессии логистического роста несут значительную неопределенность, когда данные доступны только до точки перегиба процесса роста. В этих условиях оценка высоты, на которой произойдет точка перегиба, может иметь неопределенность, сопоставимую с грузоподъемностью (K) системы.
Метод смягчения этой неопределенности заключается в использовании пропускной способности из суррогатного логистического процесса роста в качестве точки отсчета. [38] Включая это ограничение, даже если K является только оценкой в пределах двух коэффициентов, регрессия стабилизируется, что повышает точность и снижает неопределенность в параметрах прогнозирования. Этот подход может применяться в таких областях, как экономика и биология, где доступны аналогичные суррогатные системы или популяции для информирования анализа.
Линк [39] создал расширение теории последовательного анализа Вальда до свободного от распределения накопления случайных величин до тех пор, пока положительная или отрицательная граница не будет впервые равна или превышена. Линк [40] выводит вероятность первого равенства или превышения положительной границы как , логистическую функцию. Это первое доказательство того, что логистическая функция может иметь в своей основе стохастический процесс. Линк [41] приводит столетие примеров «логистических» экспериментальных результатов и недавно выведенную связь между этой вероятностью и временем поглощения на границах.
Nous donnerons le nom
de logistic
à la courbe [Мы дадим кривой
логистическое
название ]
Диаграмма решила для меня этот вопрос: две кривые, обозначенные как «Логистическая» и «Логарифмическая», нарисованы на одних и тех же осях, и можно увидеть, что есть область, где они почти точно совпадают, а затем расходятся.
Я пришел к выводу, что намерением Верхюльста при названии кривой было действительно предложить это сравнение, и что «логистическая» предназначалось для передачи «логарифмического» качества кривой.
{{cite journal}}
: CS1 maint: numeric names: authors list (link)