В науке и технике логарифмический график или логарифмический график — это двумерный график числовых данных, который использует логарифмические шкалы как по горизонтальной, так и по вертикальной осям. Степенные функции — отношения формы — отображаются в виде прямых линий на логарифмическом графике, где показатель степени соответствует наклону, а коэффициент — отсекателю. Таким образом, эти графики очень полезны для распознавания этих отношений и оценки параметров . Для логарифма можно использовать любое основание, хотя чаще всего используется основание 10 (обычные логарифмы).
Если взять одночленное уравнение и взять логарифм этого уравнения (с любым основанием), то получим:
Установка и что соответствует использованию логарифмического графика, дает уравнение
где m = k — наклон линии ( градиент ), а b = log a — отрезок на оси (log y ), то есть log x = 0, поэтому, перевернув логарифмы, a — это значение y , соответствующее x = 1. [1]
Уравнение линии в логарифмическом масштабе будет выглядеть следующим образом: где m — наклон, а b — точка пересечения на логарифмическом графике.
Чтобы найти наклон графика, выбираются две точки на оси x , скажем, x 1 и x 2 . Используя приведенное ниже уравнение: и Наклон m находится с помощью разности: где F 1 — это сокращение от F ( x 1 ), а F 2 — это сокращение от F ( x 2 ). Рисунок справа иллюстрирует формулу. Обратите внимание, что наклон в примере рисунка отрицательный . Формула также дает отрицательный наклон, как видно из следующего свойства логарифма:
Вышеуказанная процедура теперь обратна, чтобы найти форму функции F ( x ) с использованием ее (предполагаемого) известного логарифмического графика. Чтобы найти функцию F , выберите некоторую фиксированную точку ( x 0 , F 0 ), где F 0 является сокращением для F ( x 0 ), где-нибудь на прямой линии на приведенном выше графике, а затем некоторую другую произвольную точку ( x 1 , F 1 ) на том же графике. Затем из формулы наклона выше: что приводит к Обратите внимание, что 10 log 10 ( F 1 ) = F 1 . Следовательно, журналы можно инвертировать, чтобы найти: или что означает, что Другими словами, F пропорциональна x в степени наклона прямой линии ее логарифмического графика. В частности, прямая линия на графике в двойном логарифмическом масштабе, содержащая точки ( x 0 , F 0 ) и ( x 1 , F 1 ), будет иметь функцию: Конечно, обратное тоже верно: любая функция вида будет иметь прямую линию в качестве своего логарифмического представления графика, где наклон линии равен m .
Чтобы вычислить площадь под непрерывным, прямолинейным сегментом логарифмического графика (или оценить площадь почти прямой линии), возьмите функцию, определенную ранее , и проинтегрируйте ее. Поскольку она работает только с определенным интегралом (две определенные конечные точки), площадь A под графиком принимает вид
Переставляя исходное уравнение и подставляя значения фиксированных точек, обнаруживаем, что
Подставляя обратно в интеграл, вы обнаружите, что для A от x 0 до x 1
Поэтому,
При m = −1 интеграл становится равным
Логарифмические графики часто используются для визуализации логарифмических линейных регрессионных моделей с (примерно) логарифмически нормальными или логарифмически логистическими ошибками. В таких моделях после логарифмического преобразования зависимых и независимых переменных может быть подогнана простая линейная регрессионная модель, при этом ошибки становятся гомоскедастическими . Эта модель полезна при работе с данными, которые демонстрируют экспоненциальный рост или спад, в то время как ошибки продолжают расти по мере роста независимого значения (т. е. гетероскедастическая ошибка).
Как и выше, в линейной модели логарифм-логарифм связь между переменными выражается степенным законом. Каждое единичное изменение независимой переменной приведет к постоянному процентному изменению зависимой переменной. Модель выражается как:
Логарифмируя обе части, получаем:
Это линейное уравнение в логарифмах `x` и `y`, с `log(a)` в качестве отсекаемого значения и `b` в качестве наклона. В котором , и .
Рисунок 1 иллюстрирует, как это выглядит. Он представляет два графика, созданных с использованием 10 000 смоделированных точек. Левый график, озаглавленный «Вогнутая линия с логнормальным шумом», отображает диаграмму рассеяния наблюдаемых данных (y) в зависимости от независимой переменной (x). Красная линия представляет собой «Медианную линию», а синяя линия — «Среднюю линию». Этот график иллюстрирует набор данных со степенной зависимостью между переменными, представленными вогнутой линией.
Когда обе переменные логарифмически преобразованы, как показано на правом графике рисунка 1, озаглавленном «Линейная линия логарифм-логарифм с нормальным шумом», связь становится линейной. Этот график также отображает диаграмму рассеяния наблюдаемых данных в зависимости от независимой переменной, но после того, как обе оси находятся в логарифмическом масштабе. Здесь и средняя, и медианная линии являются одной и той же (красной) линией. Это преобразование позволяет нам подогнать простую линейную регрессионную модель (которую затем можно преобразовать обратно в исходный масштаб — как медианную линию).
Преобразование левого графика в правый на рисунке 1 также демонстрирует влияние логарифмического преобразования на распределение шума в данных. На левом графике шум, по-видимому, следует логарифмически нормальному распределению , которое скошено вправо и с которым может быть трудно работать. На правом графике после логарифмического преобразования шум, по-видимому, следует нормальному распределению , которое легче рассуждать и моделировать.
Эта нормализация шума далее анализируется на рисунке 2, где представлен линейный график трех метрик ошибок (средняя абсолютная ошибка - MAE, среднеквадратичная ошибка - RMSE и средняя абсолютная логарифмическая ошибка - MALE), рассчитанных по скользящему окну размером 28 по оси x. Ось y дает ошибку, построенную против независимой переменной (x). Каждая метрика ошибки представлена разным цветом, с соответствующей сглаженной линией, наложенной на исходную линию (поскольку это всего лишь смоделированные данные, оценка ошибки немного скачкообразно). Эти метрики ошибок дают меру шума, поскольку он меняется при разных значениях x.
Логарифмические линейные модели широко используются в различных областях, включая экономику, биологию и физику, где многие явления демонстрируют степенное поведение. Они также полезны в регрессионном анализе при работе с гетероскедастическими данными, поскольку логарифмическое преобразование может помочь стабилизировать дисперсию.
Эти графики полезны, когда параметры a и b необходимо оценить на основе числовых данных. Такие спецификации часто используются в экономике .
Одним из примеров является оценка функций спроса на деньги на основе теории запасов , в которой можно предположить, что спрос на деньги в момент времени t определяется как где M — реальное количество денег, имеющихся у населения, R — норма прибыли на альтернативный, более доходный актив, превышающая норму прибыли на деньги, Y — реальный доход населения , U — ошибка, предположительно распределенная логарифмически нормально , A — параметр масштаба, подлежащий оценке, а b и c — параметры эластичности , подлежащие оценке. Взяв логарифмы, получим , что m = log M , a = log A , r = log R , y = log Y и u = log U , причем u распределено нормально . Это уравнение можно оценить с помощью обычного метода наименьших квадратов .
Другим экономическим примером является оценка производственной функции Кобба-Дугласа фирмы , которая является правой частью уравнения , в котором Q — количество продукции, которое может быть произведено за месяц, N — количество часов труда, использованного в производстве за месяц, K — количество часов физического капитала, использованного за месяц, U — ошибка, предположительно распределенная логарифмически нормально, а A , и — параметры , которые необходимо оценить. Взятие логарифмов дает уравнение линейной регрессии , где q = log Q , a = log A , n = log N , k = log K и u = log U.
Логарифмическую регрессию также можно использовать для оценки фрактальной размерности встречающегося в природе фрактала .
Однако движение в другом направлении — наблюдение того, что данные выглядят как приблизительная линия на двойной логарифмической шкале, и заключение о том, что данные следуют степенному закону — не всегда верно. [2]
На самом деле, многие другие функциональные формы кажутся приблизительно линейными в логарифмической шкале, и простая оценка качества подгонки линейной регрессии на зарегистрированных данных с использованием коэффициента детерминации ( R 2 ) может быть недействительной, поскольку предположения модели линейной регрессии, такие как гауссовская ошибка, могут не быть удовлетворены; кроме того, тесты подгонки логарифмической формы могут демонстрировать низкую статистическую мощность , поскольку эти тесты могут иметь низкую вероятность отклонения степенных законов в присутствии других истинных функциональных форм. В то время как простые логарифмические графики могут быть поучительны для обнаружения возможных степенных законов и использовались еще со времен Парето в 1890-х годах, проверка в качестве степенных законов требует более сложной статистики. [2]
Эти графики также чрезвычайно полезны, когда данные собираются путем изменения управляющей переменной вдоль экспоненциальной функции, в этом случае управляющая переменная x более естественно представлена в логарифмической шкале, так что точки данных равномерно распределены, а не сжаты в нижнем конце. Выходная переменная y может быть представлена линейно, что даст график lin–log (log x , y ), или ее логарифм также может быть взят, что даст график log–log (log x , log y ).
Диаграмма Боде ( график частотной характеристики системы) также является логарифмическим графиком.
В химической кинетике общая форма зависимости скорости реакции от концентрации имеет вид степенного закона ( закона действующих масс ), поэтому график в двойном логарифмическом масштабе полезен для оценки параметров реакции из эксперимента.