stringtranslate.com

Логарифм вероятности

В теории вероятностей и информатике логарифм вероятности — это просто логарифм вероятности . [ 1] Использование логарифмов вероятностей означает представление вероятностей в логарифмическом масштабе вместо стандартного единичного интервала .

Поскольку вероятности независимых событий умножаются, а логарифмы преобразуют умножение в сложение, логарифмические вероятности независимых событий складываются. Таким образом, логарифмические вероятности практичны для вычислений и имеют интуитивную интерпретацию в терминах теории информации : отрицательное ожидаемое значение логарифмических вероятностей является информационной энтропией события. Аналогично, правдоподобия часто преобразуются в логарифмическую шкалу, и соответствующее логарифмическое правдоподобие может быть интерпретировано как степень, в которой событие поддерживает статистическую модель . Логарифмическая вероятность широко используется в реализациях вычислений с вероятностью и изучается как самостоятельная концепция в некоторых приложениях теории информации, таких как обработка естественного языка .

Мотивация

Представление вероятностей таким образом имеет несколько практических преимуществ:

  1. Скорость. Поскольку умножение обходится дороже сложения , произведение большого количества вероятностей часто выполняется быстрее, если они представлены в логарифмической форме. (Преобразование в логарифмическую форму обходится дорого, но выполняется только один раз.) Умножение возникает из расчета вероятности того, что произойдет несколько независимых событий: вероятность того, что произойдут все независимые события, представляющие интерес, является произведением вероятностей всех этих событий.
  2. Точность. Использование логарифмических вероятностей улучшает численную устойчивость , когда вероятности очень малы, из-за способа, которым компьютеры аппроксимируют действительные числа . [1]
  3. Простота. Многие распределения вероятностей имеют экспоненциальную форму. Взятие логарифма этих распределений устраняет экспоненциальную функцию, разворачивая показатель. Например, логарифм вероятности функции плотности вероятности нормального распределения равен вместо . Логарифм вероятности упрощает выполнение некоторых математических манипуляций.
  4. Оптимизация. Поскольку большинство распространенных распределений вероятностей — в частности, экспоненциальное семейство — являются только логарифмически вогнутыми [2] [3], а вогнутость целевой функции играет ключевую роль в максимизации такой функции, как вероятность, оптимизаторы лучше работают с логарифмическими вероятностями.

Вопросы представительства

Функция логарифма не определена для нуля, поэтому логарифмические вероятности могут представлять только ненулевые вероятности. Поскольку логарифм числа в интервале отрицателен, часто используются отрицательные логарифмические вероятности. В этом случае логарифмические вероятности в следующих формулах будут инвертированы .

Для логарифма можно выбрать любое основание.

Базовые манипуляции

В этом разделе мы будем называть вероятности в логарифмическом пространстве и для краткости:

Произведение вероятностей соответствует сложению в логарифмическом пространстве.

Сумма вероятностей немного сложнее для вычисления в логарифмическом пространстве, требуя вычисления одной экспоненты и одного логарифма.

Однако во многих приложениях умножение вероятностей (дающее вероятность наступления всех независимых событий) используется чаще, чем их сложение (дающее вероятность наступления хотя бы одного из взаимоисключающих событий). Кроме того, в некоторых ситуациях можно избежать затрат на вычисление сложения, просто используя наивысшую вероятность в качестве приближения. Поскольку вероятности неотрицательны, это дает нижнюю границу. Это приближение используется в обратном порядке для получения непрерывного приближения функции max .

Добавление в лог-пространство

Формула выше точнее, чем , при условии использования асимметрии в формуле сложения. должно быть большим (наименее отрицательным) из двух операндов. Это также обеспечивает правильное поведение, если один из операндов — это плавающая отрицательная бесконечность , что соответствует вероятности нуля.

Эта величина неопределена и даст результат NaN .
Это и есть желаемый ответ.

Приведенная выше формула сама по себе будет неправильно давать неопределенный результат в случае, когда оба аргумента равны . Это следует проверять отдельно, чтобы вернуть .

По численным причинам следует использовать функцию, которая вычисляет ( log1p ) напрямую.

Смотрите также

Ссылки

  1. ^ ab Piech, Chris. "Вероятность для компьютерных ученых - Логарифмические вероятности" . Получено 20 июля 2023 г. .
  2. ^ Касс, Роберт Э.; Вос, Пол В. (1997). Геометрические основы асимптотического вывода. Нью-Йорк: John Wiley & Sons. стр. 14. ISBN 0-471-82668-5.
  3. ^ Пападопулос, Алекос (25 сентября 2013 г.). «Почему мы всегда ставим log() перед совместной pdf, когда используем MLE (оценку максимального правдоподобия)?». Stack Exchange .