Логарифм вероятностей, полезен для расчетов
В теории вероятностей и информатике логарифм вероятности — это просто логарифм вероятности . [ 1] Использование логарифмов вероятностей означает представление вероятностей в логарифмическом масштабе вместо стандартного единичного интервала .
Поскольку вероятности независимых событий умножаются, а логарифмы преобразуют умножение в сложение, логарифмические вероятности независимых событий складываются. Таким образом, логарифмические вероятности практичны для вычислений и имеют интуитивную интерпретацию в терминах теории информации : отрицательное ожидаемое значение логарифмических вероятностей является информационной энтропией события. Аналогично, правдоподобия часто преобразуются в логарифмическую шкалу, и соответствующее логарифмическое правдоподобие может быть интерпретировано как степень, в которой событие поддерживает статистическую модель . Логарифмическая вероятность широко используется в реализациях вычислений с вероятностью и изучается как самостоятельная концепция в некоторых приложениях теории информации, таких как обработка естественного языка .
Мотивация
Представление вероятностей таким образом имеет несколько практических преимуществ:
- Скорость. Поскольку умножение обходится дороже сложения , произведение большого количества вероятностей часто выполняется быстрее, если они представлены в логарифмической форме. (Преобразование в логарифмическую форму обходится дорого, но выполняется только один раз.) Умножение возникает из расчета вероятности того, что произойдет несколько независимых событий: вероятность того, что произойдут все независимые события, представляющие интерес, является произведением вероятностей всех этих событий.
- Точность. Использование логарифмических вероятностей улучшает численную устойчивость , когда вероятности очень малы, из-за способа, которым компьютеры аппроксимируют действительные числа . [1]
- Простота. Многие распределения вероятностей имеют экспоненциальную форму. Взятие логарифма этих распределений устраняет экспоненциальную функцию, разворачивая показатель. Например, логарифм вероятности функции плотности вероятности нормального распределения равен вместо . Логарифм вероятности упрощает выполнение некоторых математических манипуляций.
- Оптимизация. Поскольку большинство распространенных распределений вероятностей — в частности, экспоненциальное семейство — являются только логарифмически вогнутыми [2] [3], а вогнутость целевой функции играет ключевую роль в максимизации такой функции, как вероятность, оптимизаторы лучше работают с логарифмическими вероятностями.
Вопросы представительства
Функция логарифма не определена для нуля, поэтому логарифмические вероятности могут представлять только ненулевые вероятности. Поскольку логарифм числа в интервале отрицателен, часто используются отрицательные логарифмические вероятности. В этом случае логарифмические вероятности в следующих формулах будут инвертированы .
Для логарифма можно выбрать любое основание.
Базовые манипуляции
В этом разделе мы будем называть вероятности в логарифмическом пространстве и для краткости:
Произведение вероятностей соответствует сложению в логарифмическом пространстве.
Сумма вероятностей немного сложнее для вычисления в логарифмическом пространстве, требуя вычисления одной экспоненты и одного логарифма.
Однако во многих приложениях умножение вероятностей (дающее вероятность наступления всех независимых событий) используется чаще, чем их сложение (дающее вероятность наступления хотя бы одного из взаимоисключающих событий). Кроме того, в некоторых ситуациях можно избежать затрат на вычисление сложения, просто используя наивысшую вероятность в качестве приближения. Поскольку вероятности неотрицательны, это дает нижнюю границу. Это приближение используется в обратном порядке для получения непрерывного приближения функции max .
Добавление в лог-пространство
Формула выше точнее, чем , при условии использования асимметрии в формуле сложения. должно быть большим (наименее отрицательным) из двух операндов. Это также обеспечивает правильное поведение, если один из операндов — это плавающая отрицательная бесконечность , что соответствует вероятности нуля.
- Эта величина неопределена и даст результат NaN .
- Это и есть желаемый ответ.
Приведенная выше формула сама по себе будет неправильно давать неопределенный результат в случае, когда оба аргумента равны . Это следует проверять отдельно, чтобы вернуть .
По численным причинам следует использовать функцию, которая вычисляет ( log1p ) напрямую.
Смотрите также
Ссылки
- ^ ab Piech, Chris. "Вероятность для компьютерных ученых - Логарифмические вероятности" . Получено 20 июля 2023 г. .
- ^ Касс, Роберт Э.; Вос, Пол В. (1997). Геометрические основы асимптотического вывода. Нью-Йорк: John Wiley & Sons. стр. 14. ISBN 0-471-82668-5.
- ^ Пападопулос, Алекос (25 сентября 2013 г.). «Почему мы всегда ставим log() перед совместной pdf, когда используем MLE (оценку максимального правдоподобия)?». Stack Exchange .