Распределение вероятностей, моделирующее подбрасывание монеты, которое не обязательно должно быть честным
В теории вероятностей и статистике распределение Бернулли , названное в честь швейцарского математика Якоба Бернулли , [1] представляет собой дискретное распределение вероятностей случайной величины , которая принимает значение 1 с вероятностью и значение 0 с вероятностью . Менее формально его можно рассматривать как модель для множества возможных результатов любого отдельного эксперимента , в котором задается вопрос типа «да-нет» . Такие вопросы приводят к результатам , которые являются булевыми : один бит , значение которого равно успеху/ да / истине / единице с вероятностью p и неудаче/нет/ ложи / нулю с вероятностью q . Его можно использовать для представления (возможно, предвзятого) подбрасывания монеты , где 1 и 0 будут представлять «орла» и «решку» соответственно, а p будет вероятностью выпадения монеты на орел (или наоборот, где 1 будет представлять решку, а p будет вероятностью решки). В частности, нечестные монеты будут иметь
Распределение Бернулли является частным случаем биномиального распределения , где проводится одно испытание (поэтому n будет равно 1 для такого биномиального распределения). Это также частный случай двухточечного распределения , для которого возможные результаты не обязательно должны быть 0 и 1. [2]
Характеристики
Если — случайная величина с распределением Бернулли, то:
Функция массы вероятности этого распределения по возможным результатам k равна
Эксцесс стремится к бесконечности для высоких и низких значений, но для двухточечных распределений, включая распределение Бернулли, избыточный эксцесс ниже , а именно −2, чем для любого другого распределения вероятностей.
Используя этот результат, легко доказать, что для любого распределения Бернулли его дисперсия будет иметь значение внутри .
Асимметрия
Асимметрия равна . Когда мы берем стандартизированную случайную величину, распределенную по закону Бернулли, мы обнаруживаем, что эта случайная величина достигает с вероятностью и достигает с вероятностью . Таким образом , мы получаем
Высшие моменты и кумулянты
Все исходные моменты равны из-за того, что и .
Центральный момент порядка определяется выражением
Первые шесть центральных моментов:
Высшие центральные моменты можно выразить более компактно через и
Первые шесть кумулянтов:
Энтропия и информация Фишера
Энтропия
Энтропия — это мера неопределенности или случайности в распределении вероятностей. Для случайной величины Бернулли с вероятностью успеха и вероятностью неудачи энтропия определяется как:
Энтропия максимальна, когда , что указывает на самый высокий уровень неопределенности, когда оба результата одинаково вероятны. Энтропия равна нулю, когда или , где один результат определен.
Информация Фишера
Информация Фишера измеряет количество информации, которую несет наблюдаемая случайная величина о неизвестном параметре , от которого зависит вероятность . Для распределения Бернулли информация Фишера относительно параметра определяется как:
Доказательство:
Функция правдоподобия для случайной величины Бернулли имеет вид:
Это представляет собой вероятность наблюдения заданного параметра .
Логарифмическая функция правдоподобия имеет вид:
Функция оценки (первая производная логарифмического правдоподобия по отношению к нулю) равна:
Вторая производная логарифмической функции правдоподобия равна:
Информация Фишера рассчитывается как отрицательное ожидаемое значение второй производной логарифма правдоподобия:
Он максимален, когда , отражая максимальную неопределенность и, следовательно, максимальную информацию о параметре .