stringtranslate.com

Минимальная длина сообщения

Минимальная длина сообщения ( MML ) — это байесовский метод теории информации для сравнения и выбора статистических моделей. [1] Он обеспечивает формальную переформулировку теории информации бритвы Оккама : даже когда модели равны по своей мере соответствия наблюдаемым данным, та, которая генерирует наиболее краткое объяснение данных, с большей вероятностью будет правильной (где объяснение состоит из утверждения модели, за которым следует кодирование данных без потерь с использованием указанной модели). MML был изобретен Крисом Уоллесом , впервые появившись в основополагающей статье «Информационная мера для классификации». [2] MML задуман не просто как теоретическая конструкция, но и как метод, который может быть развернут на практике. [3] Он отличается от связанной концепции сложности Колмогорова тем, что не требует использования полного по Тьюрингу языка для моделирования данных. [4]

Определение

В работе Шеннона « Математическая теория связи» (1948) утверждается, что в оптимальном коде длина сообщения (в двоичном виде) события , , где имеет вероятность , определяется выражением .

Теорема Байеса утверждает, что вероятность (переменной) гипотезы при фиксированных доказательствах пропорциональна , что, по определению условной вероятности , равно . Мы хотим модель (гипотезу) с самой высокой такой апостериорной вероятностью . Предположим, мы кодируем сообщение, которое представляет (описывает) как модель, так и данные совместно. Поскольку , наиболее вероятная модель будет иметь самое короткое такое сообщение. Сообщение разбивается на две части: . Первая часть кодирует саму модель. Вторая часть содержит информацию (например, значения параметров или начальных условий и т. д.), которая при обработке моделью выводит наблюдаемые данные.

MML естественно и точно жертвует сложностью модели ради качества соответствия. Более сложная модель требует больше времени для утверждения (более длинная первая часть), но, вероятно, лучше соответствует данным (более короткая вторая часть). Таким образом, метрика MML не выберет сложную модель, если только эта модель не окупится.

Непрерывно-значные параметры

Одной из причин, по которой модель может быть длиннее, может быть просто то, что ее различные параметры указаны с большей точностью, что требует передачи большего количества цифр. Большая часть мощности MML проистекает из его обработки того, насколько точно указывать параметры в модели, и множества приближений, которые делают это осуществимым на практике. Это позволяет с пользой сравнивать, скажем, модель со многими неточно указанными параметрами с моделью с меньшим количеством параметров, указанных более точно.

Ключевые особенности MML

Смотрите также

Ссылки

  1. ^ Уоллес, К. С. (Кристофер С.), -2004. (2005). Статистический и индуктивный вывод по минимальной длине сообщения . Нью-Йорк: Springer. ISBN 9780387237954. OCLC  62889003.{{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка ) CS1 maint: числовые имена: список авторов ( ссылка )
  2. ^ Уоллес, CS; Бултон, DM (1968-08-01). «Информационная мера для классификации». The Computer Journal . 11 (2): 185–194. doi : 10.1093/comjnl/11.2.185 . ISSN  0010-4620.
  3. ^ Эллисон, Ллойд. (2019). Кодирование бритвы Оккама . Springer. ISBN 978-3030094881. OCLC  1083131091.
  4. ^ ab Wallace, CS; Dowe, DL (1999-01-01). «Минимальная длина сообщения и сложность Колмогорова». The Computer Journal . 42 (4): 270–283. doi :10.1093/comjnl/42.4.270. ISSN  0010-4620.

Внешние ссылки

Оригинальная публикация:

Книги:

Ссылки по теме: