stringtranslate.com

Все модели неправильные

Все модели неверны – распространенный афоризм и анаподотон в статистике ; его часто расширяют как «Все модели неверны, но некоторые полезны». В афоризме признается, что статистические модели всегда не отражают сложности реальности, но, тем не менее, могут быть полезны. Первоначально этот афоризм относился только к статистическим моделям, но теперь его иногда используют и к научным моделям в целом. [1]

Афоризм обычно приписывают статистику Джорджу Боксу . Однако основная концепция возникла еще до работ Бокса.

Цитаты Джорджа Бокса

Джордж Бокс

Первое упоминание Бокса о том, что «все модели неверны», содержится в статье 1976 года, опубликованной в Журнале Американской статистической ассоциации . [2] В статье 1976 года этот афоризм встречается дважды. В двух разделах статьи, содержащих афоризм, говорится:

2.3 Экономия.
Поскольку все модели неверны, ученый не может получить «правильную» модель путем чрезмерной разработки. Напротив, следуя Уильяму Оккаму, он должен стремиться к экономичному описанию природных явлений. Подобно тому, как способность разрабатывать простые, но запоминающиеся модели является отличительной чертой великого ученого, так и чрезмерная проработка и параметризация часто являются признаком посредственности.
2.4. Беспокойство выборочное.

Поскольку все модели неверны, ученый должен быть в курсе того, что именно неверно. Неуместно беспокоиться о безопасности от мышей, когда за границей есть тигры.

Бокс повторил этот афоризм в статье, опубликованной в материалах статистического семинара 1978 года. [3] В документе есть раздел под названием «Все модели неверны, но некоторые полезны». В разделе говорится (стр. 202-3):

Было бы очень замечательно, если бы любую систему, существующую в реальном мире, можно было точно представить с помощью какой-либо простой модели. Однако умело выбранные экономные модели часто действительно дают удивительно полезные приближения. Например, закон PV = nRT, связывающий давление P, объем V и температуру T «идеального» газа через константу R, не совсем верен для любого реального газа, но он часто дает полезное приближение, и, кроме того, его структура информативна, поскольку оно вытекает из физического взгляда на поведение молекул газа. Для такой модели нет необходимости задавать вопрос «Истинна ли модель?». Если «правда» должна быть «вся правдой», ответ должен быть «Нет». Единственный вопрос, который интересует: «Является ли модель наглядной и полезной?».

Бокс повторил этот афоризм еще дважды в своей книге 1987 года « Построение эмпирических моделей и поверхности отклика» (в соавторстве с Норманом Дрейпером). [4] Первое повторение — на с. 74: «Помните, что все модели неверны; практический вопрос заключается в том, насколько они должны быть неправильными, чтобы не быть полезными». Второе повторение – на стр. 424, отрывок из которого приведен ниже.

... все модели являются приблизительными. По сути, все модели неверны, но некоторые из них полезны. Однако всегда следует иметь в виду приблизительный характер модели...

Второе издание книги было опубликовано в 2007 году под названием « Поверхности отклика, смеси и анализ хребтов» . Во втором издании афоризм также повторяется дважды, в контекстах, идентичных первому изданию (на стр. 63 и стр. 414). [5]

Бокс повторил этот афоризм еще два раза в своей книге 1997 года « Статистический контроль: посредством мониторинга и корректировки обратной связи» (в соавторстве с Альберто Лусеньо). [6] Первое повторение — на стр. 6, отрывок из которого приведен ниже.

Говорят, что «все модели неверны, но некоторые модели полезны». Другими словами, любая модель — это в лучшем случае полезная выдумка: никогда не было и никогда не будет абсолютно нормального распределения или точной линейной зависимости. Тем не менее, был достигнут огромный прогресс в использовании подобных вымыслов и их приближений.

Второе повторение – на стр. 9: «Итак, поскольку все модели неверны, очень важно знать, о чем беспокоиться; или, другими словами, какие модели могут создать процедуры, которые работают на практике (где точные предположения никогда не верны)» .

Второе издание книги было опубликовано в 2009 году под названием « Статистический контроль посредством мониторинга и корректировки» (в соавторстве с Альберто Лусеньо и Марией дель Кармен Паниагуа-Киньонес). Во втором издании афоризм также повторяется дважды. [7] Первое повторение — на с. 61, отрывок из которого приведен ниже.

Все модели являются приблизительными. Предположения, подразумеваемые или явно сформулированные, никогда не бывают полностью верными. Все модели неверны, но некоторые модели полезны. Поэтому вопрос, который вам нужно задать, заключается не в том, «Правильна ли модель?» (это никогда не бывает), но «Достаточно ли хороша модель для этого конкретного приложения?»

Второе повторение – на стр. 63; его контекст по существу такой же, как и во втором повторении первого издания.

Широко цитируемая книга Бокса «Статистика для экспериментаторов » (в соавторстве с Уильямом Хантером ) не включает этот афоризм в свое первое издание (опубликованное в 1978 году). [8] Второе издание (опубликовано в 2005 году; в соавторстве с Уильямом Хантером и Дж. Стюартом Хантером) включает афоризм трижды: на стр. 208, с. 384 и с. 440. [9] На с. 440, соответствующее предложение таково: «Максимальное, чего можно ожидать от любой модели, — это то, что она может обеспечить полезное приближение к реальности: все модели неверны; некоторые модели полезны».

Помимо дословного изложения афоризма, Бокс иногда излагал суть афоризма разными словами. Один из примеров относится к 1978 году, когда Бокс был президентом Американской статистической ассоциации . На ежегодном собрании Ассоциации Бокс выступил с президентским обращением, в котором заявил следующее: «Модели, конечно, никогда не бывают верными, но, к счастью, необходимо лишь, чтобы они были полезными». [10]

Обсуждения

Об этом афоризме ведутся различные дискуссии. Некоторые из этих обсуждений представлены ниже.

В 1983 году статистики Питер МакКаллах и Джон Нелдер опубликовали свою широко цитируемую книгу об обобщенных линейных моделях . В книгу включено краткое обсуждение афоризма (правда, без ссылки на Бокса). [11] Второе издание книги, опубликованное в 1989 году, содержит очень похожее обсуждение афоризма. [12] Обсуждение первого издания следующее.

Моделирование в науке остается, по крайней мере частично, искусством. Однако существуют некоторые принципы, которыми можно руководствоваться при моделировании. Во-первых, все модели неверны ; однако некоторые из них лучше других, и мы можем искать лучшие. В то же время мы должны признать, что вечная истина не находится в пределах нашей досягаемости.

В 1995 году статистик Дэвид Кокс прокомментировал это следующим образом. [13]

... просто сказать, что все модели неверны, бесполезно. Само слово «модель» подразумевает упрощение и идеализацию. Идея о том, что сложные физические, биологические или социологические системы могут быть точно описаны несколькими формулами, является явно абсурдной. Однако построение идеализированных представлений, отражающих важные стабильные аспекты таких систем, является жизненно важной частью общенаучного анализа, и статистические модели, особенно содержательные, не кажутся существенно отличающимися от других типов моделей.

В 1996 году MRNester предложил «Кредо прикладного статистика». [14] Символ веры включает в себя в своей основной части афоризм.

В 2002 году К. П. Бёрнем и Д. Р. Андерсон опубликовали свою широко цитируемую книгу о выборе статистических моделей . В книге говорится следующее. [15]

Модель представляет собой упрощение или приближение реальности и, следовательно, не отражает всю реальность. ... Бокс отметил, что «все модели неверны, но некоторые полезны». Хотя модель никогда не может быть «истиной», ее можно ранжировать от очень полезной до полезной, от некоторой полезной до, наконец, по существу бесполезной.

Статистик Дж. Майкл Стил так прокомментировал афоризм. [16]

...есть замечательные модели — например, карты городов....

Если я говорю, что карта неправильная, это означает, что здание названо неправильно или направление улицы с односторонним движением указано неправильно. Я никогда не ожидал, что моя карта воссоздает всю физическую реальность, и я чувствую себя обманутым только в том случае, если моя карта не дает правильно ответов на вопросы, на которые она якобы отвечает.

Мои карты Филадельфии пригодятся. Более того, за исключением некоторых устаревших, они не ошибаются .

Итак, вы говорите: «Да, карту можно рассматривать как модель, но, конечно, точнее было бы сказать, что карта — это «визуально расширенная база данных». Такие базы данных могут быть правильными. Это не те модели, которые имел в виду Бокс».

Я согласен. ...

В 2008 году на это ответил статистик Эндрю Гельман , в частности, заявивший следующее. [17]

Я понимаю его общую точку зрения, заключающуюся в том, что карта улиц может быть абсолютно правильной в зависимости от разрешения карты.

... Поговорка «все модели неверны» полезна, потому что она не совсем очевидна....

Это простая мысль, и я понимаю, как Стила могут раздражать люди, подчеркивающие это. Но беда в том, что многие люди не осознают, что все модели ошибочны.

В 2013 году философ науки Питер Труран опубликовал эссе, связанное с афоризмом. [18] В очерке отмечается, в частности, следующее.

... казалось бы, несовместимые модели могут использоваться для прогнозирования одного и того же явления. ... Мы можем полагать, что для каждой модели ее предсказательная сила является показателем того, что она хотя бы приблизительно верна. Но если обе модели успешны в предсказаниях, но при этом взаимно несовместимы, как они могут быть верными? Давайте рассмотрим простую иллюстрацию. Два наблюдателя смотрят на физический объект. Один может сообщить, что видит круглый диск, а другой — прямоугольник. Оба будут правильными, но один будет смотреть на объект (цилиндрическую банку) сверху, а другой — сбоку. Две модели представляют разные аспекты одной и той же реальности.

В эссе Трурана далее отмечается, что теория гравитации Ньютона была вытеснена теорией относительности Эйнштейна , и тем не менее теория Ньютона в целом остается «эмпирически адекватной». Действительно, теория Ньютона в целом обладает превосходной предсказательной силой. Однако теория Ньютона не является приближением теории Эйнштейна. В качестве иллюстрации рассмотрим яблоко, падающее с дерева. Согласно теории Ньютона, яблоко падает, потому что Земля оказывает на яблоко силу, называемую «силой гравитации». Согласно теории Эйнштейна, Земля не оказывает никакого воздействия на яблоко. [19] Следовательно, теорию Ньютона можно рассматривать как в некотором смысле совершенно неправильную, но чрезвычайно полезную. (Полезность теории Ньютона частично объясняется тем, что она значительно проще, как математически, так и вычислительно, чем теория Эйнштейна.)

В 2014 году статистик Дэвид Хэнд сделал следующее заявление. [20]

В общем, при построении статистических моделей нельзя забывать, что цель — понять что-то о реальном мире. Или предсказать, выбрать действие, принять решение, обобщить данные и т. д., но всегда о реальном мире, а не об абстрактном математическом мире: наши модели не являются реальностью – это хорошо высказал Джордж Бокс в своей часто цитируемой работе. заметить, что «все модели неверны, но некоторые полезны».

В 2016 году П. Дж. Бикель и К. А. Доксум опубликовали второй том своей книги по математической статистике . В том включена цитата из президентского послания Бокса, приведенная выше. В нем говорится, что эта цитата является лучшей формулировкой «руководящего принципа современной статистики». [21]

Исторические предшественники

Хотя этот афоризм, похоже, принадлежит Джорджу Боксу, его основная концепция уходит корнями в десятилетия, а возможно и столетия. Некоторые примеры этого приведены ниже.

В 1960 году Георг Раш сказал следующее.

... никакие модели не являются [истинными] — даже законы Ньютона. Когда вы строите модель, вы упускаете из виду все детали, которые вы, обладая имеющимися в вашем распоряжении знаниями, считаете несущественным... Модели не должны быть правдивыми, но важно, чтобы они были применимы и применимы ли они для каких-либо данных. Цель, конечно, должна быть исследована. Это также означает, что модель никогда не принимается окончательно, а только на испытаниях.

-  Раш, Г. (1960), Вероятностные модели для некоторых тестов интеллекта и достижений , Копенгаген: Датский педагогический институт, стр. 37–38.; переиздано в 1980 году издательством Чикагского университета.

В 1947 году математик Джон фон Нейман сказал, что «истина… слишком сложна, чтобы допускать что-либо, кроме приближений». [22]

В 1942 году французский философ-поэт Поль Валери сказал следующее. [23]

В 1939 году основатель статистического управления процессами Уолтер Шухарт сказал следующее. [25]

... ни одна модель не может быть теоретически достижима, которая бы полностью и однозначно характеризовала бесконечно расширяемую концепцию состояния статистического контроля. Что, возможно, еще более важно, на основе конечной части последовательности [ X 1 , X 2 , X 3 , ...] — а мы никогда не можем иметь больше, чем конечную часть — мы не можем разумно надеяться построить модель, которая будет представлять в точности любую конкретную характеристику конкретного состояния контроля, даже если такое состояние действительно существует. Здесь ситуация очень похожа на ту, что наблюдается в физической науке, где мы находим модель молекулы; любая модель всегда представляет собой неполную, хотя и полезную картину предполагаемой физической вещи, называемой молекулой.

—  Шухарт, Вашингтон (1939), Статистический метод с точки зрения контроля качества , Министерство сельского хозяйства США , стр. 19

В 1923 году схожую идею озвучил художник Пабло Пикассо .

Мы все знаем, что искусство — это не истина. Искусство — это ложь, которая заставляет нас осознать истину, по крайней мере, ту истину, которую нам дано понять. Художник должен знать, как убедить других в правдивости своей лжи.

-  Пикассо, Пабло (1923), «Пикассо говорит», The Arts , 3 : 315–326.; [26] перепечатано в Barr, Alfred H. Jr. (1939), Пикассо: сорок лет его искусства (PDF) , Музей современного искусства , стр. 9–12.

Смотрите также

Примечания

  1. ^ Скоген, доктор медицины; Джи, Р.; Акимова А.; Дэуэл, У.; и одиннадцать других (2021 г.): «Раскрытие правды: модели лучше наблюдений?» (PDF) , Серия достижений в области морской экологии , 680 : 7–13, Bibcode : 2021MEPS..680....7S, doi : 10.3354/meps13574, S2CID  229617529.
  2. ^ Бокс, Джордж Э.П. (1976), «Наука и статистика» (PDF) , Журнал Американской статистической ассоциации , 71 (356): 791–799, doi : 10.1080/01621459.1976.10480949.
  3. ^ Бокс, GEP (1979), «Надежность стратегии построения научных моделей», в Launer, RL; Уилкинсон, Дж.Н. (ред.), Устойчивость в статистике, Academic Press , стр. 201–236, doi : 10.1016/B978-0-12-438150-6.50018-2, ISBN 978-1-4832-6336-6
  4. ^ Коробка, GEP; Дрейпер, Н.Р. (1987), Построение эмпирических моделей и поверхности отклика , John Wiley & Sons.
  5. ^ Коробка, GEP; Дрейпер, Н.Р. (2007), Поверхности отклика, смеси и анализ гребней , John Wiley & Sons.
  6. ^ Коробка, GEP; Лусеньо, А. (1997), Статистический контроль: путем мониторинга и корректировки обратной связи , John Wiley & Sons.
  7. ^ Коробка, GEP; Лусеньо, А.; Паниагуа-Киньонес, М. дель Кармен (2009), Статистический контроль путем мониторинга и корректировки , John Wiley & Sons.
  8. ^ Коробка, GEP; Хантер, WG (1978), Статистика для экспериментаторов , John Wiley & Sons..
  9. ^ Коробка, GEP; Хантер, Дж. С.; Хантер, WG (2005), Статистика для экспериментаторов (2-е изд.), John Wiley & Sons.
  10. ^ Box, GEP (1979), «Некоторые проблемы статистики и повседневной жизни», Журнал Американской статистической ассоциации , 74 (365): 1–4, doi : 10.2307/2286713, JSTOR  2286713.
  11. ^ МакКаллах, П.; Нелдер, Дж. А. (1983), Обобщенные линейные модели , Чепмен и Холл , §1.1.4.
  12. ^ МакКаллах, П.; Нелдер, Дж. А. (1989), Обобщенные линейные модели (второе изд.), Чепмен и Холл , §1.1.4.
  13. ^ Кокс, Д.Р. (1995), «Комментарий к статье «Неопределенность модели, интеллектуальный анализ данных и статистический вывод»", Журнал Королевского статистического общества, серия A , 158 : 455–456..
  14. ^ Нестер, MR (1996), «Кредо прикладного статистика» (PDF) , Журнал Королевского статистического общества, серия C , 45 (4): 401–410, doi : 10.2307/2986064, JSTOR  2986064.
  15. ^ Бернхэм, КП; Андерсон, Д.Р. (2002), Выбор модели и многомодельный вывод: практический информационный подход (2-е изд.), Springer-Verlag , §1.2.5. [По состоянию на февраль 2022 года объединенные издания этой книги цитировались в Google Scholar более 60 000 раз .]
  16. ^ Стил, Дж. М., «Модели: шедевры и неубедительные оправдания».
  17. ^ Гельман А. (12 июня 2008 г.), «Некоторые мысли по поводу поговорки: «Все модели неверны, но некоторые полезны»».
  18. ^ Труран, П. (2013), «Модели: полезны, но неверны», « Практическое применение философии науки » , SpringerBriefs in Philosophy, Springer , стр. 61–67, doi : 10.1007/978-3-319-00452- 5_10, ISBN 978-3-319-00451-8.
  19. ^ Согласно теории относительности Эйнштейна , основная причина падения яблока заключается в том, что Земля искажает время, так что часы у основания дерева идут медленнее, чем часы высоко на дереве; есть еще и вторичная причина: Земля искажает пространство. Эмпирические доказательства теории Эйнштейна чрезвычайно сильны — например, GPS опирается на теорию Эйнштейна, и она не работала бы, если бы опиралась на теорию Ньютона (Ashby 2002).
  20. ^ Хэнд, DJ (2014), «Замечательные примеры, но давайте не закрывать глаза», Statistical Science , 29 : 98–100, arXiv : 1405.4986 , doi : 10.1214/13-STS446.
  21. ^ Бикель, П.Дж.; Доксум, К.А. (2016), Математическая статистика , том. II, Чепмен и Холл , с. 2.
  22. ^ фон Нейман, Дж. (1947), «Математик», в Хейвуде, РБ (ред.), Works of the Mind , University of Chicago Press , стр. 180–196.; переиздано в 1995 году Броди Ф., Вамосом Т. (редакторы), The Neumann Compendium, World Scientific , стр. 618–626.
  23. ^ Связь цитаты Валери с афоризмом «все модели неверны» отмечалась различными авторами, например Ванкатом (2013, §1.7).
  24. ^ Некоторые авторы дали разные английские переводы, например Валери (1970, стр. 466), Вольфсон и Мерфи (1998) и Ванкат (2013, §1.7). Представленный здесь перевод был предоставлен Google Translate ; в нем есть только одно слово, отличное от перевода Вольфсона и Мерфи: «Что» вместо «Что угодно» (оба случая).
  25. ^ Связь цитаты Шухарта с афоризмом «все модели неверны» отмечена Фрикером и Вудаллом (2016).
  26. ^ Цитата первоначально была дана на испанском языке (во время интервью Мариуса де Зайаса ); цитируемая публикация на английском языке.

Рекомендации

дальнейшее чтение

Внешние ссылки