Оптимальность дизайна зависит от статистической модели и оценивается по статистическому критерию, который связан с матрицей дисперсии оценщика. Определение подходящей модели и указание подходящей критериальной функции требуют понимания статистической теории и практических знаний по планированию экспериментов .
Оптимальные конструкции могут учитывать различные типы факторов, такие как факторы процесса, смеси и дискретные факторы.
Проектирование можно оптимизировать, когда пространство проектирования ограничено, например, когда математическое пространство процесса содержит параметры, которые практически неосуществимы (например, из-за проблем безопасности).
Минимизация дисперсии оценок
Экспериментальные проекты оцениваются с использованием статистических критериев. [6]
Однако, когда статистическая модель имеет несколько параметров , среднее значение оценщика параметров является вектором , а его дисперсия — матрицей . Обратная матрица дисперсионной матрицы называется «информационной матрицей». Поскольку дисперсия оценщика вектора параметров является матрицей, проблема «минимизации дисперсии» усложняется. Используя статистическую теорию , статистики сжимают информационную матрицу, используя вещественнозначные сводные статистики ; будучи вещественнозначными функциями, эти «информационные критерии» могут быть максимизированы. [8] Традиционные критерии оптимальности являются инвариантами информационной матрицы; алгебраически традиционные критерии оптимальности являются функционалами собственных значений информационной матрицы.
A -оптимальность (« среднее » или след )
Одним из критериев является A-оптимальность , которая стремится минимизировать след обратной матрицы информации. Этот критерий приводит к минимизации средней дисперсии оценок коэффициентов регрессии.
C -оптимальность
Этот критерий минимизирует дисперсию наилучшей линейной несмещенной оценки предопределенной линейной комбинации параметров модели.
D -оптимальность ( детерминанта )
Популярным критерием является D-оптимальность , которая стремится минимизировать |(X'X) −1 |, или, что эквивалентно, максимизировать определитель информационной матрицы X'X плана. Этот критерий приводит к максимизации дифференциального информационного содержания Шеннона оценок параметров.
E -оптимальность ( собственное значение )
Другой дизайн — E-оптимальность , которая максимизирует минимальное собственное значение информационной матрицы.
S -оптимальность [9]
Этот критерий максимизирует величину, измеряющую взаимную ортогональность столбцов X и определителя информационной матрицы.
T -оптимальность
Этот критерий максимизирует расхождение между двумя предложенными моделями в проектных местах. [10]
Другие критерии оптимальности связаны с дисперсией прогнозов :
G -оптимальность
Популярным критерием является G-оптимальность , которая стремится минимизировать максимальный элемент в диагонали матрицы X (X'X) −1 X'. Это имеет эффект минимизации максимальной дисперсии прогнозируемых значений.
I -оптимальность ( интегральная )
Вторым критерием дисперсии прогноза является I-оптимальность , которая стремится минимизировать среднюю дисперсию прогноза в пространстве проектирования .
V -оптимальность ( дисперсия )
Третьим критерием дисперсии прогноза является V-оптимальность , которая стремится минимизировать среднюю дисперсию прогноза по набору из m конкретных точек. [11]
Каталоги оптимальных конструкций можно найти в книгах и библиотеках программного обеспечения.
Кроме того, основные статистические системы, такие как SAS и R, имеют процедуры для оптимизации дизайна в соответствии со спецификацией пользователя. Экспериментатор должен указать модель для дизайна и критерий оптимальности, прежде чем метод сможет вычислить оптимальный дизайн. [13]
Практические соображения
Некоторые сложные темы оптимального проектирования требуют больше статистической теории и практических знаний по планированию экспериментов.
Зависимость и надежность модели
Поскольку критерий оптимальности большинства оптимальных конструкций основан на некоторой функции информационной матрицы, «оптимальность» данной конструкции зависит от модели : в то время как оптимальная конструкция является лучшей для этой модели , ее производительность может ухудшиться на других моделях . На других моделях оптимальная конструкция может быть как лучше, так и хуже неоптимальной конструкции. [14] Поэтому важно сравнивать производительность конструкций с альтернативными моделями . [15]
Выбор критерия оптимальности и надежности
Выбор подходящего критерия оптимальности требует некоторого размышления, и полезно сравнить производительность проектов с несколькими критериями оптимальности. Корнелл пишет, что
поскольку критерии [традиционной оптимальности]... являются критериями минимизации дисперсии,... план, который является оптимальным для данной модели с использованием одного из... критериев, обычно является близким к оптимальному для той же модели по отношению к другим критериям.
— [16]
Действительно, существует несколько классов конструкций, для которых все традиционные критерии оптимальности согласуются, согласно теории «универсальной оптимальности» Кифера . [17] Опыт практиков, таких как Корнелл, и теория «универсальной оптимальности» Кифера предполагают, что устойчивость по отношению к изменениям в критерии оптимальности намного выше, чем устойчивость по отношению к изменениям в модели .
Гибкие критерии оптимальности и выпуклый анализ
Высококачественное статистическое программное обеспечение обеспечивает комбинацию библиотек оптимальных конструкций или итерационных методов для построения приблизительно оптимальных конструкций в зависимости от указанной модели и критерия оптимальности. Пользователи могут использовать стандартный критерий оптимальности или могут запрограммировать индивидуальный критерий.
Все традиционные критерии оптимальности являются выпуклыми (или вогнутыми) функциями , и поэтому оптимальные конструкции поддаются математической теории выпуклого анализа , и их вычисление может использовать специализированные методы выпуклой минимизации . [18] Практикующему не нужно выбирать только один традиционный критерий оптимальности, но он может указать свой критерий. В частности, практик может указать выпуклый критерий, используя максимумы выпуклых критериев оптимальности и неотрицательные комбинации критериев оптимальности (поскольку эти операции сохраняют выпуклые функции ). Для выпуклых критериев оптимальности теорема эквивалентности Кифера - Вольфовица позволяет практикующему проверить, что данная конструкция является глобально оптимальной. [19] Теорема эквивалентности Кифера - Вольфовица связана с сопряженностью Лежандра - Фенхеля для выпуклых функций . [20]
Если критерий оптимальности не обладает выпуклостью , то нахождение глобального оптимума и проверка его оптимальности часто оказываются затруднительными.
Неопределенность модели и байесовский подход
Выбор модели
Когда ученые хотят проверить несколько теорий, статистик может разработать эксперимент, который позволяет проводить оптимальные тесты между указанными моделями. Такие «дискриминационные эксперименты» особенно важны в биостатистике, поддерживающей фармакокинетику и фармакодинамику , следуя работам Кокса и Аткинсона. [21]
Однако использование байесовского плана не заставляет статистиков использовать байесовские методы для анализа данных. Действительно, ярлык «байесовский» для экспериментальных планов, основанных на вероятности, не нравится некоторым исследователям. [23] Альтернативная терминология для «байесовского» оптимального подхода включает «в среднем» оптимальность или «популяционную» оптимальность.
Итеративное экспериментирование
Научное экспериментирование — это итеративный процесс, и статистики разработали несколько подходов к оптимальному планированию последовательных экспериментов.
Оптимальные конструкции для моделей поверхности отклика обсуждаются в учебнике Аткинсона, Донева и Тобиаса, а также в обзоре Гаффке и Хайлигерса и в математическом тексте Пукельсхайма. Блокировка оптимальных конструкций обсуждается в учебнике Аткинсона, Донева и Тобиаса, а также в монографии Гуса.
Самые ранние оптимальные конструкции были разработаны для оценки параметров регрессионных моделей с непрерывными переменными, например, Дж. Д. Жергоном в 1815 году (Стиглер). На английском языке два ранних вклада были сделаны Чарльзом С. Пирсом и Кирстиной Смит.
Новаторские проекты для многомерных поверхностей отклика были предложены Джорджем Э. П. Боксом . Однако проекты Бокса имеют мало оптимальных свойств. Действительно, проект Бокса–Бенкена требует чрезмерных экспериментальных запусков, когда число переменных превышает три. [28] «Центрально-композитные» проекты
Бокса требуют большего количества экспериментальных запусков, чем оптимальные проекты Коно. [29]
Системная идентификация и стохастическая аппроксимация
Использование компьютера для поиска хорошего дизайна
Существует несколько методов поиска оптимального дизайна, учитывая априорное ограничение на количество экспериментальных запусков или репликаций. Некоторые из этих методов обсуждаются Аткинсоном, Доневым и Тобиасом, а также в статье Хардина и Слоана . Конечно, фиксация количества экспериментальных запусков априори была бы непрактичной. Благоразумные статистики изучают другие оптимальные дизайны, количество экспериментальных запусков которых отличается.
Дискретизация вероятностно-мерных конструкций
В математической теории оптимальных экспериментов оптимальным планом может быть вероятностная мера , которая поддерживается на бесконечном наборе мест наблюдения. Такие оптимальные планы вероятностной меры решают математическую задачу, которая не учитывает стоимость наблюдений и экспериментальных запусков. Тем не менее, такие оптимальные планы вероятностной меры могут быть дискретизированы для получения приблизительно оптимальных планов. [32]
В некоторых случаях конечного набора точек наблюдения достаточно для поддержки оптимального дизайна. Такой результат был доказан Коно и Кифером в их работах по дизайнам поверхностей отклика для квадратичных моделей. Анализ Коно–Кифера объясняет, почему оптимальные дизайны для поверхностей отклика могут иметь дискретные опоры, которые очень похожи, как и менее эффективные дизайны, которые были традиционными в методологии поверхностей отклика . [33]
Чарльз С. Пирс предложил экономическую теорию научного эксперимента в 1876 году, которая стремилась максимизировать точность оценок. Оптимальное распределение Пирса немедленно улучшило точность гравитационных экспериментов и использовалось в течение десятилетий Пирсом и его коллегами. В своей опубликованной в 1882 году лекции в Университете Джонса Хопкинса Пирс представил экспериментальное проектирование следующими словами:
Логика не возьмется сообщить вам, какие эксперименты вам следует провести, чтобы наилучшим образом определить ускорение свободного падения или значение Ома; но она подскажет вам, как приступить к составлению плана эксперимента.
[...] К сожалению, практика обычно предшествует теории, и обычная судьба человечества — сначала делать что-то каким-то ошеломляющим образом, а затем выяснять, как это можно было бы сделать гораздо легче и совершеннее. [34]
Кирстина Смит предложила оптимальные конструкции для полиномиальных моделей в 1918 году. (Кирстина Смит была ученицей датского статистика Торвальда Н. Тиле и работала с Карлом Пирсоном в Лондоне.)
^ Прилагательное «optimum» (а не «optimal») «является немного более старой формой в английском языке и избегает конструкции «optim(um) + al» — в латыни нет слова «optimalis»» (страница x в книге «Optimum Experimental Designs, with SAS» Аткинсона, Донева и Тобиаса).
^ Гутторп, П.; Линдгрен, Г. (2009). «Карл Пирсон и скандинавская школа статистики». International Statistical Review . 77 : 64. CiteSeerX 10.1.1.368.8328 . doi :10.1111/j.1751-5823.2009.00069.x. S2CID 121294724.
^ Смит, Кирстин (1918). «О стандартных отклонениях скорректированных и интерполированных значений наблюдаемой полиномиальной функции и ее константах и о руководстве, которое они дают для правильного выбора распределения наблюдений». Biometrika . 12 (1/2): 1–85. doi :10.2307/2331929. JSTOR 2331929.
^ Эти три преимущества (оптимальных конструкций) описаны в учебнике Аткинсона, Донева и Тобиаса.
^ Традиционно статистики оценивали оценщики и планы, рассматривая некоторую сводную статистику матрицы ковариации (среднего - несмещенного оценщика ), обычно с положительными действительными значениями (например, определитель или след матрицы ). Работа с положительными действительными числами дает несколько преимуществ: если оценщик одного параметра имеет положительную дисперсию, то дисперсия и информация Фишера являются положительными действительными числами; следовательно, они являются членами выпуклого конуса неотрицательных действительных чисел (чьи ненулевые члены имеют обратные величины в этом же конусе). Для нескольких параметров матрицы ковариации и информационные матрицы являются элементами выпуклого конуса неотрицательно определенных симметричных матриц в частично упорядоченном векторном пространстве под порядком Левнера (Löwner). Этот конус замкнут относительно сложения матриц-матриц, относительно обращения матриц и относительно умножения положительных действительных чисел и матриц. Изложение теории матриц и порядка Лёвнера приводится в работе Пукельсхайма.
^ Shin, Yeonjong; Xiu, Dongbin (2016). «Неадаптивный квазиоптимальный выбор точек для линейной регрессии наименьших квадратов». Журнал SIAM по научным вычислениям . 38 (1): A385–A411. Bibcode : 2016SJSC...38A.385S. doi : 10.1137/15M1015868.
^ Аткинсон, AC; Федоров, VV (1975). «Планирование экспериментов для различения двух конкурирующих моделей». Biometrika . 62 (1): 57–70. doi :10.1093/biomet/62.1.57. ISSN 0006-3444.
^ Вышеуказанные критерии оптимальности являются выпуклыми функциями на областях симметричных положительно-полуопределенных матриц : см. онлайн-учебник для практиков, который содержит множество иллюстраций и статистических приложений:
Бойд, Стивен П.; Ванденберг, Ливен (2004). Выпуклая оптимизация (PDF) . Cambridge University Press. ISBN 978-0-521-83378-3. Получено 15 октября 2011 г. . (книга в формате PDF)
Бойд и Ванденберг обсуждают оптимальные экспериментальные планы на страницах 384–396.
^ Итерационные методы и алгоритмы приближения рассматриваются в учебнике Аткинсона, Донева и Тобиаса, в монографиях Федорова (историческая часть) и Пукельсхайма, а также в обзорной статье Гаффке и Хайлигерса.
^ См. Кифер («Оптимальные конструкции для подгонки смещенных многоотвечающих поверхностей», страницы 289–299).
^ Такой бенчмаркинг обсуждается в учебнике Аткинсона и др. и в статьях Кифера. Модели - надежные конструкции (включая "байесовские" конструкции) рассматриваются Чангом и Нотцем.
^ Корнелл, Джон (2002). Эксперименты со смесями: проекты, модели и анализ данных по смесям (третье изд.). Wiley. ISBN978-0-471-07916-3.(Страницы 400-401)
^ Введение в «универсальную оптимальность» появляется в учебнике Аткинсона, Донева и Тобиаса. Более подробные изложения встречаются в продвинутом учебнике Пукельсхайма и статьях Кифера.
^ Вычислительные методы обсуждаются Пукельсхаймом, Гаффке и Хайлигерсом.
^ Теорема эквивалентности Кифера - Вулфовица обсуждается в главе 9 книги Аткинсона, Донева и Тобиаса .
Выпуклая оптимизация. Издательство Кембриджского университета. 2004. (книга в формате PDF)
Бойд и Ванденберг обсуждают оптимальные экспериментальные планы на страницах 384–396.
↑ См. главу 20 в работе Аткинсона, Донева и Тобиаса.
^ Байесовские планы обсуждаются в главе 18 учебника Аткинсона, Донева и Тобиаса. Более продвинутые обсуждения встречаются в монографии Федорова и Хакла, а также в статьях Чалонера и Вердинелли и Даса Гупты. Байесовские планы и другие аспекты «модельно-устойчивых» планов обсуждаются Чангом и Нотцем.
^ В качестве альтернативы « байесовской оптимальности» Федоров и Хаккл отстаивают «оптимальность в среднем ».
↑ Уолд, Абрахам (июнь 1945 г.). «Последовательные проверки статистических гипотез». Анналы математической статистики . 16 (2): 117–186. doi : 10.1214/aoms/1177731118 . JSTOR 2235829.
^ Чернофф, Х. (1972) Последовательный анализ и оптимальное проектирование, монография SIAM.
^ Zacks, S. (1996) «Адаптивные проекты для параметрических моделей». В: Ghosh, S. и Rao, CR, (редакторы) (1996). Планирование и анализ экспериментов, Справочник по статистике, том 13. Северная Голландия. ISBN 0-444-82061-2 . (страницы 151–180)
^
Генри П. Уинн писал: «Современная теория оптимального проектирования берет свое начало в школе теории принятия решений в статистике США, основанной Абрахамом Уолдом » в своем введении «Вклад Джека Кифера в экспериментальное проектирование», страницы xvii–xxiv которого находятся в следующем томе:
Кифер признает влияние Уолда и его результаты на многих страницах – 273 (стр. 55 в переизданном томе), 280 (62), 289-291 (71-73), 294 (76), 297 (79), 315 (97) 319 (101) – в этой статье:
Кифер, Дж. (1959). «Оптимальные экспериментальные планы». Журнал Королевского статистического общества, Серия B. 21 : 272–319.
^ Дискретизация оптимальных вероятностных мер для получения приблизительно оптимальных конструкций обсуждается Аткинсоном, Доневым и Тобиасом, а также Пукельсхаймом (особенно в главе 12) .
^ Что касается конструкций для квадратичных поверхностей отклика , результаты Коно и Кифера обсуждаются в Аткинсоне, Доневе и Тобиасе. Математически такие результаты связаны с полиномами Чебышева , «системами Маркова» и «пространствами моментов»: см.
↑ Peirce, CS (1882), «Вводная лекция по изучению логики», прочитанная в сентябре 1882 г., опубликовано в Johns Hopkins University Circulars , т. 2, прим. 19, стр. 11–12, ноябрь 1882 г., см. стр. 11, Google Books Eprint. Перепечатано в Collected Papers v. 7, параграфы 59–76, см. 59, 63, Writings of Charles S. Peirce v. 4, стр. 378–82, см. 378, 379 и The Essential Peirce v. 1, стр. 210–14, см. 210–1, также ниже на 211.
Чернофф, Герман (1972). Последовательный анализ и оптимальное проектирование . Общество промышленной и прикладной математики. ISBN 978-0-89871-006-9.
Федоров, В. В. (1972). Теория оптимальных экспериментов . Academic Press.
Федоров, Валерий В.; Хакл, Питер (1997). Модельно-ориентированное планирование экспериментов . Конспект лекций по статистике. Том 125. Springer-Verlag.
Goos, Peter (2002). Оптимальный дизайн экспериментов с блоками и раздельными участками. Конспект лекций по статистике. Том 164. Springer.
Кифер, Джек Карл (1985). Браун ; Олкин, Ингрэм ; Сакс, Джером; и др. (ред.). Джек Карл Кифер: Сборник статей III—Планирование экспериментов . Springer-Verlag и Институт математической статистики. стр. 718+xxv. ISBN 978-0-387-96004-3.
Логотетис, Н.; Уайнн, Х. П. (1989). Качество через дизайн: экспериментальный дизайн, офлайновый контроль качества и вклад Тагучи . Oxford U. P. стр. 464+xi. ISBN 978-0-19-851993-5.
Нордстрём, Кеннет (май 1999 г.). «Жизнь и работа Густава Эльфвинга». Статистическая наука . 14 (2): 174–196. doi : 10.1214/ss/1009212244 . JSTOR 2676737. MR 1722074.
Pukelsheim, Friedrich (2006). Оптимальный дизайн экспериментов. Classics in Applied Mathematics. Vol. 50 (переиздание со списком опечаток и новым предисловием Wiley (0-471-61971-X) 1993 ed.). Society for Industrial and Applied Mathematics . pp. 454+xxxii. ISBN 978-0-89871-604-7.
Шах, Кирти Р. и Синха, Бикас К. (1989). Теория оптимальных конструкций . Конспект лекций по статистике. Том 54. Springer-Verlag. С. 171+viii. ISBN 978-0-387-96991-6.
Дальнейшее чтение
Учебники для практиков и студентов
Учебники, в которых особое внимание уделяется регрессии и методологии поверхности отклика
Учебник Аткинсона, Донева и Тобиаса использовался как на краткосрочных курсах для специалистов-практиков, так и в университетских курсах.
Аткинсон, AC; Донев, AN; Тобиас, RD (2007). Оптимальные экспериментальные проекты с SAS. Oxford University Press. стр. 511+xvi. ISBN 978-0-19-929660-6.
Логотетис, Н.; Уайнн, Х. П. (1989). Качество через дизайн: экспериментальный дизайн, офлайновый контроль качества и вклад Тагучи . Oxford UP стр. 464+xi. ISBN 978-0-19-851993-5.
Учебники, в которых особое внимание уделяется блочным конструкциям
Оптимальные блочные конструкции обсуждаются Бейли и Бапатом. Первая глава книги Бапата рассматривает линейную алгебру, используемую Бейли (или продвинутые книги ниже). Упражнения Бейли и обсуждение рандомизации подчеркивают статистические концепции (а не алгебраические вычисления).
Бейли, РА (2008). Планирование сравнительных экспериментов. Cambridge UP ISBN 978-0-521-68357-9.Черновик доступен в сети. (Особенно Глава 11.8 «Оптимальность»).
Бапат, РБ (2000). Линейная алгебра и линейные модели (второе издание). Springer. ISBN 978-0-387-98871-9.(Глава 5 «Блочные конструкции и оптимальность», страницы 99–111)
Оптимальные конструкции блоков обсуждаются в расширенной монографии Шаха и Синхи, а также в обзорных статьях Ченга и Маджумдара.
Книги для профессиональных статистиков и исследователей
Гош, С.; Рао, К. Р. , ред. (1996). Планирование и анализ экспериментов . Справочник по статистике. Том 13. Северная Голландия. ISBN 978-0-444-82061-7.
« Модельные надежные конструкции». Планирование и анализ экспериментов . Справочник по статистике. С. 1055–1099.
Ченг, К.-С. «Оптимальный дизайн: точная теория». Дизайн и анализ экспериментов . Справочник по статистике. С. 977–1006.
ДасГупта, А. «Обзор оптимальных байесовских планов ». Планирование и анализ экспериментов . Справочник по статистике. С. 1099–1148.
Гаффке, Н. и Хайлигерс, Б. «Приближенные планы для полиномиальной регрессии : инвариантность , допустимость и оптимальность». Планирование и анализ экспериментов . Справочник по статистике. С. 1149–1199.
Маджумдар, Д. «Оптимальные и эффективные схемы лечения и контроля». Планирование и анализ экспериментов . Справочник по статистике. С. 1007–1054.
Штуфкен, Дж. «Оптимальные планы кроссовера ». Планирование и анализ экспериментов . Справочник по статистике. С. 63–90.
Закс, С. «Адаптивные конструкции для параметрических моделей». Планирование и анализ экспериментов . Справочник по статистике. С. 151–180.
Коно, Казумаса (1962). «Оптимальные планы для квадратичной регрессии на k-кубе» (PDF) . Мемуары факультета естественных наук. Университет Кюсю. Серия A. Математика . 16 (2): 114–122. doi : 10.2206/kyushumfs.16.114 .
Исторический
Gergonne, JD (ноябрь 1974 г.) [1815]. «Применение метода наименьших квадратов к интерполяции последовательностей». Historia Mathematica . 1 (4) (Перевод Ральфа Сент-Джона и С.М. Стиглера с французского издания 1815 г.): 439–447. doi : 10.1016/0315-0860(74)90034-2 .
Стиглер, Стивен М. (ноябрь 1974 г.). «Статья Жергонна 1815 года о планировании и анализе экспериментов по полиномиальной регрессии». Historia Mathematica . 1 (4): 431–439. doi : 10.1016/0315-0860(74)90033-0 .
Пирс, К. С. (1876). «Заметка о теории экономики исследований». Отчет о береговой съемке : 197–201.(Приложение № 14). NOAA PDF Eprint. Перепечатано в Сборнике статей Чарльза Сандерса Пирса . Том 7. 1958.параграфы 139–157, и в Peirce, CS (июль–август 1967). «Заметка о теории экономики исследований». Operations Research . 15 (4): 643–648. doi :10.1287/opre.15.4.643. JSTOR 168276.
Смит, Кирстин (1918). «О стандартных отклонениях скорректированных и интерполированных значений наблюдаемой полиномиальной функции и ее константах и о руководстве, которое они дают для правильного выбора распределения наблюдений». Biometrika . 12 (1/2): 1–85. doi :10.2307/2331929. JSTOR 2331929.