Надежный параметрический дизайн , представленный Геничи Тагучи , представляет собой экспериментальный дизайн, используемый для использования взаимодействия между управляющими и неуправляемыми шумовыми переменными путем робастификации — поиска настроек управляющих факторов, которые минимизируют вариацию ответа от неуправляемых факторов. [1] Управляемые переменные — это переменные, над которыми экспериментатор имеет полный контроль. Шумовые переменные лежат на другой стороне спектра. Хотя эти переменные можно легко контролировать в экспериментальной обстановке, за пределами экспериментального мира их очень трудно, если не невозможно, контролировать. Надежные параметрические дизайны используют соглашение об именовании, похожее на соглашение FFD. 2 (m1+m2)-(p1-p2) — это двухуровневый дизайн, где m1 — количество управляющих факторов, m2 — количество шумовых факторов, p1 — уровень фракционирования для управляющих факторов, а p2 — уровень фракционирования для шумовых факторов.
Рассмотрим пример выпечки торта RPD из Монтгомери (2005), где экспериментатор хочет улучшить качество торта. [2] В то время как производитель торта может контролировать количество муки, количество сахара, количество разрыхлителя и содержание красителя в торте, другие факторы не поддаются контролю, такие как температура в духовке и время выпечки. Производитель может напечатать инструкции для времени выпечки 20 минут, но в реальном мире он не может контролировать привычки потребителей в выпечке. Изменения в качестве торта могут возникнуть из-за выпечки при 325° вместо 350° или из-за того, что торт оставался в духовке в течение немного слишком короткого или слишком длительного периода времени. Надежные конструкции параметров стремятся минимизировать влияние факторов шума на качество. В этом примере производитель надеется минимизировать влияние колебаний времени выпечки на качество торта, и для этого требуются оптимальные настройки для факторов управления.
RPD в основном используются в условиях моделирования, где неконтролируемые шумовые переменные обычно легко контролируются. В то время как в реальном мире шумовые факторы трудно контролировать, в экспериментальных условиях контроль над этими факторами легко поддерживать. В примере с выпечкой торта экспериментатор может изменять время выпечки и температуру в духовке, чтобы понять последствия таких колебаний, которые могут возникнуть, когда контроль больше не находится в его/ее руках.
Надежные параметрические планы очень похожи на дробные факторные планы (FFD) в том, что оптимальный план может быть найден с использованием матриц Адамара , принципы иерархии эффектов и разреженности факторов сохраняются, а наложение спектров присутствует при фракционировании полных RPD. Подобно FFD, RPD являются скрининговыми планами и могут предоставить линейную модель рассматриваемой системы. Под иерархией эффектов для FFD подразумевается, что взаимодействия более высокого порядка, как правило, оказывают незначительное влияние на реакцию. [3] Как утверждает Каррауэй, основные эффекты, скорее всего, окажут влияние на реакцию, затем двухфакторные взаимодействия, затем трехфакторные взаимодействия и так далее. [4] Концепция разреженности эффектов заключается в том, что не все факторы будут оказывать влияние на реакцию. Эти принципы являются основой для фракционирования матриц Адамара. Фракционируя, экспериментаторы могут формировать выводы за меньшее количество запусков и с меньшими ресурсами. Часто RPD используются на ранних стадиях эксперимента. Поскольку двухуровневые RPD предполагают линейность между эффектами факторов, для моделирования кривизны после сокращения числа факторов можно использовать другие методы.
Матрицы Адамара — это квадратные матрицы, состоящие только из + и −. Если матрица Адамара нормализована и фракционирована, получается шаблон проектирования. Однако не все шаблоны равны, что означает, что некоторые шаблоны лучше других, и для определения наилучшего шаблона используются особые критерии проектирования. После получения шаблона проектирования экспериментаторы обычно знают, на какие настройки следует установить каждый фактор. Каждая строка в шаблоне указывает на прогон, а каждый столбец указывает на фактор. Для частичного шаблона проектирования, показанного слева, экспериментатор определил семь факторов, которые могут оказывать влияние на ответ, и надеется получить представление о том, какие факторы оказывают влияние в восьми прогонах. В первом прогоне факторы 1, 4, 5 и 6 устанавливаются на высокие уровни, а факторы 2, 3 и 7 — на низкие уровни. Низкие уровни и высокие уровни — это настройки, обычно определяемые экспертом по предметной области. Эти значения являются крайними, но не настолько экстремальными, чтобы ответ попадал в негладкие области. После каждого прогона получаются результаты; и путем флуктуации нескольких факторов в отдельных запусках вместо использования метода OFAT можно оценить взаимодействия между переменными, а также эффекты отдельных факторов. Если два фактора взаимодействуют, то эффект, который один фактор оказывает на отклик, отличается в зависимости от настроек другого фактора.
Правильное дробление матриц Адамара требует очень много времени. Рассмотрим 24-прогонный план, включающий шесть факторов. Количество планов Адамара из каждой матрицы Адамара равно 23, выберите 6; то есть 100 947 планов из каждой матрицы Адамара размером 24×24. Поскольку имеется 60 матриц Адамара такого размера, общее количество планов для сравнения составляет 6 056 820. Леопки, Бингем и Ситтер (2006) использовали методологию полного поиска и составили список лучших RPD для 12, 16 и 20 прогонов. Поскольку работа по полному поиску настолько исчерпывающая, лучшие планы для больших размеров прогонов часто недоступны. В этом случае можно использовать другие статистические методы для дробления матрицы Адамара таким образом, чтобы допустить лишь допустимое количество наложения спектров. Для FFD были разработаны эффективные алгоритмы, такие как прямой выбор и обратное исключение , но из-за сложности наложения спектров, вызванной различением управляющих и шумовых переменных, эти методы пока не доказали свою эффективность для RPD. [5] [6] [7]
Для полного понимания критериев дизайна необходимо понимание истории и дробных факторных дизайнов. FFD стремятся понять, какие факторы влияют на ответ, и стремятся оптимизировать ответ, находя соответствующие настройки факторов. В отличие от RPD, FFD не различают контрольные и шумовые переменные.
В 2003 году Бингем и Ситтер [8] определили максимальное разрешение и минимальную аберрацию для двухуровневых дробных факторных планов. Разрешение определяет наихудшее количество присутствующего наложения, а аберрация определяет, какая часть этого наихудшего случая наложения присутствует в плане. Разрешение III проектирует основные эффекты наложения с двухфакторными взаимодействиями. Разрешение IV проектирует основные эффекты наложения с трехфакторными взаимодействиями. Разрешение V проектирует основные эффекты наложения с четырехфакторными взаимодействиями. По мере увеличения разрешения уровень наложения становится менее серьезным, поскольку взаимодействия более высокого порядка, как правило, оказывают пренебрежимо малое влияние на отклик. Разрешение измеряет регулярные планы; то есть эффекты либо полностью наложены, либо не наложены вообще. Рассмотрим следующее утверждение: «Фактор A наложен с двухфакторным взаимодействием факторов BC». Это означает, что если двухфакторное взаимодействие BC оказывает влияние на ответ, то оценка влияния фактора A на ответ оказывается искаженной, поскольку влияние фактора A невозможно отличить от влияния BC. Очевидно, что дизайн резолюции V предпочтительнее дизайна резолюции IV.
Проекты с одинаковым разрешением не всегда равны, и знания о том, какой тип наложения является наихудшим, недостаточно, чтобы знать, какой проект лучше. Вместо этого необходимо дальнейшее исследование того, сколько наложения в наихудшем случае необходимо. Эта идея известна как минимальная аберрация. Лучшие проекты содержат наименьшее количество наихудшего наложения. Если проекты D1 и D2 являются проектами разрешения V, но D1 имеет больше примеров основных эффектов, наложенных 4-факторными взаимодействиями, то D2 является лучшим проектом. D2 является лучшим проектом, потому что существует большее количество хорошо оцененных эффектов.
Фонтана, Пистоне и Рогантин [9] создали индикаторную функцию для двухуровневых дробных факторных планов, а в 2003 году Йе расширил индикаторную функцию для регулярных и нерегулярных планов. [10] При этом Йе установил обобщенное разрешение и обобщенную минимальную аберрацию. В то время как регулярные планы — это планы с размером серии, равным степени двойки, нерегулярные планы могут быть любым кратным четырем. В нерегулярных планах эффекты могут быть полностью наложены, частично наложены или не наложены вообще. Обобщенная минимальная аберрация и обобщенное разрешение учитывают это частичное наложение.
Формально Йе (2003) различает регулярные и нерегулярные конструкции и утверждает, что любую полиномиальную функцию можно записать как
Если , то дизайн является регулярным; в противном случае имеет место частичное наложение спектров.
Пока Йе разрабатывал эту индикаторную функцию, Бингем и Ситтер работали над разъяснением разрешения и аберрации для надежных параметрических конструкций. В 2006 году Леопки, Бингем и Ситтер опубликовали расширенный шаблон длины слова и индикаторную функцию для надежных параметрических конструкций. Поскольку RPD заботятся о минимизации вариации процесса из-за шумовых факторов, приоритет эффектов меняется от иерархии эффектов FFD. Главные эффекты по-прежнему являются первым приоритетом, а двухфакторные взаимодействия по-прежнему являются вторым приоритетом; но если какие-либо взаимодействия имеют взаимодействие управления шумом (CN), то это взаимодействие увеличивается на 0,5 по шкале приоритетов. Например, трехфакторное взаимодействие CCN будет иметь приоритет 3 в FFD, потому что трехфакторные взаимодействия являются третьим приоритетом, двухфакторные взаимодействия являются вторым приоритетом, а основные эффекты являются первым приоритетом. Однако, поскольку RPD заботятся о шумовых переменных, взаимодействие CCN является эффектом приоритета 2,5. Взаимодействие CN повышает приоритет на 0,5; поэтому традиционный приоритет 3 минус 0,5 для взаимодействия CN дает приоритет 2,5. Полную таблицу приоритетов можно найти в Leoppky, Bingham, and Sitter (2006). [11]
Дальнейшее изучение представленных принципов позволит глубже понять сравнение проектов. [ необходима ссылка ]
Для обычных дробных факторных конструкций длина слова будет определять, какие типы алиасинга присутствуют. Например, слово «2367» можно разбить на структуры алиасинга следующим образом:
Слово 2367 имеет длину 4, и худший случай наложения заключается в том, что основные эффекты накладываются на трехфакторные взаимодействия, а двухфакторные взаимодействия накладываются на другие двухфакторные взаимодействия.
Длины слов становятся менее упрощенными, когда речь идет о RPD, поскольку приоритет эффектов изменился. Рассмотрим слово 23578 , где факторы 2, 3 и 5 являются управляющими переменными, а факторы 7 и 8 являются шумовыми переменными. Из этого слова можно вывести следующие строки псевдонимов:
2=3578, 3=2578 5=2378 или C=CCNN
7=2358, 8=2357 или N=CCCN
23=578, 25=378, 35=278 или CC=CNN
27=358 и 28=357 или CN=CCN
235=78 или CCC=NN
Теперь, когда можно увидеть, какие типы алиасинга встречаются, нужно использовать приоритет эффектов Леопки, Бингама и Ситтера, чтобы определить наихудшее количество присутствующего алиасинга. Это означает, что любое взаимодействие CN увеличивает этот приоритет на 0,5; и длина слова получается путем суммирования каждой стороны строки алиасинга. В таблице ниже приведены суммы для каждого типа алиасинга, найденного в слове 23578.
Поскольку более низкие суммы указывают на худшее наложение, это слово имеет наихудшее наложение длиной 4. Важно понимать [ требуется ссылка ] , что в FFD различие между контролем и шумом не будет приниматься во внимание, и это слово будет иметь длину 5; но RPD заботятся об этом различии, и даже если слово кажется длиной 5, критерии дизайна определяют приоритет 4. Теперь предположим, что дизайн D1 содержит только только что проанализированное слово (23578). Если бы D1 сравнивали с D2, и наихудшее наложение, обнаруженное в D2, имело бы приоритет 3,5, то D1 был бы лучшим дизайном. Однако если наихудшее наложение D2 имело бы приоритет 4, то необходимо учитывать минимальную аберрацию. Для каждого дизайна мы бы рассчитали частоты каждого типа наихудшего наложения. Лучший дизайн был бы выбран как дизайн, который минимизирует возникновение наихудшего наложения. Эти частоты можно организовать с помощью шаблона расширенной длины слова (EWLP).
Понятие минимальной аберрации можно понять из определения, данного в работе Леопки, Бингема и Ситтера (2006):
Леопки, Бингем и Ситтер (2006) также предлагают функцию индикатора RPD как:
Бингем и Ситтер (2006) создают EWLP, предлагая следующую концепцию:
Рассмотрим конструкции D1 и D2 со следующими EWLP:
Д1: [(0 0 3)(2 3 1)(2 5 5)]
Д2: [(0 0 3)(2 4 0)(2 4 6)]
EWLP можно читать слева направо, поскольку левая сторона указывает на самый серьезный уровень наложения спектров, и наложение спектров становится менее серьезным по мере продвижения вправо. D2 — лучшая конструкция, поскольку здесь на одно возникновение более серьезного наложения спектров больше, чем в D1.
Планирование экспериментов (DOE) является основополагающей частью экспериментирования, моделирования и имитации. [ необходима цитата ] Бэнкс [12] утверждает: «Экспериментальное проектирование связано с сокращением времени и усилий, связанных с имитацией, путем определения информации, которую необходимо собрать из каждой репликации имитации, количества репликаций, которые необходимо сделать, и того, какие изменения параметров модели необходимо сравнить». После того, как концептуальная модель была реализована в виде программируемой модели, DOE необходимо для проведения экспериментов и получения результатов имитации наиболее своевременным и экономически эффективным способом. Следующие примеры демонстрируют ситуации, в которых RPD могут использоваться для получения значимых выводов.
Рассмотрим пример производства перманентных маркеров, адаптированный из Brewer, Carraway и Ingram (2010). Эксперты в данной области (SME) выявили семь факторов, которые могут повлиять на качество маркера: количество чернил, содержание пропанола , содержание бутанола , содержание диацетона, качество контейнера, влажность и температура . Количество чернил, содержание пропанола, содержание бутанола, содержание диацетона и качество контейнера определяются производителем; влажность и температура, хотя их легко контролировать в экспериментальных условиях, не могут контролироваться после того, как продукт покидает руки производителя. Даже если производитель заявляет, что температура маркера должна быть в пределах от 35 до 80 градусов по Фаренгейту , потребители могут находиться в условиях 90-градусной жары или не обращать внимания на рекомендации. Это изменение неконтролируемо и влияет на мнение потребителей о продукте; поэтому производитель хочет, чтобы продукт был устойчив к изменениям, вызванным температурой.
Для запуска каждой возможной комбинации факторов потребуется 128 запусков. Однако, фракционируя эту матрицу, можно увидеть эффекты факторов за гораздо меньшее количество запусков. Поэтому фракционирование менее затратно и занимает меньше времени.
После создания RPD качество перманентного маркера проверяется в конце каждого запуска. Это пример живого моделирования, поскольку для проверки качества маркера необходимо имитировать влажность и температуру реального мира. Компания-производитель перманентного маркера предпочитает имитировать высокие или низкие температуры и влажность вместо того, чтобы отправляться в конкретные места, где может использоваться маркер. Производитель экономит время и деньги и получает близкий к тому же эффект, как если бы кто-то использовал маркер в экстремальных погодных условиях или в другом месте.
Представьте, что вас наняли на должность менеджера магазина, и вы хотите повысить эффективность труда. Вы заметили, что в течение дня в магазине работает одинаковое количество людей, но с полудня до 15:30 магазин становится более загруженным, а после 19:00 он пустеет. Вы не хотите рисковать нехваткой персонала, поэтому вы решаете смоделировать различные сценарии, чтобы определить наилучшее решение по планированию. Факторы управления, которые влияют на оптимальность планирования, могут включать количество людей в смену, тогда как неконтролируемые факторы могут включать погоду и транспортный поток.
Конструктивная модель реализуется для понимания дилеммы, и RPD является методом, используемым для определения настроек контрольных факторов, которые нам нужны для минимизации влияния факторов шума. Другими словами, можно использовать RPD для определения того, сколько людей необходимо в каждой смене, чтобы магазин не был недоукомплектован или переукомплектован независимо от погодных условий или потока трафика.
Поскольку RPDs так тесно связаны с FFDs, можно применять те же методы анализа. ANOVA можно использовать для определения того, какие факторы являются значимыми. Центральные точки можно использовать для определения наличия кривизны. Во многих пакетах статистического программного обеспечения есть планы разделенных участков, сохраненные и готовые к анализу. RPDs являются планами скрининга и часто используются для сокращения числа факторов, которые, как считается, влияют на отклик.