В статистике ограниченная рандомизация происходит при планировании экспериментов и, в частности, в контексте рандомизированных экспериментов и рандомизированных контролируемых испытаний . Ограниченная рандомизация позволяет избежать интуитивно плохого распределения лечения по экспериментальным единицам, сохраняя при этом теоретические преимущества рандомизации. [ 1] [2] Например, при клиническом испытании нового предлагаемого лечения ожирения по сравнению с контролем экспериментатор хотел бы избежать результатов рандомизации, при которых новое лечение было назначено только самым тяжелым пациентам.
Эта концепция была введена Фрэнком Йейтсом (1948) [ необходима полная цитата ] и Уильямом Дж. Юденом (1972) [ необходима полная цитата ] «как способ избежать плохих пространственных моделей лечения в спланированных экспериментах». [3]
Рассмотрим пакетный процесс, который использует 7 контрольных пластин в каждом запуске. План далее требует измерения переменной отклика на каждой пластине на каждом из 9 участков. Организация плана выборки имеет иерархическую или вложенную структуру: пакетный запуск является самым верхним уровнем, второй уровень — отдельная пластина, а третий уровень — участок на пластине.
Общее количество данных, сгенерированных за один запуск партии, составит 7 · 9 = 63 наблюдения. Один из подходов к анализу этих данных — вычислить среднее значение всех этих точек, а также их стандартное отклонение и использовать эти результаты в качестве ответов для каждого запуска.
Анализ данных, как предложено выше, не является абсолютно неверным, но при этом теряется информация, которую можно было бы получить в противном случае. Например, сайт 1 на пластине 1 физически отличается от сайта 1 на пластине 2 или на любой другой пластине. То же самое справедливо для любого из сайтов на любой из пластин. Аналогично, пластина 1 в прогоне 1 физически отличается от пластины 1 в прогоне 2 и т. д. Чтобы описать эту ситуацию, говорят, что сайты вложены в пластины, а пластины вложены в прогоны.
Вследствие этого вложения существуют ограничения на рандомизацию, которая может иметь место в эксперименте. Этот тип ограниченной рандомизации всегда создает вложенные источники вариации. Примерами вложенной вариации или ограниченной рандомизации, обсуждаемыми на этой странице, являются планы с разделением участков и полосовые планы .
Целью эксперимента с этим типом плана выборки обычно является снижение изменчивости из-за участков на пластинах и пластин в пределах запусков (или партий) в процессе. Участки на пластинах и пластины в пределах партии становятся источниками нежелательных вариаций, и исследователь стремится сделать систему устойчивой к этим источникам — другими словами, можно рассматривать пластины и участки как шумовые факторы в таком эксперименте.
Поскольку пластины и сайты представляют собой нежелательные источники вариации и поскольку одной из целей является снижение чувствительности процесса к этим источникам вариации, рассмотрение пластин и сайтов как случайных эффектов при анализе данных является разумным подходом. Другими словами, вложенная вариация часто является другим способом сказать вложенные случайные эффекты или вложенные источники шума. Если факторы «пластины» и «сайты» рассматриваются как случайные эффекты, то можно оценить компонент дисперсии из-за каждого источника вариации с помощью методов дисперсионного анализа . После получения оценок компонентов дисперсии исследователь может определить наибольший источник вариации в экспериментальном процессе, а также определить величины других источников вариации по отношению к наибольшему источнику.
Если эксперимент или процесс имеет вложенную вариацию, эксперимент или процесс имеет несколько источников случайной ошибки , которые влияют на его выход. Наличие вложенных случайных эффектов в модели — это то же самое, что и наличие вложенной вариации в модели.
Планы с разделением участков получаются, когда в ходе эксперимента происходит определенный тип ограниченной рандомизации. Простой факторный эксперимент может привести к плану с разделением участков из-за того, как эксперимент был фактически выполнен.
Во многих промышленных экспериментах часто возникают три ситуации:
Эксперимент, проводимый в одной из трех вышеперечисленных ситуаций, обычно приводит к типу дизайна с разделенным участком. Рассмотрим эксперимент по исследованию электроосаждения алюминия (неводного) на медных полосах. Три интересующих фактора: ток (A); температура раствора (T); и концентрация раствора гальванического агента (S). Скорость осаждения представляет собой измеренный отклик. Всего для эксперимента доступно 16 медных полос. Комбинации обработок, которые необходимо запустить (в ортогональном масштабе), перечислены ниже в стандартном порядке (т. е. они не были рандомизированы):
Рассмотрим проведение эксперимента при первом из перечисленных выше условий, когда фактор концентрации раствора гальванического агента (S) трудно поддается изменению. Поскольку этот фактор трудно поддается изменению, экспериментатор хотел бы рандомизировать комбинации обработки таким образом, чтобы фактор концентрации раствора имел минимальное количество изменений. Другими словами, рандомизация циклов обработки несколько ограничена уровнем фактора концентрации раствора.
В результате комбинации обработки могут быть рандомизированы таким образом, что те циклы обработки, которые соответствуют одному уровню концентрации (−1), запускаются первыми. Каждая медная полоска покрывается индивидуально, то есть только одна полоска за раз помещается в раствор для данной комбинации обработки. После завершения четырех циклов при низком уровне концентрации раствора раствор меняется на высокий уровень концентрации (1), и выполняются оставшиеся четыре цикла эксперимента (где снова каждая полоска покрывается индивидуально).
После завершения одного полного повторения эксперимента выполняется второе повторение с набором из четырех медных полосок, обработанных для заданного уровня концентрации раствора, перед изменением концентрации и обработкой оставшихся четырех полосок. Обратите внимание, что уровни для оставшихся двух факторов все еще могут быть рандомизированы. Кроме того, уровень концентрации, который запускается первым в повторных запусках, также может быть рандомизирован.
Запуск эксперимента таким образом приводит к плану с разделенным участком . Концентрация раствора известна как фактор всего участка , а факторы подучастка — это ток и температура раствора.
В дизайне с разделенным участком имеется более одного экспериментального блока . В этом эксперименте один экспериментальный блок представляет собой отдельную медную полоску. Обработки или факторы, которые применялись к отдельным полоскам, — это температура раствора и ток (эти факторы изменялись каждый раз, когда в раствор помещалась новая полоска). Другой или больший по размеру экспериментальный блок представляет собой набор из четырех медных полосок. Обработка или фактор, который применялся к набору из четырех полосок, — это концентрация раствора (этот фактор изменялся после обработки четырех полосок). Меньший по размеру экспериментальный блок называется экспериментальным блоком подучастка , в то время как больший по размеру экспериментальный блок называется целым блоком участка .
В этом эксперименте имеется 16 экспериментальных единиц подучастка. Температура раствора и ток являются факторами подучастка в этом эксперименте. В этом эксперименте имеется четыре экспериментальных единицы всего участка. Концентрация раствора является фактором всего участка в этом эксперименте. Поскольку существует два размера экспериментальных единиц, в модели имеется два члена ошибки, один из которых соответствует ошибке всего участка или экспериментальной единице всего участка, а другой соответствует ошибке подучастка или экспериментальной единице подучастка.
Таблица ANOVA для этого эксперимента будет выглядеть, в частности, следующим образом:
Первые три источника взяты из уровня всего участка, а следующие 12 — из части подучастка. Нормальный график вероятности 12 оценок терминов подучастка можно использовать для поиска статистически значимых терминов.
Рассмотрим проведение эксперимента при втором условии, указанном выше (т. е. пакетный процесс), для которого четыре медные полоски помещаются в раствор одновременно. Определенный уровень тока может быть применен к отдельной полоске в растворе. Те же 16 комбинаций обработки (реплицированный 2 3 факториал) запускаются, как и в первом сценарии. Однако способ проведения эксперимента будет другим. Существует четыре комбинации обработки температуры раствора и концентрации раствора: (−1, −1), (−1, 1), (1, −1), (1, 1). Экспериментатор случайным образом выбирает одну из этих четырех обработок для настройки первой. Четыре медные полоски помещаются в раствор. Две из четырех полосок случайным образом назначаются на низкий уровень тока. Оставшиеся две полоски назначаются на высокий уровень тока. Выполняется покрытие и измеряется реакция. Выбирается вторая комбинация обработки температуры и концентрации, и выполняется та же процедура. Это делается для всех четырех комбинаций температуры/концентрации.
Проведение эксперимента таким образом также приводит к плану с разделенным графиком, в котором факторами всего графика теперь являются концентрация раствора и температура раствора, а фактором подграфика — ток.
В этом эксперименте экспериментальная единица одного размера снова представляет собой отдельную медную полоску. Обработка или фактор, который был применен к отдельным полоскам, — это ток (этот фактор каждый раз менялся для другой полоски в растворе). Экспериментальная единица другого или большего размера снова представляет собой набор из четырех медных полосок. Обработка или факторы, которые были применены к набору из четырех полосок, — это концентрация раствора и температура раствора (эти факторы были изменены после обработки четырех полосок).
Меньший по размеру экспериментальный блок снова называется экспериментальным блоком подзаговора. Для этого эксперимента имеется 16 экспериментальных блоков подзаговора. Текущий является фактором подзаговора в этом эксперименте.
Более крупная экспериментальная единица — это экспериментальная единица всей делянки. В этом эксперименте есть четыре экспериментальные единицы всей делянки, а концентрация раствора и температура раствора являются факторами всей делянки в этом эксперименте.
Существует два размера экспериментальных единиц, и в модели есть два члена погрешности: один, который соответствует ошибке всей делянки или экспериментальной единице всей делянки, и один, который соответствует ошибке подделянки или экспериментальной единице подделянки.
ANOVA для этого эксперимента выглядит, в частности, следующим образом:
Первые три источника исходят из уровня всего участка, а следующие 5 — из уровня подучастка. Поскольку для члена ошибки подучастка существует 8 степеней свободы , этот MSE можно использовать для проверки каждого эффекта, включающего ток.
Рассмотрим проведение эксперимента по третьему сценарию, указанному выше. В растворе одновременно находится только одна медная полоска. Однако две полоски, одна при низком токе, а другая при высоком токе, обрабатываются одна за другой при одинаковой температуре и концентрации. После обработки двух полосок концентрация изменяется, а температура сбрасывается на другую комбинацию. Две полоски снова обрабатываются одна за другой при этой температуре и концентрации. Этот процесс продолжается до тех пор, пока не будут обработаны все 16 медных полосок.
Запуск эксперимента таким образом также приводит к дизайну с разделенным участком, в котором факторами всего участка снова являются концентрация раствора и температура раствора, а фактором подучастка является ток. В этом эксперименте экспериментальная единица одного размера представляет собой отдельную медную полоску. Обработка или фактор, которые были применены к отдельным полоскам, — это ток (этот фактор каждый раз менялся для другой полоски в растворе). Другая или более крупная экспериментальная единица представляет собой набор из двух медных полосок. Обработки или факторы, которые были применены к паре из двух полосок, — это концентрация раствора и температура раствора (эти факторы изменялись после обработки двух полосок). Экспериментальная единица меньшего размера называется экспериментальной единицей подучастка.
Для этого эксперимента имеется 16 экспериментальных единиц подучастка. Ток является фактором подучастка в эксперименте. В этом эксперименте имеется восемь экспериментальных единиц всего участка. Концентрация раствора и температура раствора являются факторами всего участка. В модели имеется два члена ошибки, один из которых соответствует ошибке всего участка или экспериментальной единице всего участка, а другой соответствует ошибке подучастка или экспериментальной единице подучастка.
ANOVA для этого (третьего) подхода частично выглядит следующим образом:
Первые четыре термина взяты из анализа всего сюжета, а следующие 5 — из анализа подсюжета. Обратите внимание, что у нас есть отдельные термины ошибок для эффектов как всего сюжета, так и подсюжета, каждый из которых основан на 4 степенях свободы.
Как видно из этих трех сценариев, одним из основных отличий в планах с разделенными участками от простых факторных планов является количество различных размеров экспериментальных единиц в эксперименте. Планы с разделенными участками имеют более одного размера экспериментальной единицы, т. е. более одного члена ошибки. Поскольку эти планы включают различные размеры экспериментальных единиц и различные дисперсии, стандартные ошибки различных сравнений средних значений включают одну или несколько дисперсий. Указание подходящей модели для плана с разделенными участками включает возможность идентифицировать каждый размер экспериментальной единицы. Способ определения экспериментальной единицы относительно структуры плана (например, полностью рандомизированный план против рандомизированного полного блочного плана) и структуры лечения (например, полный 2 3 факториал, разрешение V полуфракция, двухфакторная структура лечения с контрольной группой и т. д.). В результате наличия более одного размера экспериментальной единицы подходящей моделью, используемой для анализа планов с разделенными участками, является смешанная модель .
Если данные эксперимента анализируются с использованием в модели только одного погрешного члена, из результатов можно сделать вводящие в заблуждение и неверные выводы.
Подобно дизайну с разделенным участком, дизайн с полосовым участком может возникнуть, когда в ходе эксперимента произошел некоторый тип ограниченной рандомизации. Простой факторный дизайн может привести к дизайну с полосовым участком в зависимости от того, как проводился эксперимент. Дизайн с полосовым участком часто возникает в результате экспериментов, которые проводятся в течение двух или более этапов процесса, в которых каждый этап процесса является пакетным процессом, т. е. для завершения каждой комбинации обработки эксперимента требуется более одного этапа обработки с экспериментальными единицами, обрабатываемыми вместе на каждом этапе процесса. Как и в дизайне с разделенным участком, дизайн с полосовым участком возникает, когда рандомизация в эксперименте была ограничена каким-либо образом. В результате ограниченной рандомизации, которая происходит в дизайнах с полосовым участком, существует несколько размеров экспериментальных единиц. Следовательно, существуют различные члены ошибки или различные дисперсии ошибок, которые используются для проверки факторов, представляющих интерес в дизайне. Традиционный дизайн с полосовым участком имеет три размера экспериментальных единиц.
Рассмотрим следующий пример из полупроводниковой промышленности. Эксперимент требует шага имплантации и шага отжига. На шагах отжига и имплантации необходимо проверить три фактора. Процесс имплантации охватывает 12 пластин в партии, а имплантация одной пластины при заданном наборе условий нецелесообразна и не представляет собой экономичного использования имплантера. Печь отжига может обрабатывать до 100 пластин.
Настройки для двухуровневого факторного дизайна для трех факторов на этапе имплантации обозначены (A, B, C), а двухуровневый факторный дизайн для трех факторов на этапе отжига обозначены (D, E, F). Также присутствуют эффекты взаимодействия между факторами имплантации и факторами отжига. Таким образом, этот эксперимент содержит три размера экспериментальных единиц, каждая из которых имеет уникальный член ошибки для оценки значимости эффектов.
Чтобы придать реальный физический смысл каждой из экспериментальных единиц в приведенном выше примере, рассмотрим каждую комбинацию шагов имплантации и отжига как отдельную пластину. Партия из восьми пластин сначала проходит этап имплантации. Комбинация обработки 3 в факторах A, B и C является первым запуском обработки имплантации. Эта обработка имплантации применяется ко всем восьми пластинам одновременно. После завершения первой обработки имплантации другой набор из восьми пластин имплантируется с комбинацией обработки 5 факторов A, B и C. Это продолжается до тех пор, пока последняя партия из восьми пластин не будет имплантирована с комбинацией обработки 6 факторов A, B и C. После того, как все восемь комбинаций обработки факторов имплантации будут запущены, начинается этап отжига. Первой комбинацией обработки отжига, которая будет запущена, является комбинация обработки 5 факторов D, E и F. Эта комбинация обработки отжига применяется к набору из восьми пластин, причем каждая из этих восьми пластин поступает из одной из восьми комбинаций обработки имплантации. После отжига этой первой партии пластин вторая обработка отжигом применяется ко второй партии из восьми пластин, причем эти восемь пластин поступают из одной из восьми комбинаций обработки имплантатов. Это продолжается до тех пор, пока последняя партия из восьми пластин не будет имплантирована с определенной комбинацией факторов D, E и F.
Проведение эксперимента таким образом приводит к дизайну полосовой диаграммы с тремя размерами экспериментальных единиц. Набор из восьми пластин, которые имплантируются вместе, является экспериментальной единицей для факторов имплантации A, B и C и для всех их взаимодействий. Существует восемь экспериментальных единиц для факторов имплантации. Другой набор из восьми пластин отжигается вместе. Этот другой набор из восьми пластин является экспериментальной единицей второго размера и является экспериментальной единицей для факторов отжига D, E и F и для всех их взаимодействий. Экспериментальная единица третьего размера представляет собой одну пластину. Это экспериментальная единица для всех эффектов взаимодействия между факторами имплантации и факторами отжига.
На самом деле, приведенное выше описание дизайна полосовой диаграммы представляет собой один блок или одну репликацию этого эксперимента. Если эксперимент не содержит репликации, а модель для имплантата содержит только основные эффекты и двухфакторные взаимодействия, то трехфакторный член взаимодействия A*B*C (1 степень свободы) обеспечивает погрешность оценки эффектов в экспериментальной единице имплантата. Вызов аналогичной модели для экспериментальной единицы отжига дает трехфакторный член взаимодействия D*E*F для погрешности (1 степень свободы) для эффектов в экспериментальной единице отжига.
Более подробное обсуждение этих проектов и соответствующих процедур анализа см. в:
В статье использованы материалы, являющиеся общественным достоянием Национального института стандартов и технологий.