Модель NK — это математическая модель , описанная ее основным изобретателем Стюартом Кауфманом как «настраиваемая жесткая» фитнес-среда . «Настраиваемая жесткость» отражает интуитивное понимание того, что как общий размер ландшафта, так и количество его местных «холмов и долин» можно регулировать путем изменения двух его параметров : уровень пересечённости ландшафта.
Модель NK нашла применение в самых разных областях, включая теоретическое исследование эволюционной биологии , иммунологии , оптимизации , технологической эволюции , командной науки [1] и сложных систем . Модель также была принята в теории организаций , где она используется для описания того, как агент может исследовать ландшафт, манипулируя различными своими характеристиками. Например, агентом может быть организация , холмы и долины представляют собой прибыль (или ее изменения), а движение по ландшафту требует организационных решений (таких как добавление линий продуктов или изменение организационной структуры), которые имеют тенденцию взаимодействовать друг с другом. и влияют на прибыль сложным образом. [2]
Ранняя версия модели, которая учитывала только самые гладкие ( ) и самые пересеченные ( ) ландшафты, была представлена Кауфманом и Левином (1987). [3] Модель в том виде, в котором она известна в настоящее время, впервые появилась в работе Кауфмана и Вайнбергера (1989). [4]
Одна из причин, почему модель привлекла широкое внимание в оптимизации, заключается в том, что она представляет собой особенно простой пример так называемой NP-полной задачи [5] , что означает, что трудно найти глобальные оптимумы. Недавно было показано, что модель NK для K > 1 также является PLS-полной [6], а это означает, что в целом трудно найти даже локальные оптимумы приспособленности. Это имеет последствия для изучения открытой эволюции.
Плазмида — это небольшой круг ДНК внутри определенных клеток, который может реплицироваться независимо от клеток-хозяев . Предположим, мы хотим изучить приспособленность плазмид.
Для простоты мы моделируем плазмиду как кольцо из N возможных генов, всегда в одном и том же порядке, и каждый из них может иметь два возможных состояния (активное или неактивное, тип X или тип Y и т. д.). Тогда плазмида моделируется двоичной строкой длины N , и поэтому функция приспособленности равна .
В самой простой модели гены не взаимодействуют друг с другом, и поэтому мы получаем, где каждый обозначает вклад в приспособленность гена в местоположении .
Чтобы смоделировать эпистаз , мы вводим еще один фактор K — количество других генов, с которыми взаимодействует ген. Разумно предположить, что в плазмиде два гена взаимодействуют, если они расположены рядом, что дает, например, когда K = 1 и N = 5 ,
Модель NK обобщает это, допуская произвольные конечные K, N, а также допуская произвольное определение смежности генов (гены не обязательно лежат на окружности или отрезке прямой).
Модель NK определяет комбинаторное фазовое пространство , состоящее из каждой строки (выбранной из заданного алфавита) длины . Для каждой строки в этом пространстве поиска определяется скалярное значение (называемое пригодностью ). Если между строками определена метрика расстояния , результирующая структура представляет собой ландшафт .
Значения приспособленности определяются в соответствии с конкретным воплощением модели, но ключевой особенностью модели NK является то, что приспособленность данной строки представляет собой сумму вкладов каждого локуса в строке:
а вклад каждого локуса в целом зависит от его состояния и состояния других локусов:
где – номер соседа локуса .
Следовательно, функция приспособленности представляет собой отображение между строками длины K + 1 и скалярами, которые в более поздней работе Вайнбергера называются «вкладами приспособленности». Такие вклады приспособленности часто выбираются случайным образом из некоторого заданного распределения вероятностей.
Одномерную модель спинового стекла Изинга обычно записывают так: где – гамильтониан, который можно рассматривать как энергию.
Мы можем переформулировать это как частный случай модели НК с K=1 : определив В общем, m-мерная модель Изинга на квадратной сетке является моделью НК с .
Поскольку K грубо измеряет «устойчивость» ландшафта приспособленности (см. ниже), мы видим, что по мере увеличения размерности модели Изинга ее устойчивость также увеличивается.
При , это модель Эдвардса-Андерсона, которая точно разрешима.
Модель Шеррингтона-Киркпатрика обобщает модель Изинга, позволяя взаимодействовать всем возможным парам спинов (вместо сеточного графа используйте полный граф ), таким образом, это также модель NK с .
Позволяя взаимодействовать всем возможным подпоследовательностям спинов, а не просто парам, мы получаем модель бесконечного диапазона, которая также является моделью NK с .
Значение K контролирует степень эпистаза в модели NK или то, насколько другие локусы влияют на вклад приспособленности данного локуса. При K = 0 пригодность данной строки представляет собой простую сумму отдельных вкладов локусов: для нетривиальных функций приспособленности присутствует глобальный оптимум , который легко найти (геном всех нулей, если f (0) > f (1 ), или все единицы, если f (1) > f (0)). При ненулевом K пригодность строки представляет собой сумму приспособленностей подстрок, которые могут взаимодействовать, разрушая систему (подумайте, как достичь оптимальной приспособленности в приведенном выше примере). Таким образом, увеличение K увеличивает устойчивость фитнес-ландшафта.
Голая NK-модель не поддерживает феномен нейтрального пространства — то есть наборов геномов, связанных одиночными мутациями, которые имеют одинаковую ценность приспособленности. Были предложены две адаптации для включения этой биологически важной структуры . Модель NKP вводит параметр : доля вкладов приспособленности устанавливается равной нулю, так что вклады нескольких генетических мотивов вырождаются . Модель NKQ вводит параметр и обеспечивает дискретизацию возможных значений вклада приспособленности, так что каждый вклад принимает одно из возможных значений , снова внося вырождение во вклады от некоторых генетических мотивов . Голая модель NK соответствует случаям и при этих параметризациях.
В 1991 г. Вайнбергер опубликовал подробный анализ [7] случая, когда вклады приспособленности выбираются случайным образом. Его аналитическая оценка числа локальных оптимумов позже оказалась ошибочной . Однако численные эксперименты, включенные в анализ Вайнбергера, подтверждают его аналитический результат о том, что ожидаемая пригодность струны обычно распределяется со средним значением примерно
и дисперсия примерно
.
Модель NK нашла применение во многих областях, в том числе при изучении спиновых стекол , коллективном решении задач, [8] эпистазе и плейотропии в эволюционной биологии , а также комбинаторной оптимизации .