Модель NK — это математическая модель, описанная ее главным изобретателем Стюартом Кауфманом как «настраиваемый неровный» ландшафт приспособленности . «Настраиваемая неровность» отражает интуицию, что как общий размер ландшафта, так и количество его локальных «холмов и долин» можно регулировать посредством изменения двух его параметров, и , при этом длина цепочки эволюции и определение уровня неровности ландшафта.
Модель NK нашла применение в самых разных областях, включая теоретическое изучение эволюционной биологии , иммунологии , оптимизации , технологической эволюции , командной науки [1] и сложных систем . Модель также была принята в организационной теории , где она используется для описания способа, которым агент может искать ландшафт, манипулируя различными характеристиками самого себя. Например, агент может быть организацией , холмы и долины представляют прибыль (или ее изменения), а движение по ландшафту требует организационных решений (таких как добавление линеек продуктов или изменение организационной структуры), которые, как правило, взаимодействуют друг с другом и влияют на прибыль сложным образом. [2]
Ранняя версия модели, которая рассматривала только самые гладкие ( ) и самые неровные ( ) ландшафты, была представлена в работе Кауфмана и Левина (1987). [3] Модель в том виде, в котором она известна в настоящее время, впервые появилась в работе Кауфмана и Вайнбергера (1989). [4]
Одна из причин, по которой модель привлекла широкое внимание в оптимизации, заключается в том, что она является особенно простым примером так называемой NP-полной задачи [5] , что означает, что трудно найти глобальные оптимумы. Недавно было показано, что модель NK для K > 1 также является PLS-полной [6] , что означает, что, в общем, трудно найти даже локальные оптимумы приспособленности. Это имеет последствия для изучения открытой эволюции.
Плазмида — это небольшой круг ДНК внутри определенных клеток, которые могут реплицироваться независимо от своих клеток-хозяев. Предположим, мы хотим изучить приспособленность плазмид.
Для простоты мы моделируем плазмиду как кольцо из N возможных генов, всегда в одном и том же порядке, и каждый может иметь два возможных состояния (активный или неактивный, тип X или тип Y и т. д.). Затем плазмида моделируется двоичной строкой длиной N , и поэтому функция приспособленности равна .
В простейшей модели гены не взаимодействуют друг с другом, и поэтому мы получаем , где каждый обозначает вклад в приспособленность гена в местоположении .
Для моделирования эпистаза мы вводим еще один фактор K , количество других генов, с которыми взаимодействует ген. Разумно предположить, что на плазмиде два гена взаимодействуют, если они соседствуют, таким образом, например, когда K = 1 , а N = 5 ,
Модель NK обобщает это, допуская произвольные конечные K, N, а также допуская произвольное определение смежности генов (гены не обязательно лежат на окружности или отрезке прямой).
Модель NK определяет комбинаторное фазовое пространство , состоящее из каждой строки (выбранной из заданного алфавита) длины . Для каждой строки в этом поисковом пространстве определяется скалярное значение (называемое пригодностью ). Если между строками определена метрика расстояния, то результирующая структура представляет собой ландшафт .
Значения приспособленности определяются в соответствии с конкретным воплощением модели, но ключевой особенностью модели NK является то, что приспособленность данной строки представляет собой сумму вкладов каждого локуса в строке:
и вклад каждого локуса в целом зависит от его состояния и состояния других локусов:
где - индекс -го соседа локуса .
Таким образом, функция приспособленности представляет собой отображение между строками длины K + 1 и скалярами, которые в более поздней работе Вайнбергера называются «фитнес-вкладами». Такие фитнес-вклады часто выбираются случайным образом из некоторого заданного распределения вероятностей.
Одномерная модель Изинга спинового стекла обычно записывается как , где — гамильтониан, который можно рассматривать как энергию.
Мы можем переформулировать это как частный случай модели NK с K=1 : определив В общем случае m-мерная модель Изинга на квадратной сетке является моделью NK с .
Поскольку K приблизительно измеряет «жесткость» ландшафта приспособленности (см. ниже), мы видим, что с увеличением размерности модели Изинга ее жесткость также увеличивается.
Когда , это модель Эдвардса–Андерсона, которая точно решается.
Модель Шеррингтона–Киркпатрика обобщает модель Изинга, позволяя взаимодействовать всем возможным парам спинов (вместо графа-сетки используйте полный граф ), таким образом, она также является моделью NK с .
Разрешая взаимодействовать всем возможным подпоследовательностям спинов, а не просто парам, мы получаем модель с бесконечным диапазоном, которая также является моделью NK с .
Значение K контролирует степень эпистаза в модели NK или то, насколько другие локусы влияют на вклад приспособленности данного локуса. При K = 0 приспособленность данной строки является простой суммой индивидуальных вкладов локусов: для нетривиальных функций приспособленности глобальный оптимум присутствует и его легко найти (геном всех нулей, если f (0) > f (1), или всех единиц, если f (1) > f (0)). Для ненулевого K приспособленность строки является суммой приспособленностей подстрок, которые могут взаимодействовать, чтобы нарушить работу системы (рассмотрите, как достичь оптимальной приспособленности в примере выше). Таким образом, увеличение K увеличивает неровность ландшафта приспособленности.
Голая модель NK не поддерживает явление нейтрального пространства — то есть наборы геномов, связанных одиночными мутациями, которые имеют одинаковое значение приспособленности. Было предложено две адаптации для включения этой биологически важной структуры . Модель NKP вводит параметр : доля вкладов приспособленности устанавливается равной нулю, так что вклады нескольких генетических мотивов вырождены [ требуется ссылка ] . Модель NKQ вводит параметр и обеспечивает дискретизацию возможных значений вкладов приспособленности, так что каждый вклад принимает одно из возможных значений, снова вводя вырождение во вклады некоторых генетических мотивов [ требуется ссылка ] . Голая модель NK соответствует случаям и при этих параметризациях.
В 1991 году Вайнбергер опубликовал подробный анализ [7] случая, когда и вклады в пригодность выбираются случайным образом. Позднее было показано, что его аналитическая оценка числа локальных оптимумов была ошибочной [ требуется ссылка ] . Однако численные эксперименты, включенные в анализ Вайнбергера, подтверждают его аналитический результат о том, что ожидаемая пригодность строки распределена нормально со средним значением приблизительно
и дисперсия приблизительно
.
Модель NK нашла применение во многих областях, включая изучение спиновых стекол , коллективное решение проблем, [8] эпистаза и плейотропии в эволюционной биологии , а также комбинаторную оптимизацию .