Математическая модель — это абстрактное описание конкретной системы с использованием математических концепций и языка . Процесс разработки математической модели называется математическим моделированием . Математические модели используются в прикладной математике и в естественных науках (таких как физика , биология , науки о Земле , химия ) и инженерных дисциплинах (таких как информатика , электротехника ), а также в нефизических системах, таких как социальные науки [1] (такие как экономика , психология , социология , политология ). Она также может преподаваться как самостоятельный предмет. [2]
Использование математических моделей для решения проблем в бизнесе или военных операциях является большой частью области исследования операций . Математические модели также используются в музыке , [3] лингвистике , [4] и философии (например, интенсивно в аналитической философии ). Модель может помочь объяснить систему и изучить эффекты различных компонентов, а также сделать прогнозы о поведении.
Математические модели могут принимать различные формы, включая динамические системы , статистические модели , дифференциальные уравнения или игровые теоретико-модели . Эти и другие типы моделей могут перекрываться, при этом заданная модель включает в себя множество абстрактных структур. В общем, математические модели могут включать логические модели . Во многих случаях качество научной области зависит от того, насколько хорошо математические модели, разработанные с теоретической стороны, согласуются с результатами повторяемых экспериментов. Отсутствие согласия между теоретическими математическими моделями и экспериментальными измерениями часто приводит к важным достижениям по мере разработки лучших теорий. В физических науках традиционная математическая модель содержит большинство из следующих элементов:
Математические модели бывают разных типов:
В бизнесе и инженерии математические модели могут использоваться для максимизации определенного выхода. Рассматриваемая система потребует определенных входов. Система, связывающая входы с выходами, также зависит от других переменных: переменных решения , переменных состояния , экзогенных переменных и случайных переменных . Переменные решения иногда называют независимыми переменными. Экзогенные переменные иногда называют параметрами или константами . Переменные не являются независимыми друг от друга, поскольку переменные состояния зависят от решения, входа, случайных и экзогенных переменных. Кроме того, выходные переменные зависят от состояния системы (представленного переменными состояния).
Цели и ограничения системы и ее пользователей могут быть представлены как функции выходных переменных или переменных состояния. Целевые функции будут зависеть от точки зрения пользователя модели. В зависимости от контекста целевая функция также известна как индекс производительности , поскольку она является некоторой мерой интереса для пользователя. Хотя нет ограничений на количество целевых функций и ограничений, которые может иметь модель, использование или оптимизация модели становится более сложным (вычислительно) по мере увеличения числа. Например, экономисты часто применяют линейную алгебру при использовании моделей ввода-вывода . Сложные математические модели, которые имеют много переменных, могут быть объединены с помощью векторов , где один символ представляет несколько переменных.
Математические задачи моделирования часто классифицируются на модели черного ящика или белого ящика в зависимости от того, сколько априорной информации о системе доступно. Модель черного ящика — это система, о которой нет априорной информации. Модель белого ящика (также называемая стеклянным ящиком или прозрачным ящиком) — это система, в которой доступна вся необходимая информация. Практически все системы находятся где-то между моделями черного ящика и белого ящика, поэтому эта концепция полезна только как интуитивное руководство для принятия решения о том, какой подход использовать.
Обычно предпочтительнее использовать как можно больше априорной информации, чтобы сделать модель более точной. Поэтому модели «белого ящика» обычно считаются более простыми, потому что если вы правильно использовали информацию, то модель будет вести себя правильно. Часто априорная информация приходит в форме знания типа функций, связывающих различные переменные. Например, если мы создаем модель того, как лекарство действует в человеческой системе, мы знаем, что обычно количество лекарства в крови является экспоненциально убывающей функцией, но у нас все еще остается несколько неизвестных параметров: как быстро убывает количество лекарства и каково начальное количество лекарства в крови? Поэтому этот пример не является полностью моделью «белого ящика». Эти параметры должны быть оценены с помощью некоторых средств, прежде чем можно будет использовать модель.
В моделях черного ящика пытаются оценить как функциональную форму отношений между переменными, так и числовые параметры в этих функциях. Используя априорную информацию, мы могли бы получить, например, набор функций, которые, вероятно, могли бы адекватно описать систему. Если априорной информации нет, мы попытались бы использовать функции как можно более общие, чтобы охватить все различные модели. Часто используемый подход для моделей черного ящика — это нейронные сети , которые обычно не делают предположений о входящих данных. В качестве альтернативы, алгоритмы NARMAX (модель нелинейной авторегрессии скользящего среднего с экзогенными входами), которые были разработаны как часть идентификации нелинейной системы [8], могут использоваться для выбора членов модели, определения структуры модели и оценки неизвестных параметров в присутствии коррелированного и нелинейного шума. Преимущество моделей NARMAX по сравнению с нейронными сетями заключается в том, что NARMAX создает модели, которые можно записать и связать с лежащим в основе процессом, тогда как нейронные сети создают приближение, которое является непрозрачным.
Иногда бывает полезно включить субъективную информацию в математическую модель. Это можно сделать на основе интуиции , опыта или экспертного мнения , или на основе удобства математической формы. Байесовская статистика предоставляет теоретическую основу для включения такой субъективности в строгий анализ: мы указываем априорное распределение вероятностей (которое может быть субъективным), а затем обновляем это распределение на основе эмпирических данных.
Примером того, когда такой подход необходим, является ситуация, в которой экспериментатор слегка сгибает монету и подбрасывает ее один раз, записывая, выпадет ли орел, а затем ему дается задание предсказать вероятность того, что при следующем подбрасывании выпадет орел. После сгибания монеты истинная вероятность того, что монета выпадет орел, неизвестна; поэтому экспериментатору нужно будет принять решение (возможно, посмотрев на форму монеты) о том, какое предварительное распределение использовать. Включение такой субъективной информации может быть важным для получения точной оценки вероятности.
В целом, сложность модели подразумевает компромисс между простотой и точностью модели. Бритва Оккама — это принцип, особенно актуальный для моделирования, его основная идея заключается в том, что среди моделей с примерно одинаковой предсказательной силой самая простая является наиболее желательной. Хотя добавленная сложность обычно повышает реалистичность модели, она может сделать модель трудной для понимания и анализа, а также может создавать вычислительные проблемы, включая численную нестабильность . Томас Кун утверждает, что по мере развития науки объяснения, как правило, становятся более сложными, прежде чем смена парадигмы предложит радикальное упрощение. [9]
Например, при моделировании полета самолета мы могли бы встроить каждую механическую часть самолета в нашу модель и таким образом получить почти модель системы «белого ящика». Однако вычислительные затраты на добавление такого огромного количества деталей фактически препятствовали бы использованию такой модели. Кроме того, неопределенность увеличилась бы из-за чрезмерно сложной системы, поскольку каждая отдельная часть вносит некоторую дисперсию в модель. Поэтому обычно целесообразно сделать некоторые приближения, чтобы уменьшить модель до разумного размера. Инженеры часто могут принять некоторые приближения, чтобы получить более надежную и простую модель. Например, классическая механика Ньютона является приближенной моделью реального мира. Тем не менее, модель Ньютона вполне достаточна для большинства обычных жизненных ситуаций, то есть до тех пор, пока скорости частиц значительно ниже скорости света , и мы изучаем только макрочастицы. Обратите внимание, что лучшая точность не обязательно означает лучшую модель. Статистические модели склонны к переобучению, что означает, что модель слишком точно подгоняется под данные и теряет способность обобщать новые события, которые ранее не наблюдались.
Любая модель, которая не является чисто белой коробкой, содержит некоторые параметры , которые могут быть использованы для подгонки модели к системе, которую она должна описывать. Если моделирование выполняется искусственной нейронной сетью или другим машинным обучением , оптимизация параметров называется обучением , тогда как оптимизация гиперпараметров модели называется настройкой и часто использует перекрестную проверку . [10] В более традиционном моделировании с помощью явно заданных математических функций параметры часто определяются путем подгонки кривой . [ требуется ссылка ]
Важнейшей частью процесса моделирования является оценка того, описывает ли данная математическая модель систему точно. На этот вопрос может быть сложно ответить, поскольку он включает несколько различных типов оценки.
Обычно самая простая часть оценки модели — это проверка того, предсказывает ли модель экспериментальные измерения или другие эмпирические данные, не используемые при разработке модели. В моделях с параметрами распространенным подходом является разделение данных на два непересекающихся подмножества: данные обучения и данные проверки. Данные обучения используются для оценки параметров модели. Точная модель будет близко соответствовать данным проверки, даже если эти данные не использовались для установки параметров модели. Эта практика в статистике называется перекрестной проверкой .
Определение метрики для измерения расстояний между наблюдаемыми и прогнозируемыми данными является полезным инструментом для оценки соответствия модели. В статистике, теории принятия решений и некоторых экономических моделях функция потерь играет аналогичную роль. Хотя довольно просто проверить пригодность параметров, может быть сложнее проверить обоснованность общей математической формы модели. В целом, для проверки соответствия статистических моделей было разработано больше математических инструментов , чем моделей, включающих дифференциальные уравнения . Инструменты из непараметрической статистики иногда можно использовать для оценки того, насколько хорошо данные соответствуют известному распределению, или для разработки общей модели, которая делает только минимальные предположения о математической форме модели.
Оценка области действия модели, то есть определение того, к каким ситуациям применима модель, может быть менее простой. Если модель была построена на основе набора данных, необходимо определить, для каких систем или ситуаций известные данные являются «типичным» набором данных. Вопрос о том, хорошо ли модель описывает свойства системы между точками данных, называется интерполяцией , а тот же вопрос для событий или точек данных за пределами наблюдаемых данных называется экстраполяцией .
В качестве примера типичных ограничений области действия модели при оценке классической механики Ньютона можно отметить, что Ньютон проводил свои измерения без передового оборудования, поэтому он не мог измерить свойства частиц, движущихся со скоростью, близкой к скорости света. Аналогично, он не измерял движения молекул и других малых частиц, а только макрочастиц. Тогда неудивительно, что его модель не очень хорошо экстраполируется в эти области, хотя ее модели вполне достаточно для физики обычной жизни.
Многие типы моделирования неявно включают утверждения о причинности . Это обычно (но не всегда) верно для моделей, включающих дифференциальные уравнения. Поскольку цель моделирования состоит в том, чтобы расширить наше понимание мира, обоснованность модели основывается не только на ее соответствии эмпирическим наблюдениям, но и на ее способности экстраполировать на ситуации или данные за пределами тех, которые изначально описаны в модели. Можно думать об этом как о различии между качественными и количественными предсказаниями. Можно также утверждать, что модель бесполезна, если она не дает некоторого понимания, которое выходит за рамки того, что уже известно из прямого исследования изучаемого явления.
Примером такой критики является аргумент о том, что математические модели теории оптимального кормодобывания не предлагают понимания, выходящего за рамки здравого смысла выводов эволюции и других основных принципов экологии. [11] Следует также отметить, что, хотя математическое моделирование использует математические концепции и язык, оно само по себе не является разделом математики и не обязательно соответствует какой-либо математической логике , но, как правило, является разделом некоторой науки или другого технического предмета с соответствующими концепциями и стандартами аргументации. [2]
Математические модели имеют большое значение в естественных науках, особенно в физике . Физические теории почти всегда выражаются с помощью математических моделей. На протяжении всей истории разрабатывались все более и более точные математические модели. Законы Ньютона точно описывают многие повседневные явления, но в определенных пределах необходимо использовать теорию относительности и квантовую механику .
В физике принято использовать идеализированные модели для упрощения вещей. Безмассовые веревки, точечные частицы, идеальные газы и частица в коробке являются одними из многих упрощенных моделей, используемых в физике. Законы физики представлены простыми уравнениями, такими как законы Ньютона, уравнения Максвелла и уравнение Шредингера . Эти законы являются основой для создания математических моделей реальных ситуаций. Многие реальные ситуации очень сложны и, таким образом, моделируются приблизительно на компьютере, модель, которую можно вычислить с помощью вычислений, создается из основных законов или из приближенных моделей, созданных из основных законов. Например, молекулы могут быть смоделированы с помощью молекулярных орбитальных моделей, которые являются приближенными решениями уравнения Шредингера. В инженерии физические модели часто создаются с помощью математических методов, таких как анализ конечных элементов .
Различные математические модели используют разные геометрии, которые не обязательно являются точными описаниями геометрии Вселенной. Евклидова геометрия широко используется в классической физике, в то время как специальная теория относительности и общая теория относительности являются примерами теорий, которые используют геометрии , не являющиеся евклидовыми.
Часто, когда инженеры анализируют систему, которую необходимо контролировать или оптимизировать, они используют математическую модель. В анализе инженеры могут построить описательную модель системы как гипотезу о том, как система может работать, или попытаться оценить, как непредвиденное событие может повлиять на систему. Аналогично, при контроле системы инженеры могут опробовать различные подходы к управлению в симуляциях .
Математическая модель обычно описывает систему с помощью набора переменных и набора уравнений, которые устанавливают связи между переменными. Переменные могут быть разных типов; действительные или целые числа, булевы значения или строки , например. Переменные представляют некоторые свойства системы, например, измеренные выходные данные системы, часто в форме сигналов , временных данных , счетчиков и возникновения событий. Фактическая модель — это набор функций, которые описывают связи между различными переменными.
Общая ссылка
Философский