stringtranslate.com

Подгонка кривой

Подгонка зашумленной кривой с помощью модели асимметричного пика с помощью итерационного процесса ( алгоритм Гаусса–Ньютона с переменным коэффициентом затухания α).

Подгонка кривой [1] [2] — это процесс построения кривой или математической функции , которая наилучшим образом соответствует ряду точек данных [3] , возможно, с ограничениями. [4] [5] Подгонка кривой может включать либо интерполяцию [ 6] [7] , где требуется точное соответствие данным, либо сглаживание [ 8] [9], при котором строится «гладкая» функция, которая приблизительно соответствует данным. Связанная тема — регрессионный анализ [10] [11] , который больше фокусируется на вопросах статистического вывода, таких как степень неопределенности кривой, которая подгоняется под данные, наблюдаемые со случайными ошибками. Подогнанных кривых можно использовать в качестве вспомогательного средства для визуализации данных [12] [13], чтобы вывести значения функции, когда данные отсутствуют [14] , и суммировать отношения между двумя или более переменными. [15] Экстраполяция относится к использованию подобранной кривой за пределами диапазона наблюдаемых данных [16] и подвержена некоторой степени неопределенности [17], поскольку она может отражать метод, используемый для построения кривой, в той же степени, в какой она отражает наблюдаемые данные.

Для линейно-алгебраического анализа данных «подгонка» обычно означает попытку найти кривую, которая минимизирует вертикальное ( ось y ) смещение точки от кривой (например, обычный метод наименьших квадратов ). Однако для графических и графических приложений геометрическая подгонка стремится обеспечить наилучшее визуальное соответствие; что обычно означает попытку минимизировать ортогональное расстояние до кривой (например, общий метод наименьших квадратов ) или иным образом включить обе оси смещения точки от кривой. Геометрические подгонки не популярны, поскольку они обычно требуют нелинейных и/или итеративных вычислений, хотя они имеют преимущество более эстетичного и геометрически точного результата. [18] [19] [20]

Алгебраическая подгонка функций к точкам данных

Чаще всего подбирают функцию вида y = f ( x ) .

Подгонка линий и полиномиальных функций к точкам данных

Полиномиальные кривые, соответствующие синусоидальной функции
Полиномиальные кривые, соответствующие точкам, сгенерированным с помощью синусоидальной функции. Черная пунктирная линия — это «истинные» данные, красная линия — полином первой степени , зеленая линия — второй степени , оранжевая линия — третьей степени , а синяя линия — четвертой степени.

Полиномиальное уравнение первой степени

представляет собой линию с наклоном a . Линия будет соединять любые две точки, поэтому уравнение полинома первой степени является точной аппроксимацией любых двух точек с различными координатами x.

Если порядок уравнения увеличить до полинома второй степени, то получим следующее:

Это будет точно соответствовать простой кривой по трем точкам.

Если порядок уравнения увеличить до полинома третьей степени, то получится следующее:

Это будет точно соответствовать четырём пунктам.

Более общим утверждением было бы сказать, что он будет точно соответствовать четырем ограничениям . Каждое ограничение может быть точкой, углом или кривизной (которая является обратной величиной радиуса соприкасающейся окружности ). Ограничения угла и кривизны чаще всего добавляются к концам кривой и в таких случаях называются конечными условиями . Идентичные конечные условия часто используются для обеспечения плавного перехода между полиномиальными кривыми, содержащимися в одном сплайне . Ограничения более высокого порядка, такие как «изменение скорости кривизны», также могут быть добавлены. Это, например, было бы полезно при проектировании шоссе в виде клеверного листа , чтобы понять скорость изменения сил, приложенных к автомобилю (см. рывок ), когда он следует по клеверному листу, и установить разумные ограничения скорости, соответственно.

Уравнение полинома первой степени также может быть точным соответствием для одной точки и угла, в то время как уравнение полинома третьей степени также может быть точным соответствием для двух точек, ограничения угла и ограничения кривизны. Для этих и для уравнений полинома более высокого порядка возможны многие другие комбинации ограничений.

Если ограничений больше n  + 1 ( где n — степень полинома), полиномиальную кривую все равно можно пропустить через эти ограничения. Точное соответствие всем ограничениям не гарантировано (но может случиться, например, в случае полинома первой степени, точно соответствующего трем коллинеарным точкам ). В общем случае, однако, необходим какой-то метод для оценки каждого приближения. Метод наименьших квадратов — один из способов сравнения отклонений.

Существует несколько причин, по которым следует получить приблизительное соответствие, когда можно просто увеличить степень полиномиального уравнения и получить точное соответствие:

Степень полиномиальной кривой выше, чем необходимо для точного соответствия, нежелательна по всем перечисленным ранее причинам для полиномов высокого порядка, но также приводит к случаю, когда существует бесконечное число решений. Например, полином первой степени (линия), ограниченный только одной точкой вместо обычных двух, даст бесконечное число решений. Это поднимает проблему того, как сравнить и выбрать только одно решение, что может быть проблемой как для программного обеспечения, так и для людей. По этой причине обычно лучше всего выбирать как можно более низкую степень для точного соответствия всем ограничениям и, возможно, даже более низкую степень, если приемлемо приблизительное соответствие.

Связь между урожайностью пшеницы и засоленностью почвы [21]

Подгонка других функций к точкам данных

В некоторых случаях могут использоваться и другие типы кривых, например, тригонометрические функции (например, синус и косинус).

В спектроскопии данные могут быть аппроксимированы функциями Гаусса , Лоренца , Фойгта и аналогичными функциями.

В биологии, экологии, демографии, эпидемиологии и многих других дисциплинах рост населения , распространение инфекционных заболеваний и т. д. можно описать с помощью логистической функции .

В сельском хозяйстве инвертированная логистическая сигмоидальная функция (S-кривая) используется для описания связи между урожайностью и факторами роста. Синяя фигура была получена с помощью сигмоидальной регрессии данных, измеренных на сельскохозяйственных угодьях. Можно увидеть, что изначально, т. е. при низкой засоленности почвы, урожайность медленно снижается при увеличении засоленности почвы, а затем снижение прогрессирует быстрее.

Геометрическая подгонка плоских кривых к точкам данных

Если функцию формы постулировать невозможно, можно все равно попытаться подогнать плоскую кривую .

В некоторых случаях могут использоваться и другие типы кривых, например, конические сечения (круговые, эллиптические, параболические и гиперболические дуги) или тригонометрические функции (например, синус и косинус). Например, траектории объектов под действием силы тяжести следуют параболическому пути, когда сопротивление воздуха игнорируется. Следовательно, сопоставление точек данных траектории с параболической кривой имело бы смысл. Приливы следуют синусоидальным моделям, поэтому точки данных приливов должны быть сопоставлены с синусоидой или суммой двух синусоид разных периодов, если учитываются оба эффекта — Луны и Солнца.

Для параметрической кривой эффективно подогнать каждую из ее координат как отдельную функцию длины дуги ; предполагая, что точки данных могут быть упорядочены, можно использовать расстояние хорды . [22]

Подгонка окружности геометрическим способом

Аппроксимация окружности методом Купе, точки, описывающие дугу окружности, центр (1 ; 1), радиус 4.
различные модели эллипсовидных фитингов
Эллипсная подгонка, минимизирующая алгебраическое расстояние (метод Фицгиббона).

Куп [23] подходит к проблеме поиска наилучшего визуального соответствия окружности набору точек данных 2D. Метод элегантно преобразует обычную нелинейную задачу в линейную задачу, которую можно решить без использования итеративных численных методов, и, следовательно, он намного быстрее предыдущих методов.

Подгонка эллипса геометрическим методом

Вышеуказанная техника расширена на общие эллипсы [24] путем добавления нелинейного шага, в результате чего получается метод, который является быстрым, но при этом находит визуально приятные эллипсы произвольной ориентации и смещения.

Поверхности для прилегания

Обратите внимание, что хотя это обсуждение было в терминах 2D-кривых, большая часть этой логики также распространяется на 3D-поверхности, каждый участок которых определяется сетью кривых в двух параметрических направлениях, обычно называемых u и v . Поверхность может состоять из одного или нескольких участков поверхности в каждом направлении.

Программное обеспечение

Многие статистические пакеты , такие как R , и численное программное обеспечение , такое как gnuplot , GNU Scientific Library , Igor Pro , MLAB , Maple , MATLAB , TK Solver 6.0, Scilab , Mathematica , GNU Octave и SciPy , включают команды для выполнения подгонки кривых в различных сценариях. Существуют также программы, специально написанные для выполнения подгонки кривых; их можно найти в списках программ статистического и численного анализа , а также в категории:Программное обеспечение для регрессии и подгонки кривых .

Смотрите также

Ссылки

  1. ^ Сандра Лах Арлингхаус, PHB Практическое руководство по подгонке кривых. CRC Press, 1994.
  2. ^ Уильям М. Колб. Подгонка кривых для программируемых калькуляторов. Syntec, Incorporated, 1984.
  3. ^ SS Halli, KV Rao. 1992. Advanced Techniques of Population Analysis. ISBN  0306439972 Страница 165 ( ср . ... функции выполняются, если мы имеем хорошее или умеренное соответствие наблюдаемым данным.)
  4. ^ Сигнал и шум: почему так много предсказаний не сбываются, а некоторые нет. Нейт Сильвер
  5. ^ Подготовка данных для интеллектуального анализа данных: Текст. Дориан Пайл.
  6. ^ Численные методы в инженерии с MATLAB®. Яан Киусалаас. Страница 24.
  7. ^ Численные методы в инженерии с Python 3. Яан Киусалаас. Страница 21.
  8. ^ Численные методы подгонки кривых. Автор: PG Guest, Philip George Guest. Страница 349.
  9. ^ См. также: Успокоение
  10. ^ Подгонка моделей к биологическим данным с использованием линейной и нелинейной регрессии. Харви Мотулски, Артур Христопулос.
  11. ^ Регрессионный анализ Рудольфа Дж. Фройнда, Уильяма Дж. Уилсона, Пин Са. Страница 269.
  12. ^ Визуальная информатика. Под редакцией Халимы Бадиозе Заман, Питера Робинсона, Марии Петру, Патрика Оливье, Хайко Шредера. Страница 689.
  13. ^ Численные методы для нелинейных инженерных моделей. Джон Р. Хаузер. Страница 227.
  14. Методы экспериментальной физики: спектроскопия, том 13, часть 1. Клэр Мартон. Страница 150.
  15. Энциклопедия дизайна исследований, том 1. Под редакцией Нила Дж. Салкинда. Страница 266.
  16. ^ Анализ сообщества и методы планирования. Ричард Э. Клостерман. Страница 1.
  17. ^ Введение в риск и неопределенность в оценке экологических инвестиций. DIANE Publishing. Стр. 69
  18. ^ Ahn, Sung-Joon (декабрь 2008 г.), «Геометрическая подгонка параметрических кривых и поверхностей» (PDF) , Journal of Information Processing Systems , 4 (4): 153–158, doi :10.3745/JIPS.2008.4.4.153, архивировано из оригинала (PDF) 2014-03-13
  19. ^ Чернов, Н.; Ма, Х. (2011), «Подгонка квадратичных кривых и поверхностей методом наименьших квадратов», в Yoshida, Sota R. (ред.), Computer Vision , Nova Science Publishers, стр. 285–302, ISBN 9781612093994
  20. ^ Лю, Ян; Ван, Вэньпин (2008), «Повторный взгляд на ортогональную подгонку расстояний по наименьшим квадратам параметрических кривых и поверхностей», в Chen, F.; Juttler, B. (ред.), Advances in Geometric Modeling and Processing , Lecture Notes in Computer Science, т. 4975, стр. 384–397, CiteSeerX 10.1.1.306.6085 , doi :10.1007/978-3-540-79246-8_29, ISBN  978-3-540-79245-1
  21. ^ Калькулятор для сигмоидальной регрессии
  22. ^ стр. 51 в Ahlberg & Nilson (1967) Теория сплайнов и их приложения , Academic Press, 1967 [1]
  23. ^ Куп, ID (1993). «Подгонка круга линейными и нелинейными наименьшими квадратами». Журнал теории оптимизации и приложений . 76 (2): 381–388. doi : 10.1007/BF00939613. hdl : 10092/11104 . S2CID  59583785.
  24. ^ Пол Шир, Программное обеспечение-помощник для ручной стереофотометрии, магистерская диссертация, 1997 г.

Дальнейшее чтение