В математике и статистике кусочно -линейная , PL или сегментированная функция — это вещественнозначная функция действительной переменной, график которой состоит из отрезков прямых. [1]
Кусочно-линейная функция — это функция, определенная на (возможно, неограниченном) интервале действительных чисел , так что существует набор интервалов, на каждом из которых функция является аффинной функцией . (Таким образом, «кусочно-линейный» на самом деле означает «кусочно- аффинный ».) Если область определения функции компактна , должен существовать конечный набор таких интервалов; если область некомпактна, может потребоваться, чтобы она была конечной или локально конечной в действительных числах.
Функция, определенная
кусочно-линейная, состоящая из четырех частей. График этой функции показан справа. Поскольку график affine(*) функции представляет собой прямую , график кусочно-линейной функции состоит из отрезков и лучей . Значения x (в приведенном выше примере -3, 0 и 3), при которых изменяется наклон, обычно называются точками останова, точками изменения, пороговыми значениями или узлами. Как и во многих приложениях, эта функция также непрерывна. График непрерывной кусочно-линейной функции на компактном отрезке представляет собой ломаную цепь .
Другие примеры кусочно-линейных функций включают функцию абсолютного значения , пилообразную функцию и функцию пола .
(*) Линейная функция удовлетворяет по определению и, следовательно, в частности ; Функции, график которых представляет собой прямую линию, являются аффинными , а не линейными .
Приближение известной кривой можно найти путем выборки кривой и линейной интерполяции между точками. Опубликован алгоритм расчета наиболее значимых точек с учетом заданной погрешности. [2]
Если разделы, а затем точки останова уже известны, линейную регрессию можно выполнить независимо для этих разделов. Однако в этом случае не сохраняется непрерывность, а также нет единой эталонной модели, лежащей в основе наблюдаемых данных. Получен устойчивый алгоритм для этого случая. [3]
Если разбиения неизвестны, остаточную сумму квадратов можно использовать для выбора оптимальных точек разделения. [4] Однако эффективное вычисление и совместная оценка всех параметров модели (включая точки останова) могут быть получены с помощью итерационной процедуры [5] , которая в настоящее время реализована в пакете segmented
[6] для языка R.
Вариант обучения дерева решений , называемый деревьями моделей, изучает кусочно-линейные функции. [7]
Понятие кусочно-линейной функции имеет смысл в нескольких различных контекстах. Кусочно-линейные функции могут быть определены в n -мерном евклидовом пространстве или, в более общем смысле, в любом векторном или аффинном пространстве , а также на кусочно-линейных многообразиях и симплициальных комплексах (см. симплициальное отображение ). В каждом случае функция может быть вещественной или принимать значения из векторного пространства, аффинного пространства, кусочно-линейного многообразия или симплициального комплекса. (В этих контекстах термин «линейный» относится не только к линейным преобразованиям , но и к более общим аффинным линейным функциям.)
В размерностях больше единицы обычно требуется, чтобы домен каждой части был многоугольником или многогранником . Это гарантирует, что график функции будет состоять из многоугольных или многогранных частей.
Важные подклассы кусочно-линейных функций включают непрерывные кусочно-линейные функции и выпуклые кусочно-линейные функции. В общем случае для каждой n -мерной непрерывной кусочно-линейной функции существует
такой, что
Если выпукло и непрерывно, то существует
такой, что
Сплайны обобщают кусочно-линейные функции до полиномов более высокого порядка, которые, в свою очередь, содержатся в категории кусочно-дифференцируемых функций PDIFF .
В сельском хозяйстве кусочный регрессионный анализ измеренных данных используется для определения диапазона, в котором факторы роста влияют на урожайность, и диапазона, в котором культура не чувствительна к изменениям этих факторов.
На изображении слева показано, что при неглубоких грунтовых водах урожайность снижается, тогда как при более глубоких (> 7 дм) урожайность не меняется. График построен с использованием метода наименьших квадратов , чтобы найти два сегмента с наилучшим соответствием .
График справа показывает, что урожайность сельскохозяйственных культур выдерживает засоление почвы до ECe = 8 дСм/м (ECe — электропроводность экстракта насыщенного образца почвы), а за пределами этого значения урожайность сельскохозяйственных культур снижается. График построен методом частичной регрессии для определения самого длинного диапазона «отсутствия эффекта», т.е. там, где линия горизонтальна. Два сегмента не обязательно должны соединяться в одной точке. Только для второго отрезка используется метод наименьших квадратов.