В математике обратная функция функции f (также называемая обратной функцией f ) — это функция , которая отменяет операцию f . Обратная функция f существует тогда и только тогда, когда f является биективной , и если она существует, то обозначается как
Для функции ее обратная функция допускает явное описание: она отправляет каждый элемент в уникальный элемент, такой что f ( x ) = y .
В качестве примера рассмотрим действительную функцию действительной переменной, заданную как f ( x ) = 5 x − 7 . Можно представить f как функцию, которая умножает свой вход на 5, а затем вычитает 7 из результата. Чтобы отменить это, нужно добавить 7 к входу, а затем разделить результат на 5. Следовательно, обратная функция f — это функция, определяемая как
Пусть f — функция, областью определения которой является множество X , а областью определения — множество Y. Тогда f обратима , если существует функция g из Y в X такая, что для всех и для всех . [1]
Если f обратима, то существует ровно одна функция g, удовлетворяющая этому свойству. Функция g называется обратной для f и обычно обозначается как f −1 , обозначение, введенное Джоном Фредериком Уильямом Гершелем в 1813 году. [2] [3] [4] [5] [6] [nb 1]
Функция f обратима тогда и только тогда, когда она биективна. Это происходит потому, что условие для всех подразумевает, что f инъективна , а условие для всех подразумевает, что f сюръективна .
Обратная функция f −1 к f может быть явно описана как функция
Напомним, что если f — обратимая функция с областью определения X и областью определения Y , то
Используя композицию функций , это утверждение можно переписать в виде следующих уравнений между функциями:
где id X — это функция тождества на множестве X ; то есть функция, которая оставляет свой аргумент неизменным. В теории категорий это утверждение используется как определение обратного морфизма .
Рассмотрение композиции функций помогает понять обозначение f −1 . Многократное составление функции f : X → X с самой собой называется итерацией . Если f применяется n раз, начиная со значения x , то это записывается как f n ( x ) ; поэтому f 2 ( x ) = f ( f ( x )) и т. д. Поскольку f −1 ( f ( x )) = x , составление f −1 и f n дает f n −1 , «отменяя» эффект одного применения f .
Хотя обозначение f −1 ( x ) может быть неправильно понято, [1] ( f ( x )) −1 определенно обозначает мультипликативную обратную функцию f ( x ) и не имеет ничего общего с обратной функцией f . [6] Обозначение может использоваться для обратной функции, чтобы избежать двусмысленности с мультипликативной обратной функцией . [7]
В соответствии с общей нотацией некоторые английские авторы используют выражения вроде sin −1 ( x ) для обозначения обратной функции синуса, примененной к x (на самом деле частичной обратной функции; см. ниже). [8] [6] Другие авторы считают, что это можно спутать с обозначением для мультипликативной обратной функции sin ( x ) , которая может быть обозначена как (sin ( x )) −1 . [6] Чтобы избежать какой-либо путаницы, обратная тригонометрическая функция часто обозначается префиксом « arc » (от латинского arcus ). [9] [10] Например, обратная функция синуса обычно называется функцией арксинуса , записываемой как arcsin ( x ) . [9] [10] Аналогично, обратная гиперболическая функция обозначается префиксом « ar » (от латинского ārea ). [10] Например, обратная функция гиперболического синуса обычно записывается как arsinh ( x ) . [10] Выражения типа sin −1 ( x ) все еще могут быть полезны для различения многозначной обратной функции от частичной обратной функции: . Другие обратные специальные функции иногда имеют префикс «inv», если следует избежать неоднозначности обозначения f −1 . [11] [10]
Функция f : R → [0,∞), заданная формулой f ( x ) = x 2 , не является инъективной, поскольку для всех . Следовательно, f необратима.
Если область определения функции ограничена неотрицательными действительными числами, то есть мы берем функцию по тому же правилу , что и раньше, то функция является биективной и, следовательно, обратимой. [12] Обратная функция здесь называется (положительной) функцией квадратного корня и обозначается как .
В следующей таблице показано несколько стандартных функций и их обратных:
Многие функции, заданные алгебраическими формулами, имеют формулу для их обратной функции. Это потому, что обратная функция обратимой функции имеет явное описание как
Это позволяет легко определять обратные функции многих функций, которые задаются алгебраическими формулами. Например, если f — функция
тогда для определения действительного числа y нужно найти единственное действительное число x такое, что (2 x + 8) 3 = y . Это уравнение можно решить:
Таким образом, обратная функция f −1 задается формулой
Иногда обратная функция не может быть выражена замкнутой формулой . Например, если f — функция
тогда f является биекцией и, следовательно, обладает обратной функцией f −1 . Формула для этой обратной функции имеет выражение в виде бесконечной суммы:
Поскольку функция представляет собой особый тип бинарного отношения , многие свойства обратной функции соответствуют свойствам обратных отношений .
Если для данной функции f существует обратная функция , то она единственна. [13] Это следует из того, что обратная функция должна быть обратным отношением, которое полностью определяется f .
Существует симметрия между функцией и ее обратной функцией. В частности, если f — обратимая функция с областью определения X и областью определения Y , то ее обратная функция f −1 имеет область определения Y и изображение X , а обратная функция f −1 — это исходная функция f . В символах для функций f : X → Y и f −1 : Y → X , [13]
Это утверждение является следствием того, что для того, чтобы f была обратимой, она должна быть биективной. Инволютивная природа инверсии может быть кратко выражена как [14]
Обратная композиция функций определяется формулой [15]
Обратите внимание, что порядок g и f поменялся местами: чтобы отменить f, а затем g , мы должны сначала отменить g , а затем отменить f .
Например, пусть f ( x ) = 3 x и пусть g ( x ) = x + 5. Тогда композиция g ∘ f — это функция, которая сначала умножает на три, а затем прибавляет пять,
Чтобы обратить этот процесс вспять, мы должны сначала вычесть пять, а затем разделить на три,
Это композиция ( f −1 ∘ g −1 )( x ) .
Если X — множество, то функция тождества на X является своей собственной обратной:
В более общем смысле функция f : X → X равна своей собственной обратной функции тогда и только тогда, когда композиция f ∘ f равна id X. Такая функция называется инволюцией .
Если f обратима, то график функции
такой же, как график уравнения
Это идентично уравнению y = f ( x ) , которое определяет график функции f , за исключением того, что роли x и y поменялись местами. Таким образом, график функции f −1 может быть получен из графика функции f путем перестановки осей x и y . Это эквивалентно отражению графика относительно прямой y = x . [16] [1]
По теореме об обратной функции непрерывная функция одной переменной (где ) обратима на своем множестве (изображении) тогда и только тогда, когда она либо строго возрастает, либо строго убывает (без локальных максимумов или минимумов ). Например, функция
обратима, так как производная f′ ( x ) = 3 x 2 + 1 всегда положительна.
Если функция f дифференцируема на интервале I и f′ ( x ) ≠ 0 для каждого x ∈ I , то обратная функция f −1 дифференцируема на f ( I ) . [17] Если y = f ( x ) , производная обратной функции задается теоремой об обратной функции,
Используя обозначения Лейбница, формулу выше можно записать как
Этот результат следует из цепного правила (см. статью об обратных функциях и дифференцировании ).
Теорема об обратной функции может быть обобщена на функции нескольких переменных. В частности, непрерывно дифференцируемая многомерная функция f : R n → R n обратима в окрестности точки p, пока обратима матрица Якоби функции f в точке p . В этом случае якобиан функции f −1 в точке f ( p ) является обратной матрицей якобиана функции f в точке p .
Даже если функция f не является однозначной, можно определить частично обратную функцию f, ограничив область определения . Например, функция
не является взаимно-однозначной, так как x 2 = (− x ) 2 . Однако функция становится взаимно-однозначной, если мы ограничимся областью x ≥ 0 , в этом случае
(Если вместо этого мы ограничимся областью x ≤ 0 , то обратная функция будет отрицательным значением квадратного корня из y .) С другой стороны, нет необходимости ограничивать область, если мы довольствуемся тем, что обратная функция является многозначной функцией :
Иногда эта многозначная обратная функция называется полной обратной функцией f , а ее части (такие как √ x и − √ x ) называются ветвями . Самая важная ветвь многозначной функции (например, положительный квадратный корень) называется главной ветвью , а ее значение в точке y называется главным значением f −1 ( y ) .
Для непрерывной функции на вещественной прямой требуется одна ветвь между каждой парой локальных экстремумов . Например, обратная кубической функции с локальным максимумом и локальным минимумом имеет три ветви (см. соседний рисунок).
Эти соображения особенно важны для определения обратных тригонометрических функций . Например, функция синуса не является однозначной, так как
для каждого действительного x (и в более общем случае sin( x + 2 π n ) = sin( x ) для каждого целого числа n ). Однако синус является однозначным на интервале [− π/2 , π/2 ] , а соответствующая частичная обратная величина называется арксинусом . Это считается главной ветвью арксинуса, поэтому главное значение арксинуса всегда находится между − π/2 и π/2 . Следующая таблица описывает основную ветвь каждой обратной тригонометрической функции: [19]
Состав функций слева и справа не обязательно должен совпадать. В общем случае условия
подразумевают различные свойства f . Например, пусть f : R → [0, ∞) обозначает отображение возведения в квадрат, такое что f ( x ) = x 2 для всех x в R , и пусть g : [0, ∞) → R обозначает отображение квадратного корня, такое что g ( x ) = √ x для всех x ≥ 0 . Тогда f ( g ( x )) = x для всех x в [0, ∞) ; то есть g является правым обратным к f . Однако g не является левым обратным к f , поскольку, например, g ( f (−1)) = 1 ≠ −1 .
Если f : X → Y , то левая обратная функция для f (или ретракция f ) — это функция g : Y → X такая, что композиция f с g слева дает тождественную функцию [20]. То есть функция g удовлетворяет правилу
Функция g должна быть равна обратной функции f на изображении f , но может принимать любые значения для элементов Y, не входящих в изображение.
Функция f с непустой областью определения инъективна тогда и только тогда, когда она имеет левую обратную. [21] Элементарное доказательство выглядит следующим образом:
Если непустое f : X → Y инъективно, постройте левое обратное g : Y → X следующим образом: для всех y ∈ Y , если y содержится в образе f , то существует x ∈ X такой, что f ( x ) = y . Пусть g ( y ) = x ; это определение уникально, поскольку f инъективно. В противном случае пусть g ( y ) будет произвольным элементом X .
Для всех x ∈ X f ( x ) находится в образе f . По построению g ( f ( x )) = x , условие для левого обратного.
В классической математике каждая инъективная функция f с непустой областью определения обязательно имеет левую обратную; однако в конструктивной математике это может не сработать . Например, левая обратная функция включения { 0,1} → R двухэлементного множества в вещественных числах нарушает неразложимость , давая ретракцию вещественной прямой к множеству {0,1} . [22]
Правая обратная функция для f (или части f ) — это функция h : Y → X такая , что
То есть функция h удовлетворяет правилу
Таким образом, h ( y ) может быть любым из элементов X , которые отображаются в y при f .
Функция f имеет правую обратную функцию тогда и только тогда, когда она сюръективна (хотя построение такой обратной функции в общем случае требует аксиомы выбора ).
Обратная функция, которая является как левой, так и правой обратной функцией ( двусторонняя обратная функция ), если она существует, должна быть уникальной. Фактически, если функция имеет левую обратную функцию и правую обратную функцию, они обе являются одной и той же двусторонней обратной функцией, поэтому ее можно назвать обратной функцией .
Функция имеет двустороннюю обратную функцию тогда и только тогда, когда она биективна.
Если f : X → Y — любая функция (не обязательно обратимая), то прообраз (или обратный образ ) элемента y ∈ Y определяется как множество всех элементов X , которые отображаются в y :
Прообраз y можно рассматривать как образ y при (многозначной ) полной обратной функции f .
Аналогично, если S — любое подмножество Y , то прообраз S , обозначаемый , — это множество всех элементов X , которые отображаются в S :
Например, возьмем функцию f : R → R ; x ↦ x 2 . Эта функция необратима, поскольку она не является биективной, но прообразы могут быть определены для подмножеств области значений, например
Прообраз одного элемента y ∈ Y – синглтонный набор { y } – иногда называют волокном y . Когда Y – это набор действительных чисел, принято называть f −1 ({ y }) набором уровня .
{{cite book}}
: CS1 maint: location missing publisher (link)[...] §473. Повторные логарифмы [...] Здесь мы отмечаем символику, использованную Прингсхаймом и Мольком в их совместной статье в Encyclopédie : " 2 log b a = log b (log b a ), ..., k +1 log b a = log b ( k log b a )". [...] §533. Обозначение Джона Гершеля для обратных функций, sin −1 x , tan −1 x и т. д., было опубликовано им в Philosophical Transactions of London за 1813 год. Он говорит (стр. 10): "Эту запись cos. −1 e не следует понимать как обозначение 1/cos. e , но то, что обычно записывается так, arc (cos.= e )". Он признает, что некоторые авторы используют cos. m A вместо (cos. A ) m , но он оправдывает свою собственную нотацию, указывая, что поскольку d 2 x , Δ 3 x , Σ 2 x означают dd x , ΔΔΔ x , ΣΣ x , мы должны писать sin. 2 x вместо sin. sin. x , log. 3 x вместо log. log. log. x . Так же, как мы пишем d − n V=∫ n V , мы можем аналогично записать sin. −1 x =arc (sin.= x ), log. −1 x .=c x . Несколько лет спустя Гершель объяснил, что в 1813 году он использовал f n ( x ), f − n ( x ), sin. −1 x и т. д., «как он тогда впервые предположил. Однако в течение этих нескольких месяцев ему стала известна работа немецкого аналитика Бурманна , в которой то же самое объясняется в значительно более раннюю дату. Однако он [Бурманн], похоже, не заметил удобства применения этой идеи к обратным функциям tan −1и т. д., и он, по-видимому, вообще не знаком с обратным исчислением функций, которое оно порождает». Гершель добавляет: «Симметрия этой нотации и, прежде всего, новые и самые обширные взгляды, которые она открывает на природу аналитических операций, по-видимому, оправдывают ее всеобщее принятие». [a] [...] §535. Сохранение конкурирующих нотаций для обратной функции. — [...] Использование нотации Гершеля претерпело небольшие изменения в книгах Бенджамина Пирса , чтобы устранить главное возражение против них; Пирс писал: «cos [−1] x », «log [−1] x ». [b] [...] §537. Степени тригонометрических функций. — Для обозначения, скажем, квадрата sin x использовались три основных нотации , а именно, (sin x ) 2 , sin x 2 , sin 2 x . В настоящее время преобладающей нотацией является sin 2 x , хотя первая из них, по всей вероятности, быть неверно истолкована. В случае sin 2 x напрашиваются две интерпретации; во-первых, sin x · sin x ; во-вторых, [c] sin (sin x ). Поскольку функции последнего типа обычно не встречаются, опасность неверной интерпретации гораздо меньше, чем в случае log 2 x , где log x · log x и log (log x ) часто встречаются в анализе. [...] Обозначение sin n x для (sin x ) n широко использовалось и в настоящее время является преобладающим. [...](xviii+367+1 страниц, включая 1 страницу приложений) (Примечание. ISBN и ссылка на переиздание 2-го издания Cosimo, Inc., Нью-Йорк, США, 2013 г.)
= arcsin
m
Эта нотация повсеместно используется в Европе и быстро набирает популярность в этой стране. Менее желательный символ, α = sin
-1
m
, все еще встречается в английских и американских текстах. Нотация α = inv sin
m
, возможно, еще лучше из-за ее общей применимости. [...] Аналогичное символическое соотношение справедливо и для других
тригонометрических функций
. Его часто читают как 'arc-sine
m
'
или 'anti-sine
m
'
, поскольку две взаимно обратные функции, как говорят, являются антифункцией другой.