stringtranslate.com

Воспроизведение ядра Гильбертова пространства

Рисунок иллюстрирует связанные, но разные подходы к рассмотрению RKHS.

В функциональном анализе воспроизводящее ядро ​​Гильбертово пространство ( RKHS ) — это гильбертово пространство функций, в котором оценка точки является непрерывным линейным функционалом . В частности, гильбертово пространство функций из множества (в или ) является RKHS, если для каждого существует функция такая, что для всех ,

Функция называется воспроизводящим ядром и воспроизводит значение at посредством внутреннего произведения.

Непосредственным следствием этого свойства является то, что сходимость по норме подразумевает поточечную сходимость (и она подразумевает равномерную сходимость, если конечна). Однако обратное не обязательно выполняется.

Например, рассмотрим последовательность функций . Эти функции сходятся поточечно к 0 как , но они не сходятся равномерно (т.е. они не сходятся относительно супремум-нормы). Это иллюстрирует, что поточечная сходимость не подразумевает сходимости по норме. Важно отметить, что супремум-норма не возникает из какого-либо скалярного произведения, поскольку она не удовлетворяет закону параллелограмма .

Не совсем просто построить естественные примеры гильбертова пространства, которые не являются RKHS нетривиальным образом. [1] Однако некоторые примеры были найдены. [2] [3]

Хотя пространства L 2 обычно определяются как гильбертово пространство, элементами которого являются классы эквивалентности функций, его можно тривиально переопределить как гильбертово пространство функций, используя выбор для выбора (общей) функции в качестве представителя для каждого класса эквивалентности. Однако никакой выбор представителей не может сделать это пространство RKHS ( для этого потребуется несуществующая дельта-функция Дирака). Однако существуют RKHS, в которых норма является L 2 -нормой, например, пространство функций с ограниченной полосой (см. пример ниже).

RKHS связан с ядром, которое воспроизводит каждую функцию в пространстве в том смысле, что для каждого в наборе, на котором определены функции, «оценка в » может быть выполнена путем взятия внутреннего произведения с функцией, определенной ядром. Такое воспроизводящее ядро ​​существует тогда и только тогда, когда каждый функционал оценки непрерывен.

Воспроизводящее ядро ​​было впервые введено в 1907 году в работе Станислава Зарембы, посвященной граничным задачам для гармонических и бигармонических функций . Джеймс Мерсер одновременно исследовал функции , которые удовлетворяют свойству воспроизводства в теории интегральных уравнений . Идея воспроизводящего ядра оставалась нетронутой в течение почти двадцати лет, пока не появилась в диссертациях Габора Сегё , Стефана Бергмана и Саломона Бохнера . В конечном итоге эта тема была систематически разработана в начале 1950-х годов Нахманом Ароншайном и Стефаном Бергманом. [4]

Эти пространства имеют широкое применение, включая комплексный анализ , гармонический анализ и квантовую механику . Воспроизводящие ядра Гильбертовых пространств особенно важны в области статистической теории обучения из-за знаменитой теоремы о репрезентаторе , которая гласит, что каждая функция в RKHS, минимизирующая эмпирический функционал риска, может быть записана как линейная комбинация функции ядра, оцененной в точках обучения. Это практически полезный результат, поскольку он эффективно упрощает задачу минимизации эмпирического риска с бесконечномерной до конечномерной задачи оптимизации.

Для простоты понимания мы предоставляем структуру для вещественнозначных гильбертовых пространств. Теория может быть легко расширена до пространств комплекснозначных функций и, следовательно, включает множество важных примеров воспроизведения ядерных гильбертовых пространств, которые являются пространствами аналитических функций . [5]

Определение

Пусть будет произвольным множеством и гильбертовым пространством вещественных функций на , снабженным поточечным сложением и поточечным скалярным умножением. Оценочный функционал над гильбертовым пространством функций — это линейный функционал, который оценивает каждую функцию в точке ,

Мы говорим, что H является воспроизводящим ядром гильбертова пространства , если для всех в , является непрерывным в каждом в или, что эквивалентно, если является ограниченным оператором в , т.е. существует такой, что

Хотя предполагается, что это касается всех , все равно может быть так, что .

Хотя свойство ( 1 ) является самым слабым условием, которое гарантирует как существование внутреннего произведения , так и оценку каждой функции в в каждой точке области, оно не поддается простому применению на практике. Более интуитивное определение RKHS можно получить, заметив, что это свойство гарантирует, что функционал оценки может быть представлен путем взятия внутреннего произведения с функцией в . Эта функция является так называемым воспроизводящим ядром [ необходима цитата ] для гильбертова пространства , от которого RKHS получил свое название. Более формально, теорема о представлении Рисса подразумевает, что для всех в существует уникальный элемент с воспроизводящим свойством,

Так как сама по себе является функцией, определенной на со значениями в поле (или в случае комплексных гильбертовых пространств) и так как в , то имеем, что

где элемент связан с .

Это позволяет нам определить воспроизводящее ядро ​​как функцию (или в комплексном случае) по формуле

Из этого определения легко видеть, что (или в комплексном случае) является как симметричным (соответственно, сопряженно симметричным), так и положительно определенным , т.е.

для каждого [6] Теорема Мура–Ароншайна (см. ниже) является своего рода обращением к этой: если функция удовлетворяет этим условиям, то существует гильбертово пространство функций на , для которого она является воспроизводящим ядром.

Примеры

Простейшим примером воспроизводящего ядра гильбертова пространства является пространство, где есть множество и есть счетная мера на . Для воспроизводящее ядро ​​является индикаторной функцией одноточечного множества .

Нетривиальные воспроизводящие ядра Гильбертовы пространства часто включают аналитические функции , как мы сейчас проиллюстрируем на примере. Рассмотрим Гильбертово пространство непрерывных функций с ограниченной полосой пропускания . Зафиксируем некоторую частоту среза и определим Гильбертово пространство

где — множество квадратично интегрируемых функций, а — преобразование Фурье . В качестве внутреннего произведения мы используем

Поскольку это замкнутое подпространство , оно является гильбертовым пространством. Более того, элементы из являются гладкими функциями на , стремящимися к нулю на бесконечности, по сути, по лемме Римана-Лебега . Фактически, элементы из являются ограничениями на целых голоморфных функций , по теореме Пэли-Винера .

Из теоремы обращения Фурье имеем

Из неравенства Коши–Шварца и теоремы Планшереля следует , что для всех ,

Это неравенство показывает, что функционал оценки ограничен, что доказывает, что он действительно является RKHS.

Функция ядра в этом случае определяется выражением

Преобразование Фурье, определенное выше, задается выражением

что является следствием свойства временного сдвига преобразования Фурье . Следовательно, используя теорему Планшереля , мы имеем

Таким образом, мы получаем воспроизводящее свойство ядра.

в этом случае это «версия с ограниченной полосой пропускания» дельта-функции Дирака , которая сходится к в слабом смысле, когда частота среза стремится к бесконечности.

Теорема Мура–Ароншайна

Мы увидели, как воспроизводящее ядро ​​гильбертова пространства определяет воспроизводящую функцию ядра, которая является как симметричной, так и положительно определенной . Теорема Мура–Ароншайна идет в другом направлении; она утверждает, что каждое симметричное, положительно определенное ядро ​​определяет уникальное воспроизводящее ядро ​​гильбертова пространства. Теорема впервые появилась в Теории воспроизводящих ядер Ароншайна , хотя он приписывает ее Э. Х. Муру .

Теорема . Предположим, что K — симметричное, положительно определенное ядро ​​на множестве X. Тогда существует единственное гильбертово пространство функций на X , для которого K является воспроизводящим ядром.

Доказательство . Для всех x из X определим K x = K ( x , ⋅ ). Пусть H 0 — линейная оболочка { K x  : xX }. Определим скалярное произведение на H 0 как

что подразумевает . Симметрия этого скалярного произведения следует из симметрии K , а невырожденность следует из того факта, что K положительно определен.

Пусть Hпополнение H 0 относительно этого скалярного произведения. Тогда H состоит из функций вида

Теперь мы можем проверить свойство воспроизведения ( 2 ):

Чтобы доказать единственность, пусть G будет другим гильбертовым пространством функций, для которого K является воспроизводящим ядром. Для каждого x и y в X , ( 2 ) подразумевает, что

По линейности, на отрезке . Тогда, поскольку G является полным и содержит H 0 и, следовательно, содержит свое завершение.

Теперь нам нужно доказать, что каждый элемент G лежит в H. Пусть будет элементом G. Поскольку H — замкнутое подпространство G , мы можем записать, где и . Теперь, если то, поскольку K — воспроизводящее ядро ​​G и H :

где мы использовали тот факт, что принадлежит H, так что его скалярное произведение с в G равно нулю. Это показывает, что в G и завершает доказательство.

Интегральные операторы и теорема Мерсера

Мы можем охарактеризовать симметричное положительно определенное ядро ​​через интегральный оператор, используя теорему Мерсера , и получить дополнительный вид RKHS. Пусть будет компактным пространством, снабженным строго положительной конечной борелевской мерой и непрерывной, симметричной и положительно определенной функцией. Определим интегральный оператор как

где — пространство квадратично интегрируемых функций относительно .

Теорема Мерсера утверждает, что спектральное разложение интегрального оператора дает представление ряда в терминах собственных значений и собственных функций . Это затем подразумевает, что является воспроизводящим ядром, так что соответствующий RKHS может быть определен в терминах этих собственных значений и собственных функций. Мы приводим подробности ниже.

При этих предположениях — компактный, непрерывный, самосопряженный и положительный оператор. Спектральная теорема для самосопряженных операторов подразумевает, что существует не более чем счетная убывающая последовательность такая, что и , где образуют ортонормированный базис . В силу положительности для всех Можно также показать, что непрерывно отображается в пространство непрерывных функций , и поэтому мы можем выбрать непрерывные функции в качестве собственных векторов, то есть для всех Тогда по теореме Мерсера можно записать в терминах собственных значений и непрерывных собственных функций как

для всех таких, что

Представление приведенного выше ряда называется ядром Мерсера или представлением Мерсера .

Кроме того, можно показать, что RKHS определяется выражением

где внутренний продукт задан

Это представление RKHS имеет применение в теории вероятностей и статистике, например, в представлении Карунена-Лоэва для стохастических процессов и ядерного PCA .

Карты объектов

Карта признаков — это карта , где — гильбертово пространство, которое мы будем называть пространством признаков. В первых разделах была представлена ​​связь между ограниченными/непрерывными функциями оценки, положительно определенными функциями и интегральными операторами, а в этом разделе мы приводим еще одно представление RKHS в терминах карт признаков.

Каждая карта характеристик определяет ядро ​​через

Очевидно , что симметрично, а положительная определенность следует из свойств скалярного произведения в . Наоборот, каждая положительно определенная функция и соответствующее воспроизводящее ядро ​​гильбертова пространства имеют бесконечно много связанных с ней карт признаков, таких, что ( 3 ) выполняется.

Например, мы можем тривиально взять и для всех . Тогда ( 3 ) удовлетворяется свойством воспроизведения. Другой классический пример карты признаков относится к предыдущему разделу, касающемуся интегральных операторов, принимая и .

Эта связь между ядрами и картами признаков дает нам новый способ понимания положительно определенных функций и, следовательно, воспроизведения ядер как внутренних произведений в . Более того, каждая карта признаков может естественным образом определять RKHS посредством определения положительно определенной функции.

Наконец, карты признаков позволяют нам строить функциональные пространства, которые раскрывают другую перспективу RKHS. Рассмотрим линейное пространство

Мы можем определить норму по

Можно показать, что является RKHS с ядром, определяемым с помощью . Это представление подразумевает, что элементы RKHS являются внутренними произведениями элементов в пространстве признаков и, соответственно, могут рассматриваться как гиперплоскости. Этот вид RKHS связан с трюком с ядром в машинном обучении. [7]

Характеристики

Полезные свойства РКХС:

Распространенные примеры

Билинейные ядра

Соответствующее этому ядру RKHS представляет собой двойственное пространство, состоящее из функций, удовлетворяющих .

Полиномиальные ядра

Ядра радиальных базисных функций

Это еще один распространенный класс ядер, которые удовлетворяют . Вот некоторые примеры:

зерна Бергмана

Мы также приводим примеры ядер Бергмана . Пусть X конечно и пусть H состоит из всех комплекснозначных функций на X. Тогда элемент H может быть представлен как массив комплексных чисел. Если используется обычное скалярное произведение , то K x — это функция, значение которой равно 1 в x и 0 во всех остальных точках, и ее можно рассматривать как единичную матрицу, поскольку

В этом случае H изоморфен .

Случай (где обозначает единичный круг ) более сложен. Здесь пространство Бергмана — это пространство квадратично-интегрируемых голоморфных функций на . Можно показать, что воспроизводящее ядро ​​для равно

Наконец, пространство функций с ограниченной полосой пропускания представляет собой RKHS с воспроизводящим ядром

Расширение векторнозначных функций

В этом разделе мы расширяем определение RKHS до пространств векторнозначных функций, поскольку это расширение особенно важно в многозадачном обучении и регуляризации многообразий . Главное отличие состоит в том, что воспроизводящее ядро ​​является симметричной функцией, которая теперь является положительно полуопределенной матрицей для каждого в . Более формально, мы определяем векторнозначное RKHS (vvRKHS) как гильбертово пространство функций, такое что для всех и

и

Это второе свойство параллельно свойству воспроизведения для скалярнозначного случая. Это определение также может быть связано с интегральными операторами, ограниченными функциями оценки и картами признаков, как мы видели для скалярнозначного RKHS. Мы можем эквивалентно определить vvRKHS как векторнозначное гильбертово пространство с ограниченным функционалом оценки и показать, что это подразумевает существование уникального воспроизводящего ядра по теореме о представлении Рисса. Теорему Мерсера также можно расширить для рассмотрения векторнозначной настройки, и поэтому мы можем получить представление карты признаков vvRKHS. Наконец, можно также показать, что замыкание диапазона совпадает с , другим свойством, аналогичным скалярнозначному случаю.

Мы можем получить интуицию для vvRKHS, взяв компонентную перспективу на эти пространства. В частности, мы обнаруживаем, что каждый vvRKHS изометрически изоморфен скалярно -значному RKHS на конкретном входном пространстве. Пусть . Рассмотрим пространство и соответствующее воспроизводящее ядро

Как отмечено выше, RKHS, связанный с этим воспроизводящим ядром, задается замыканием диапазона, где для каждого набора пар .

Связь со скалярно-значным RKHS может быть установлена ​​с помощью того факта, что каждое матрично-значное ядро ​​может быть идентифицировано с ядром вида ( 4 ) посредством

Более того, каждое ядро ​​с формой ( 4 ) определяет матрично-значное ядро ​​с приведенным выше выражением. Теперь пусть карта будет определена как

где — компонент канонического базиса для , можно показать, что является биекцией и изометрией между и .

Хотя этот взгляд на vvRKHS может быть полезен в многозадачном обучении, эта изометрия не сводит изучение векторно-значного случая к изучению скалярно-значного случая. Фактически, эта процедура изометрии может сделать как скалярно-значное ядро, так и входное пространство слишком сложными для работы на практике, поскольку свойства исходных ядер часто теряются. [11] [12] [13]

Важным классом матрично-значных воспроизводящих ядер являются сепарабельные ядра, которые могут быть факторизованы как произведение скалярно-значного ядра и -мерной симметричной положительно полуопределенной матрицы. В свете нашего предыдущего обсуждения эти ядра имеют вид

для всех в и в . Поскольку скалярное ядро ​​кодирует зависимости между входами, мы можем наблюдать, что матричное ядро ​​кодирует зависимости как между входами, так и между выходами.

Наконец, отметим, что приведенную выше теорию можно распространить и на пространства функций со значениями в функциональных пространствах, но получение ядер для этих пространств является более сложной задачей. [14]

Связь между RKHS и функцией ReLU

Функция ReLU обычно определяется как и является основой архитектуры нейронных сетей, где она используется как функция активации. Можно построить нелинейную функцию, подобную ReLU, используя теорию воспроизведения ядерных гильбертовых пространств. Ниже мы выводим эту конструкцию и показываем, как она подразумевает репрезентативную мощность нейронных сетей с активациями ReLU.

Мы будем работать с гильбертовым пространством абсолютно непрерывных функций с квадратично интегрируемой (т.е. ) производной. Оно имеет скалярное произведение

Для построения воспроизводящего ядра достаточно рассмотреть плотное подпространство, так что пусть и . Тогда основная теорема исчисления дает

где

и т.е.

Это подразумевает воспроизведение .

Более того, минимальная функция на имеет следующие представления с функцией ReLu:

Используя эту формулировку, мы можем применить теорему о представителе к RKHS, что позволяет доказать оптимальность использования активаций ReLU в настройках нейронной сети. [ необходима цитата ]

Смотрите также

Примечания

  1. ^ Алпей, Д. и Т. М. Миллс. «Семейство гильбертовых пространств, которые не воспроизводят ядерные гильбертовы пространства». J. Anal. Appl. 1.2 (2003): 107–111.
  2. ^ З. Пастернак-Виниарски, «О весах, допускающих воспроизводящее ядро ​​типа Бергмана», Международный журнал математики и математических наук , т. 15, выпуск 1, 1992.
  3. ^ Т. Л. Жинда, «О весах, допускающих воспроизводящее ядро ​​типа Сегё», Журнал современного математического анализа (Армянская академия наук), 55, 2020.
  4. ^ Окутмустурт
  5. ^ Полсон
  6. ^ Дарретт
  7. ^ Росаско
  8. ^ Росаско
  9. ^ Берлинет, Ален и Томас, Кристин. Воспроизведение ядерных гильбертовых пространств в теории вероятностей и статистике , Kluwer Academic Publishers, 2004
  10. ^ Томас-Агнан К. Вычисление семейства воспроизводящих ядер для статистических приложений. Численные алгоритмы, 13, стр. 21-32 (1996)
  11. ^ Де Вито
  12. ^ Чжан
  13. ^ Альварес
  14. ^ Росаско

Ссылки