stringtranslate.com

Функция роста

Функция роста , также называемая коэффициентом разрушения или числом разрушения , измеряет богатство семейства множеств или класса функций. Она особенно используется в контексте статистической теории обучения , где она применяется для изучения свойств методов статистического обучения. Термин «функция роста» был придуман Вапником и Червоненкисом в их статье 1968 года, где они также доказали многие из ее свойств. [1] Это базовая концепция в машинном обучении . [2] [3]

Определения

Определение семейства наборов

Пусть — семейство множеств (множество множеств) и множество. Их пересечение определяется как следующее множество-семейство:

Размер пересечения (также называемый индексом ) относительно равен . Если множество содержит элементы, то индекс не превышает . Если индекс равен ровно 2 м , то говорят, что множество разбито , поскольку содержит все подмножества , то есть:

Функция роста измеряет размер как функцию от . Формально:

Определение класса гипотез

Эквивалентно, пусть будет классом гипотез (множеством бинарных функций) и множеством с элементами. Ограничение на — это множество бинарных функций на , которое может быть получено из : [3] : 45 

Функция роста измеряет размер как функцию : [3] : 49 

Примеры

1. Область определения — это вещественная прямая . Семейство множеств содержит все полупрямые (лучи) от заданного числа до положительной бесконечности, т. е. все множества вида для некоторого . Для любого множества вещественных чисел пересечение содержит множества: пустое множество, множество, содержащее наибольший элемент , множество, содержащее два наибольших элемента , и так далее. Следовательно: . [1] : Пример 1  То же самое верно и для случая, когда содержит открытые полупрямые, закрытые полупрямые или и то, и другое.

2. Область — это сегмент . Множество-семейство содержит все открытые множества. Для любого конечного множества действительных чисел пересечение содержит все возможные подмножества . Такие подмножества существуют , поэтому . [1] : Пример 2 

3. Область — это евклидово пространство . Множество-семейство содержит все полупространства вида: , где — фиксированный вектор. Тогда , где Comp — число компонент в разбиении n-мерного пространства m гиперплоскостями . [1] : Пример 3 

4. Область определения — это вещественная линия . Семейство множеств содержит все вещественные интервалы, т. е. все множества вида для некоторого . Для любого множества вещественных чисел пересечение содержит все серии от 0 до последовательных элементов . Число таких серий равно , поэтому .

Полиномиальный или экспоненциальный

Главное свойство, делающее функцию роста интересной, заключается в том, что она может быть либо полиномиальной, либо экспоненциальной — ничего промежуточного.

Следующее является свойством размера пересечения: [1] : Лем.1 

Это подразумевает следующее свойство функции роста. [1] : Th.1  Для каждого семейства возможны два случая:

Другие свойства

Тривиальная верхняя граница

Для любого конечного :

поскольку для каждого число элементов в не более . Поэтому функция роста в основном интересна, когда бесконечна.

Экспоненциальная верхняя граница

Для любого непустого :

То есть функция роста имеет экспоненциальную верхнюю границу.

Мы говорим, что множество-семейство разбивает множество , если их пересечение содержит все возможные подмножества , т. е . Если разбивает множество размера , то , что является верхней границей.

Декартово пересечение

Определим декартово пересечение двух семейств множеств как:

.

Тогда: [2] : 57 

Союз

Для каждых двух семейств наборов: [2] : 58 

Измерение ВК

Измерение VC определяется в соответствии со следующими двумя случаями:

Так что если-и-только-если .

Функцию роста можно рассматривать как уточнение концепции размерности VC. Размерность VC говорит нам только о том, равно ли или меньше , тогда как функция роста говорит нам, как именно изменяется в зависимости от .

Другая связь между функцией роста и размерностью VC задается леммой Зауэра–Шелаха : [3] : 49 

Если , то:
для всех :

В частности,

для всех :
поэтому, когда размерность VC конечна, функция роста растет полиномиально с .

Эта верхняя граница точна, т.е. для всех существует с размерностью VC такое, что: [2] : 56 

Энтропия

В то время как функция роста связана с максимальным размером пересечения, энтропия связана со средним размером пересечения: [1] : 272–273 

Размер пересечения имеет следующее свойство. Для каждого семейства множеств :

Следовательно:

Более того, последовательность сходится к константе, когда .

Более того, случайная величина концентрируется вблизи .

Приложения в теории вероятностей

Пусть будет множеством, на котором определена вероятностная мера . Пусть будет семейством подмножеств (= семейством событий).

Предположим, что мы выбираем набор , содержащий элементы , где каждый элемент выбирается случайным образом в соответствии с мерой вероятности , независимо от других (т.е. с заменами). Для каждого события мы сравниваем следующие две величины:

Нас интересует разность, . Эта разность удовлетворяет следующей верхней границе:

что эквивалентно: [1] : Th.2 

Другими словами: вероятность того, что для всех событий в относительная частота близка к вероятности, ограничена снизу выражением, которое зависит от функции роста .

Следствием этого является то, что если функция роста является полиномиальной по (т.е. существует такая , что ), то указанная выше вероятность стремится к 1 при . Т.е. семейство обладает равномерной сходимостью по вероятности .

Ссылки

  1. ^ abcdefgh Вапник, В. Н.; Червоненкис, А. Я. (1971). "О равномерной сходимости относительных частот событий к их вероятностям". Теория вероятностей и ее приложения . 16 (2): 264. doi :10.1137/1116025.Это английский перевод, сделанный Б. Секлером, русской статьи: "О равномерной сходимости относительных частот событий к их вероятностям". Докл. АН . 181 (4): 781. 1968.Перевод был воспроизведен как: Вапник, В. Н.; Червоненкис, А. Я. (2015). "О равномерной сходимости относительных частот событий к их вероятностям". Меры сложности . стр. 11. doi :10.1007/978-3-319-21852-6_3. ISBN 978-3-319-21851-9.
  2. ^ abcd Mohri, Mehryar ; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN 9780262018258., особенно раздел 3.2
  3. ^ abcd Шалев-Шварц, Шай; Бен-Дэвид, Шай (2014). Понимание машинного обучения – от теории к алгоритмам . Cambridge University Press. ISBN 9781107057135.