Функция роста , также называемая коэффициентом разрушения или числом разрушения , измеряет богатство семейства множеств или класса функций. Она особенно используется в контексте статистической теории обучения , где она применяется для изучения свойств методов статистического обучения. Термин «функция роста» был придуман Вапником и Червоненкисом в их статье 1968 года, где они также доказали многие из ее свойств. [1]
Это базовая концепция в машинном обучении . [2] [3]
Определения
Определение семейства наборов
Пусть — семейство множеств (множество множеств) и множество. Их пересечение определяется как следующее множество-семейство:
Размер пересечения (также называемый индексом ) относительно равен . Если множество содержит элементы, то индекс не превышает . Если индекс равен ровно 2 м , то говорят, что множество разбито , поскольку содержит все подмножества , то есть:
Функция роста измеряет размер как функцию от . Формально:
Определение класса гипотез
Эквивалентно, пусть будет классом гипотез (множеством бинарных функций) и множеством с элементами. Ограничение на — это множество бинарных функций на , которое может быть получено из : [3] : 45
Функция роста измеряет размер как функцию : [3] : 49
Примеры
1. Область определения — это вещественная прямая . Семейство множеств содержит все полупрямые (лучи) от заданного числа до положительной бесконечности, т. е. все множества вида для некоторого . Для любого множества вещественных чисел пересечение содержит множества: пустое множество, множество, содержащее наибольший элемент , множество, содержащее два наибольших элемента , и так далее. Следовательно: . [1] : Пример 1 То же самое верно и для случая, когда содержит открытые полупрямые, закрытые полупрямые или и то, и другое.
2. Область — это сегмент . Множество-семейство содержит все открытые множества. Для любого конечного множества действительных чисел пересечение содержит все возможные подмножества . Такие подмножества существуют , поэтому . [1] : Пример 2
3. Область — это евклидово пространство . Множество-семейство содержит все полупространства вида: , где — фиксированный вектор. Тогда , где Comp — число компонент в разбиении n-мерного пространства m гиперплоскостями . [1] : Пример 3
4. Область определения — это вещественная линия . Семейство множеств содержит все вещественные интервалы, т. е. все множества вида для некоторого . Для любого множества вещественных чисел пересечение содержит все серии от 0 до последовательных элементов . Число таких серий равно , поэтому .
Полиномиальный или экспоненциальный
Главное свойство, делающее функцию роста интересной, заключается в том, что она может быть либо полиномиальной, либо экспоненциальной — ничего промежуточного.
Следующее является свойством размера пересечения: [1] : Лем.1
- Если для некоторого набора размеров и для некоторого числа , -
- тогда существует подмножество размера такое, что .
Это подразумевает следующее свойство функции роста. [1] : Th.1
Для каждого семейства возможны два случая:
- Экспоненциальный случай : тождественно.
- Случай полинома : мажорируется по , где — наименьшее целое число, для которого .
Другие свойства
Тривиальная верхняя граница
Для любого конечного :
поскольку для каждого число элементов в не более . Поэтому функция роста в основном интересна, когда бесконечна.
Экспоненциальная верхняя граница
Для любого непустого :
То есть функция роста имеет экспоненциальную верхнюю границу.
Мы говорим, что множество-семейство разбивает множество , если их пересечение содержит все возможные подмножества , т. е . Если разбивает множество размера , то , что является верхней границей.
Декартово пересечение
Определим декартово пересечение двух семейств множеств как:
- .
Тогда: [2] : 57
Союз
Для каждых двух семейств наборов: [2] : 58
Измерение ВК
Измерение VC определяется в соответствии со следующими двумя случаями:
- В случае полинома = наибольшее целое число, для которого .
- В экспоненциальном случае .
Так что если-и-только-если .
Функцию роста можно рассматривать как уточнение концепции размерности VC. Размерность VC говорит нам только о том, равно ли или меньше , тогда как функция роста говорит нам, как именно изменяется в зависимости от .
Другая связь между функцией роста и размерностью VC задается леммой Зауэра–Шелаха : [3] : 49
- Если , то:
- для всех :
В частности,
- для всех :
- поэтому, когда размерность VC конечна, функция роста растет полиномиально с .
Эта верхняя граница точна, т.е. для всех существует с размерностью VC такое, что: [2] : 56
Энтропия
В то время как функция роста связана с максимальным размером пересечения, энтропия связана со средним размером пересечения: [1] : 272–273
Размер пересечения имеет следующее свойство. Для каждого семейства множеств :
Следовательно:
Более того, последовательность сходится к константе, когда .
Более того, случайная величина концентрируется вблизи .
Приложения в теории вероятностей
Пусть будет множеством, на котором определена вероятностная мера . Пусть будет семейством подмножеств (= семейством событий).
Предположим, что мы выбираем набор , содержащий элементы , где каждый элемент выбирается случайным образом в соответствии с мерой вероятности , независимо от других (т.е. с заменами). Для каждого события мы сравниваем следующие две величины:
- Его относительная частота в , т.е. ;
- Его вероятность .
Нас интересует разность, . Эта разность удовлетворяет следующей верхней границе:
что эквивалентно: [1] : Th.2
Другими словами: вероятность того, что для всех событий в относительная частота близка к вероятности, ограничена снизу выражением, которое зависит от функции роста .
Следствием этого является то, что если функция роста является полиномиальной по (т.е. существует такая , что ), то указанная выше вероятность стремится к 1 при . Т.е. семейство обладает равномерной сходимостью по вероятности .
Ссылки
- ^ abcdefgh Вапник, В. Н.; Червоненкис, А. Я. (1971). "О равномерной сходимости относительных частот событий к их вероятностям". Теория вероятностей и ее приложения . 16 (2): 264. doi :10.1137/1116025.Это английский перевод, сделанный Б. Секлером, русской статьи: "О равномерной сходимости относительных частот событий к их вероятностям". Докл. АН . 181 (4): 781. 1968.Перевод был воспроизведен как: Вапник, В. Н.; Червоненкис, А. Я. (2015). "О равномерной сходимости относительных частот событий к их вероятностям". Меры сложности . стр. 11. doi :10.1007/978-3-319-21852-6_3. ISBN 978-3-319-21851-9.
- ^ abcd Mohri, Mehryar ; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN 9780262018258., особенно раздел 3.2
- ^ abcd Шалев-Шварц, Шай; Бен-Дэвид, Шай (2014). Понимание машинного обучения – от теории к алгоритмам . Cambridge University Press. ISBN 9781107057135.