Термин « ядро » используется в статистическом анализе для обозначения оконной функции . Термин «ядро» имеет несколько различных значений в различных областях статистики.
В статистике, особенно в байесовской статистике , ядро функции плотности вероятности (pdf) или функции массы вероятности (pmf) представляет собой форму pdf или pmf, в которой опущены любые факторы, которые не являются функциями ни одной из переменных в области. [1] Обратите внимание, что такие факторы вполне могут быть функциями параметров pdf или pmf. Эти факторы образуют часть фактора нормализации распределения вероятностей и во многих ситуациях не нужны. Например, при выборке псевдослучайных чисел большинство алгоритмов выборки игнорируют фактор нормализации. Кроме того, при байесовском анализе сопряженных априорных распределений факторы нормализации обычно игнорируются во время вычислений, и рассматривается только ядро. В конце проверяется форма ядра, и если она соответствует известному распределению, фактор нормализации может быть восстановлен. В противном случае он может быть ненужным (например, если распределение нужно только выбрать из).
Для многих распределений ядро можно записать в замкнутом виде, но не константу нормализации.
Примером является нормальное распределение . Его функция плотности вероятности равна
и связанное с ним ядро
Обратите внимание, что множитель перед экспонентой был опущен, хотя он и содержит параметр , поскольку он не является функцией доменной переменной .
Ядро воспроизводящего ядра Гильбертова пространства используется в наборе методов, известных как методы ядра, для выполнения таких задач, как статистическая классификация , регрессионный анализ и кластерный анализ данных в неявном пространстве. Такое использование особенно распространено в машинном обучении .
В непараметрической статистике ядро — это весовая функция, используемая в непараметрических методах оценки. Ядра используются в оценке плотности ядра для оценки функций плотности случайных величин или в регрессии ядра для оценки условного ожидания случайной величины. Ядра также используются во временных рядах , при использовании периодограммы для оценки спектральной плотности , где они известны как функции окна . Дополнительное использование — оценка изменяющейся во времени интенсивности для точечного процесса , где функции окна (ядра) свертываются с данными временного ряда.
Обычно при выполнении непараметрической оценки необходимо также указывать ширину ядра.
Ядро — это неотрицательная вещественная интегрируемая функция K. Для большинства приложений желательно определить функцию так, чтобы она удовлетворяла двум дополнительным требованиям:
Первое требование гарантирует, что метод оценки плотности ядра приводит к функции плотности вероятности . Второе требование гарантирует, что среднее значение соответствующего распределения равно среднему значению используемой выборки.
Если K является ядром, то таковой является и функция K *, определяемая как K *( u ) = λ K (λ u ), где λ > 0. Это можно использовать для выбора шкалы, подходящей для данных.
Обычно используются несколько типов функций ядра: равномерная, треугольная, Епанечникова, [2] четверная (двухвесовая), трикубическая, [3] трехвесовая, гауссова, квадратичная [4] и косинусная.
В таблице ниже, если задано с ограниченной опорой , то для значений u, лежащих вне опоры.