Обобщенный алгоритм Хебба

Обобщенный алгоритм Хеббиана ( GHA ), также известный в литературе как правило Сэнгера , представляет собой линейную нейронную сеть прямого распространения для обучения без учителя с приложениями, главным образом, в анализе главных компонентов . Впервые определенное в 1989 году ^[1] , оно похоже на правило Оджи по своей формулировке и устойчивости, за исключением того, что его можно применять к сетям с несколькими выходами. Название происходит из-за сходства алгоритма с гипотезой Дональда Хебба ^[2] о том, каким образом сила синапсов в мозге изменяется в ответ на опыт, т. е. что изменения пропорциональны корреляции между срабатыванием пре- и постсинаптические нейроны . ^[3]

Теория

ГСГ объединяет правило Оджи с процессом Грама-Шмидта , чтобы создать правило обучения вида

\,\Delta w_{ij}~=~\eta \left(y_{i}x_{j}-y_{i}\sum _{k=1}^{i}w_{kj}y_{ к}\вправо)

, ^[4]

где $w ij$ определяет синаптический вес или силу связи между $j$ -м входным и $i$ -м выходным нейронами, $x$ и $y$ — входной и выходной векторы соответственно, а $η$ — параметр скорости обучения .

Вывод

В матричной форме правило Оджи можно записать

\,{\frac {{\text{d}}w(t)}{{\text{d}}t}}~=~w(t)Q-\mathrm {diag} [w(t) )Qw(t)^{\mathrm {T} }]w(t)

и алгоритм Грама-Шмидта

\,\Delta w(t)~=~-\mathrm {lower} [w(t)w(t)^{\mathrm {T} }]w(t)

где $w (t)$ — любая матрица, в данном случае представляющая синаптические веса, $Q = η x x T$ — матрица автокорреляции, просто внешний продукт входных данных, $Diag$ — функция, которая диагонализует матрицу, а $нижняя$ — функция, которая устанавливает все элементы матрицы на диагонали или выше равны 0. Мы можем объединить эти уравнения, чтобы получить исходное правило в матричной форме:

{\ displaystyle \, \ Delta w (t) ~ = ~ \ eta (t) \ left (\ mathbf {y} (t) \ mathbf {x} (t) ^ {\ mathrm {T} } - \ mathrm { LT} [\mathbf {y} (t)\mathbf {y} (t)^{\mathrm {T} }]w(t)\right)}

где функция $LT$ устанавливает все элементы матрицы выше диагонали равными 0, и обратите внимание, что наш выход $y (t) = w (t) x (t)$ является линейным нейроном. ^[1]

Стабильность и PCA

^[5]^[6]

Приложения

ГСГ используется в приложениях, где необходима самоорганизующаяся карта или где можно использовать анализ функций или основных компонентов . Примеры таких случаев включают искусственный интеллект и обработку речи и изображений.

Его важность обусловлена тем фактом, что обучение представляет собой одноуровневый процесс, то есть синаптический вес меняется только в зависимости от реакции входов и выходов этого слоя, что позволяет избежать многоуровневой зависимости, связанной с алгоритмом обратного распространения ошибки . Он также имеет простой и предсказуемый компромисс между скоростью обучения и точностью сходимости, заданный параметром скорости обучения $η$ . ^[5]

Обобщенный алгоритм Хебба

Теория

Вывод

Стабильность и PCA

Приложения

Смотрите также

Рекомендации