Нейронная сеть

Нейронная сеть — это группа взаимосвязанных единиц, называемых нейронами , которые посылают сигналы друг другу. Нейроны могут быть как биологическими клетками , так и математическими моделями . Хотя отдельные нейроны просты, многие из них вместе в сети могут выполнять сложные задачи. Существует два основных типа нейронных сетей.

В нейронауке биологическая нейронная сеть — это физическая структура, обнаруженная в мозге и сложных нервных системах — популяция нервных клеток, соединенных синапсами .
В машинном обучении искусственная нейронная сеть — это математическая модель, используемая для аппроксимации нелинейных функций . Искусственные нейронные сети используются для решения задач искусственного интеллекта .

В биологии

В контексте биологии нейронная сеть — это популяция биологических нейронов, химически связанных друг с другом синапсами . Каждый нейрон может быть связан с сотнями тысяч синапсов. ^[1] Каждый нейрон посылает и получает электрохимические сигналы, называемые потенциалами действия , от своих связанных соседей. Нейрон может выполнять возбуждающую роль, усиливая и распространяя сигналы, которые он получает, или ингибирующую роль, подавляя сигналы. ^[1]

Популяции взаимосвязанных нейронов, которые меньше нейронных сетей, называются нейронными цепями . Очень большие взаимосвязанные сети называются крупномасштабными мозговыми сетями , и многие из них вместе образуют мозг и нервную систему .

Сигналы, генерируемые нейронными сетями в мозге, в конечном итоге проходят через нервную систему и через нервно-мышечные соединения к мышечным клеткам , где они вызывают сокращение и, таким образом, движение. ^[2]

В машинном обучении

В машинном обучении нейронная сеть — это искусственная математическая модель, используемая для аппроксимации нелинейных функций. В то время как ранние искусственные нейронные сети были физическими машинами, ^[3] сегодня они почти всегда реализованы в программном обеспечении .

Нейроны в искусственной нейронной сети обычно организованы в слои, при этом информация проходит от первого слоя (входного слоя) через один или несколько промежуточных слоев ( скрытые слои ) к последнему слою (выходному слою). ^[4] «Сигнал» на входе каждого нейрона — это число, а именно линейная комбинация выходов связанных нейронов в предыдущем слое. Сигнал, который выдает каждый нейрон, вычисляется из этого числа в соответствии с его функцией активации . Поведение сети зависит от прочности (или веса ) связей между нейронами. Сеть обучается путем изменения этих весов с помощью эмпирической минимизации риска или обратного распространения , чтобы соответствовать некоторому уже существующему набору данных. ^[5]

Нейронные сети используются для решения задач в области искусственного интеллекта и, таким образом, нашли применение во многих дисциплинах, включая прогностическое моделирование , адаптивное управление , распознавание лиц , распознавание рукописного ввода , общие игровые процессы и генеративный ИИ .

История

Теоретическая база для современных нейронных сетей была независимо предложена Александром Бейном в 1873 году ^[6] и Уильямом Джеймсом в 1890 году. ^[7] Оба постулировали, что человеческое мышление возникает из взаимодействия большого количества нейронов внутри мозга. В 1949 году Дональд Хебб описал обучение Хебба , идею о том, что нейронные сети могут изменяться и обучаться с течением времени, усиливая синапс каждый раз, когда по нему проходит сигнал. ^[8]

Искусственные нейронные сети изначально использовались для моделирования биологических нейронных сетей, начиная с 1930-х годов в рамках подхода коннекционизма . Однако, начиная с изобретения персептрона , простой искусственной нейронной сети, Уорреном Маккалоком и Уолтером Питтсом в 1943 году ^[9], за которым последовала реализация ее в аппаратном обеспечении Фрэнком Розенблаттом в 1957 году ^[3] , искусственные нейронные сети стали все чаще использоваться для приложений машинного обучения и все больше отличаться от своих биологических аналогов.

Смотрите также

Ссылки

^ ab Shao, Feng; Shen, Zheng (9 января 2022 г.). «Как искусственные нейронные сети могут приблизиться к мозгу?». Front. Psychol . 13 : 970214. doi : 10.3389/fpsyg.2022.970214 . PMC 9868316. PMID 36698593 .
^ Левитан, Ирвин; Качмарек, Леонард (19 августа 2015 г.). «Межклеточная коммуникация». Нейрон: Клеточная и молекулярная биология (4-е изд.). Нью-Йорк, Нью-Йорк: Oxford University Press. С. 153–328. ISBN 978-0199773893.
^ ab Rosenblatt, F. (1958). «Персептрон: вероятностная модель хранения и организации информации в мозге». Psychological Review . 65 (6): 386–408. CiteSeerX 10.1.1.588.3775 . doi :10.1037/h0042519. PMID 13602029. S2CID 12781225.
^ Бишоп, Кристофер М. (2006-08-17). Распознавание образов и машинное обучение . Нью-Йорк: Springer. ISBN 978-0-387-31073-2.
^ Вапник, Владимир Н.; Вапник, Владимир Наумович (1998). Природа статистической теории обучения (Исправленное 2-е издание. ред.). Нью-Йорк Берлин Гейдельберг: Springer. ISBN 978-0-387-94559-0.
^ Бэйн (1873). Разум и тело: теории их взаимосвязи . Нью-Йорк: D. Appleton and Company.
^ Джеймс (1890). Принципы психологии. Нью-Йорк: H. Holt and Company.
^ Хебб, Д.О. (1949). Организация поведения . Нью-Йорк: Wiley & Sons.
^ Маккалок, В.; Питтс, В. (1943). «Логическое исчисление идей, имманентных нервной деятельности». Бюллетень математической биофизики . 5 (4): 115–133. doi :10.1007/BF02478259.