stringtranslate.com

Джуянг Вэнг

Джуянг (Джон) Вэн — китайско-американский компьютерный инженер , нейробиолог , автор и академик. Он бывший профессор кафедры компьютерных наук и инженерии Мичиганского государственного университета и президент Института мозга и разума и GENISAMA. [1]

Вэн провел исследование по обоснованному машинному обучению, пересекая компьютерную науку и инженерию , с наукой о мозге и когнитивной наукой . В совместных исследовательских работах со своими коллегами он исследовал ментальные архитектуры и вычислительные модели для автономного развития в различных областях, таких как зрение, слух, осязание, поведение и мотивационные системы, как в биологических, так и в инженерных системах. Он является автором двух книг, Natural and Artificial Intelligence: Introduction to Computational Brain-Mind и Motion and Structure from Image Sequences , и является редактором серии книг «New Frontiers in Robotics». Кроме того, он опубликовал более 300 статей.

Вэн — пожизненный член Института инженеров электротехники и электроники (IEEE), основатель и президент Института мозга и разума, а также стартапа GENISAMA. Он также является основателем и главным редактором Международного журнала гуманоидной робототехники и журнала Brain-Mind Magazine , а также ассоциированным редактором IEEE Transactions on Autonomous Mental Development (теперь Cognitive and Developmental Systems). [2] Кроме того, он был приглашенным редактором пяти специальных выпусков, включая What AI and Neuroscience Can Learn from Each Other: Open Problems in Models and Theories, Cognitive Computation , [3] The Special Issue on Brain Imaging-informed Multimodal Analysis, IEEE Transactions on Autonomous Mental Development , [4] и The Special Issue on Autonomous Mental Development, International Journal of Humanoid Robotics . [5]

Образование

Вэн получил степень бакалавра наук в Университете Фудань в 1982 году, а затем степени магистра и доктора наук в области компьютерных наук в Университете Иллинойса в Урбана-Шампейн в 1985 и 1989 годах соответственно. [6]

Карьера

После получения степени доктора философии в 1990 году Вэн начал свою академическую карьеру в качестве приглашенного доцента-исследователя в Институте Бекмана Иллинойсского университета в Урбане. С 1992 по 1998 год он занимал должность доцента в Мичиганском государственном университете, став доцентом в 1998 году и профессором в 2003 году. Сейчас на пенсии [7]

Исследовать

Исследования Вэна вращаются вокруг обоснованного машинного обучения, охватывающего зрения, слуха, понимания естественного языка, планирования и аппаратных реализаций в реальном времени . Он также участвует в передаче технологий через свой стартап GENISAMA, который фокусируется на обоснованных, возникающих, естественных, инкрементальных, закрытых черепом, внимательных, мотивированных и абстрактных системах. Его теоретический вклад включает математическое доказательство того, что разработанные им развивающиеся сети (DN) могут обучаться любым универсальным машинам Тьюринга , и создание теории автономного программирования для общих целей (APFGP), поддерживающей осознанное машинное обучение . [8] [9]

Венг работал над сетями развития от Cresceptron до DN3, чтобы достичь первого в истории алгоритма сознательного обучения, который свободен от неправильного поведения « глубокого обучения ». [10] Его исследования были представлены на Discovery Channel , Enel и BBC . [11]

Анализ движения и структуры

С 1983 по 1989 год исследовательская работа Вэна во время получения им степени магистра и доктора философии была сосредоточена на анализе движения объектов и оценке трехмерных структур из движения. [12] Он понял, что такие подходы, основанные на моделях, могут обеспечить частичные идеи, но слишком ограничены для понимания того, как мозг животных обучается зрению и другим навыкам мозга. Вскоре после получения степени доктора философии он начал работу над Cresceptron. [13]

Кресептрон

Cresceptron представлял направление, которое Вэн позже назвал Автономным Психическим Развитием (AMD). В 1992 году он и его коллеги стали пионерами в разработке фреймворка под названием Cresceptron для сегментации и распознавания реальных 3D-объектов по их изображениям с помощью автоматизированного обучения. [13] Фреймворк был протестирован на визуальное распознавание, в частности, распознавание 3D-объектов по 2D-изображениям и сегментацию их по загроможденному фону без необходимости в ручных 3D-моделях. Он использовал такие методы, как моделирование стохастических искажений, интерполяция на основе вида и сочетание индивидуальных и классовых подходов к обучению. Cresceptron достиг семи значительных достижений, включая разработку таких методов, как обучение крупномасштабных 3D-объектов с помощью глубокой сверточной нейронной сети (CNN) и независимое от признаков обучение для обширных наборов данных, среди прочего. Также было установлено, что Cresceptron существенно отличается от более поздних сетей «глубокого обучения» из-за своего подхода к разработке единственной сети с использованием обучения Хебба (т.е. без учителя во всех скрытых слоях). [14] [15]

ШОСЛИФ

Венг представил еще одну структуру под названием SHOSLIF, которая предоставила единую теорию и методологию для всестороннего обучения датчиков и исполнительных механизмов. [16] Она решала отдельные сенсорные проблемы, а также критические вопросы, с которыми сталкивается Cresceptron, такие как автоматизированный выбор наиболее ценных признаков, автоматическая организация сенсорной и управляющей информации с помощью дерева разбиения пространства от грубого к тонкому, что приводит к удивительно низкой логарифмической временной сложности для поиска на основе контента из обширных баз визуальных знаний. [17] Она также занимается обработкой инвариантности посредством обучения, обеспечивая возможность пошагового обучения в режиме онлайн и способствуя автономному обучению, среди прочих целей. [18] [19]

Роботы SAIL и Dav

С 1998 по 2010 год Вэн разработал роботов SAIL [20] и Dav [21], используя модели сенсорного картирования, включая методы самоосознающего самовоздействия (SASE), ступенчатого иерархического картирования (SHM) и инкрементальной иерархической дискриминантной регрессии (IHDR). Он применялся для распознавания закрытых объектов, [22] распознавания речи, [23] навигации, управляемой зрением, [24] и избегания столкновений на основе дальности. [25]

Автономные сети развития

С 2005 года Вэн и его команда работают над разработкой мозгоподобных и коркоподобных сетей развития (DN) и их воплощений Where-What Networks (WWN) [26] с использованием мозгоподобной архитектуры, включая пути моделирования, ламинарную 6-слойную кору и области мозга. [27] [28] Кроме того, они проанализировали, как мозг справляется с модуляцией, временем и пространством, и создали три версии (DN1–DN3) к 2023 году. Значительное усовершенствование, введенное при переходе от DN-2 к DN-3, включает инициирование сети размером с мозг из одноклеточной зиготы. Это означает полностью автономный процесс для паттернирования мозга из одной клетки. Ключевые механизмы паттернирования включают анализ компонентов долей (LCA) [29] и синаптическое поддержание, [30] которые автоматически поддерживают глобальную гладкость представления мозга и локальные уточнения представлений областей. Такой подход позволил алгоритму развития постепенно развивать сенсоры, сложный мозг и двигательные функции последовательным и самоорганизующимся образом, гарантируя, что процессы формирования связей и паттернов происходят автоматически с начальных стадий зачатия на протяжении всей жизни системы. [31]

Эти сети развития (DN) и сети «где-что» (WWN 1–9) были разработаны для универсального визуального обучения в сложных условиях. [32] DN могут распознавать объекты и самостоятельно определять, где и на чем сосредоточиться, используя самогенерируемый контекст задачи. Кроме того, эти WWN и DN были применены к зрению общего назначения, [33] распознаванию временных визуальных событий, [34] навигации, управляемой зрением, [35] обучению аудированию при обучении говорению, [36] и усвоению языка как реакции мозга на временные события текста. [37]

Вэн первым официально поднял вопрос о том, что роботизированное сознание необходимо для ИИ, сознание может и должно быть изучено (т. е. развито), и предложил полностью реализуемый алгоритм для этого. Он предложил DN3 [31] в качестве двигателя для проведения сознательного обучения [38], где робот способен становиться все более сознательным, как младенец, а затем ребенок, через свой «живой» опыт в физическом мире, который обычно включает родителей и учителей-людей. Однако в черепе DN3 нет центрального контроллера, что подчеркивает, что сознание не должно быть статически создано вручную и должно охватывать элементы, выходящие за рамки дизайна программиста. [31]

Споры

С 2016 года Вэн заявлял о случаях плагиата и неправомерных действий после отбора по всему миру, однако вовлеченные в это учреждения до сих пор не признали его обвинения.

Споры о плагиате

Вэн утверждал, что многие сети глубокого обучения, которые используют изображения 3D-объектов, скопировали свою ключевую идею из Cresceptron [13], но почти все более поздние публикации по глубокому обучению не ссылались на Cresceptron. Он подчеркнул, что Cresceptron (для 3D) сильно отличается от Neocognitron [39] (для 2D), потому что Cresceptron является фундаментальным отходом от Neocognitron. Cresceptron позволяет нейронной сети постепенно расти от иерархии с нулевым количеством нейронов и изучать 3D-объекты по их 2D-изображениям в загроможденных сценах. Это отличается от аспектных графов 1990-х годов и всех других методов, в которых центральным контроллером был человек-учитель внутри черепа. [40] Этот предполагаемый плагиат включает HMAX в MIT [41] и премию ACM Turing Award 2018. [42] Без внутреннего контроля веса, такого как ручной выбор человеком [39] [41] и обратное распространение ошибок [42] , изучение и совместное использование признаков в скрытых областях Cresceptron основаны на (неконтролируемых) механизмах Хебба . [43]

Споры после отбора

Вэн поднял вопрос о пост-отборе в ИИ и утверждал, что он представляет собой неправомерное поведение. Он указал, что многие методы ИИ требуют двух шагов на этапе обучения. Первый шаг состоит из обучения нескольких систем путем случайной подгонки подходящего набора данных. Второй шаг состоит из пост-выбора модели (пост-отбора). Пост-отбор выбирает несколько наиболее удачливых обученных систем или полагается на ручную настройку параметров человеком на основе ошибок систем в наборе данных проверки. Он утверждал, что пост-отбор в ИИ содержит два типа неправомерного поведения: (1) мошенничество при отсутствии теста, поскольку шаг пост-отбора относится к этапу обучения; (2) сокрытие плохо выглядящих данных, поскольку менее удачливые системы не были представлены. [10]

Вэн далее утверждал, что больше категорий методов ИИ пострадали от их шагов пост-отбора, таких как Neocognitron, HMAX, Deep Learning, Long Short-Term Memories , Extreme Learning Machines , Evolving Networks , Reservoir Computing , Transformers , Large Language Models , ChatGPT и Bard , до тех пор, пока они содержат шаг пост-отбора, который либо является автоматическим, либо требует ручной настройки человеком. Он математически рассуждал, что самая удачливая система на проверочном наборе дает только ожидаемую производительность на будущем тестовом наборе, которая лишь близка к средней производительности всех обученных систем на проверочном наборе. [10]

Вэн подал в суд на учреждения, чтобы решить вопрос о предполагаемом неправомерном поведении за пределами академической среды, включая Alphabet , в Окружной суд США по Западному округу Мичигана (гражданский иск № 1:22-cv-998) [44] и в Апелляционный суд США 6-го округа (гражданский иск № 23–1567). [45]

Награды и почести

Библиография

Избранные книги

Избранные статьи

Ссылки

  1. ^ «Вэн, Цзюян». www.cse.msu.edu .
  2. ^ "Институт мозга и разума: Программы". www.brain-mind-institute.org .
  3. ^ «Когнитивные вычисления». Springer .
  4. ^ "Гостевая редакционная статья Мультимодальное моделирование и анализ на основе визуализации мозга — часть I". Труды IEEE по автономному психическому развитию . 7 (3): 158–161. 2015. doi :10.1109/TAMD.2015.2495698.
  5. ^ "EDITORIAL". Международный журнал гуманоидной робототехники . 04 (2): 207–210. 1 июня 2007 г. doi :10.1142/S0219843607001047 – через CrossRef.
  6. ^ «Первый алгоритм сознательного обучения позволяет избежать ошибок, связанных с «глубоким обучением». micdat-conference.com .
  7. ^ "Школа компьютерных наук". gs.fudan.edu.cn .
  8. ^ Вэн, Цзюйян (1 августа 2020 г.). «Автономное программирование общего назначения: теория». Международный журнал гуманоидной робототехники . 17 (4): 2050016. doi :10.1142/S0219843620500164. S2CID  222069968 – через CrossRef.
  9. ^ Вэн, Цзюйян; Чжэн, Цзэцзя; У, Сян; Кастро-Гарсия, Хуан (2020). «Автономное программирование общего назначения: теория и эксперименты». Международная объединенная конференция по нейронным сетям 2020 г. (IJCNN). стр. 1–8. doi :10.1109/IJCNN48605.2020.9207149. ISBN 978-1-7281-6926-2. S2CID  221663728.
  10. ^ abc Weng, Juyang (12 января 2023 г.). «О неправомерном поведении в области «глубокого обучения». arXiv : 2211.16350 [cs.LG].
  11. ^ «BBC News - SCI/TECH - Время для настоящего интеллекта?».
  12. ^ Weng, J.; Huang, TS; Ahuja, N. (1989). «Движение и структура с двух точек зрения: алгоритмы, анализ ошибок и оценка ошибок». IEEE Transactions on Pattern Analysis and Machine Intelligence . 11 (5): 451–476. doi :10.1109/34.24779.
  13. ^ abc Weng, J.; Ahuja, N.; Huang, TS (1992). "Cresceptron: самоорганизующаяся нейронная сеть, которая растет адаптивно". [Труды 1992] IJCNN Международная объединенная конференция по нейронным сетям. Том 1. стр. 576–581. doi :10.1109/IJCNN.1992.287150. ISBN 0-7803-0559-0. S2CID  12826256.
  14. ^ Weng, JJ; Ahuja, N.; Huang, TS (1993). «Обучение распознаванию и сегментации трехмерных объектов по двумерным изображениям». 1993 (4-я) Международная конференция по компьютерному зрению. стр. 121–128. doi :10.1109/ICCV.1993.378228. ISBN 0-8186-3870-2. S2CID  8619176.
  15. ^ Вэн, Джон (Джуянг); Ахуджа, Нарендра; Хуан, Томас С. (1 ноября 1997 г.). «Обучение распознаванию и сегментации с использованием кресцептрона». Международный журнал компьютерного зрения . 25 (2): 109–143. doi :10.1023/A:1007967800668. S2CID  15774356 – через Springer Link.
  16. ^ «SHOSLIF: Структура сенсорного обучения для многомерных сложных систем».
  17. ^ Вэн, Цзюйян; Чэнь, Шаоюнь (1 октября 1998 г.). «Навигация с визуальным руководством с использованием SHOSLIF». Нейронные сети . 11 (7): 1511–1529. doi :10.1016/S0893-6080(98)00079-3. PMID  12662765 – через ScienceDirect.
  18. ^ «Кресцептрон и SHOSLIF: на пути к комплексному визуальному обучению».
  19. ^ «О комплексном визуальном обучении».
  20. ^ Yilu Zhang; Juyang Weng (2001). "Заземленное слуховое развитие с помощью развивающего робота". IJCNN'01. Международная объединенная конференция по нейронным сетям. Труды (Кат. № 01CH37222). Том 2. стр. 1059–1064. doi :10.1109/IJCNN.2001.939507. ISBN 0-7803-7044-9. S2CID  60876898.
  21. ^ Цзэн, Шуцин; Вэн, Цзюйян (1 ноября 2007 г.). «Онлайн-обучение и подход на основе внимания к избеганию препятствий с использованием дальномера». Журнал интеллектуальных и робототехнических систем . 50 (3): 219–239. doi :10.1007/s10846-007-9162-9. S2CID  17379559 – через Springer Link.
  22. ^ «Разработка сенсорного картирования для роботов» (PDF) .
  23. ^ «Аудиальное обучение: метод развития» (PDF) .
  24. ^ «Инкрементальная иерархическая дискриминантная регрессия» (PDF) .
  25. ^ «Онлайн-обучение и подход, основанный на внимании, к избеганию препятствий с использованием дальномера» (PDF) .
  26. ^ Вэн, Джуянг; Люцив, Мэтью Д. (1 ноября 2014 г.). «Сети концепций, вдохновленные мозгом: изучение концепций из загроможденных сцен». IEEE Intelligent Systems . 29 (6): 14–22. doi :10.1109/MIS.2014.75. S2CID  1827336 – через Semantic Scholar.
  27. ^ Вэн, Цзюйян (1 августа 2007 г.). «О развивающейся ментальной архитектуре». Neurocomputing . 70 (13): 2303–2323. doi :10.1016/j.neucom.2006.07.017 – через ScienceDirect.
  28. ^ Вэн, Цзюйян; Цзэн, Шуцин (1 июня 2005 г.). «Теория развивающейся ментальной архитектуры и проектирование архитектуры Dav». Международный журнал гуманоидной робототехники . 02 (2): 145–179. doi :10.1142/S0219843605000454 – через CrossRef.
  29. ^ Juyang Weng; Luciw, M. (2009). «Dually Optimal Neuronal Layers: Lobe Component Analysis». Труды IEEE по автономному психическому развитию . 1 : 68–85. doi :10.1109/TAMD.2009.2021698. S2CID  11713799.
  30. ^ Ван, Юэкай; У, Сяофэн; Вэн, Цзюйян (2011). «Поддержание синапсов в сетях Where-What». Международная объединенная конференция по нейронным сетям 2011 г. стр. 2822–2829. doi :10.1109/IJCNN.2011.6033591. ISBN 978-1-4244-9635-8. S2CID  8840080.
  31. ^ abc "Модель сети развития сознательного обучения в биологическом мозге". www.researchsquare.com . 7 июня 2022 г.
  32. ^ Solgi, Mojtaba; Weng, Juyang (1 января 2015 г.). «WWN-8: Инкрементное онлайн-стерео с формой из X с использованием больших данных за всю жизнь из нескольких модальностей». Procedia Computer Science . 53 : 316–326. doi : 10.1016/j.procs.2015.07.309 .
  33. ^ Ван, Юэкай; У, Сяофэн; Вэн, Цзюйян (1 ноября 2012 г.). «Автономное развитие с закрытым черепом: WWN-6 с использованием естественного видео». Международная объединенная конференция по нейронным сетям 2012 г. (IJCNN) . стр. 1–8. doi :10.1109/IJCNN.2012.6252491. ISBN 978-1-4673-1490-9. S2CID  2978754 – через www.academia.edu.
  34. ^ Luciw, Matthew D.; Weng, Juyang; Zeng, Shuqing (2008). «Ожидание, инициированное двигателем через связи сверху вниз как абстрактный контекст в физическом мире». 2008 7-я Международная конференция IEEE по развитию и обучению. стр. 115–120. doi :10.1109/DEVLRN.2008.4640815. ISBN 978-1-4244-2661-4. S2CID  7228.
  35. ^ Чжэн, Цзэцзя; Хэ, Се; Вэн, Цзюйян (1 января 2015 г.). «Приближение навигации в реальном мире на основе камеры с использованием распознавания объектов». Procedia Computer Science . 53 : 428–436. doi : 10.1016/j.procs.2015.07.320 .
  36. ^ У, Сян; Вэн, Цзюйян (1 ноября 2021 г.). «Учимся распознавать, обучаясь говорить: самоконтроль и развитие речевого мотора». Нейронные сети . 143 : 28–41. doi : 10.1016/j.neunet.2021.05.006. PMID  34082380 – через ScienceDirect.
  37. ^ «Развитие конъюнктивного зрительного и слухового восприятия посредством диалога в реальном времени» (PDF) .
  38. ^ Вэн, Джуян (Джон) (15 апреля 2022 г.). «Алгоритмическая теория сознательного обучения». 2022 г. 3-я Международная конференция по искусственному интеллекту в электронной инженерии . Ассоциация вычислительной техники. стр. 1–8. doi :10.1145/3512826.3512827. ISBN 9781450395489. S2CID  245851454 – через цифровую библиотеку ACM.
  39. ^ ab Fukushima, Kunihiko (1 апреля 1980 г.). «Неокогнитрон: самоорганизующаяся модель нейронной сети для механизма распознавания образов, не зависящего от смещения положения». Biological Cybernetics . 36 (4): 193–202. doi :10.1007/BF00344251. PMID  7370364. S2CID  206775608 – через Springer Link.
  40. ^ «Обучение распознаванию и сегментации с использованием крецептрона». www.cse.msu.edu .
  41. ^ ab Serre, T.; Wolf, L.; Bileschi, S.; Riesenhuber, M.; Poggio, T. (2007). «Надежное распознавание объектов с помощью механизмов, подобных коре головного мозга». Труды IEEE по анализу образов и машинному интеллекту . 29 (3): 411–426. doi :10.1109/TPAMI.2007.56. PMID  17224612. S2CID  2179592.
  42. ^ ab LeCun, Yann; Bengio, Yoshua; Hinton, Geoffrey (1 мая 2015 г.). «Глубокое обучение». Nature . 521 (7553): 436–444. Bibcode :2015Natur.521..436L. doi :10.1038/nature14539. PMID  26017442. S2CID  3074096 – через www.nature.com.
  43. ^ Вэн, Цзюйян (2021). «Пост-выборы в ИИ и как их избежать». arXiv : 2106.13233v2 [cs.LG].
  44. ^ "Венг против Nat'l Sci. Found". vLex .
  45. ^ «Джуян Венг и др. против Natl Science Fndtn и др.» Документы и документы Justia .
  46. ^ "Поиск награды NSF: Награда № 9410741 - RIA: Распознавание объектов на основе обучения по изображениям". www.nsf.gov .
  47. ^ «Член IEEE».