Машинное восприятие

Машинное восприятие — это способность компьютерной системы интерпретировать данные способом, аналогичным тому, как люди используют свои чувства для связи с окружающим миром. ^[1]^[2]^[3] Основной метод, с помощью которого компьютеры воспринимают окружающую среду и реагируют на нее, — это подключенное оборудование . До недавнего времени ввод данных ограничивался клавиатурой или мышью, но достижения в области технологий, как в области аппаратного обеспечения, так и программного обеспечения , позволили компьютерам воспринимать сенсорные данные способом, аналогичным человеку. ^[1]^[2]

Машинное восприятие позволяет компьютеру использовать этот сенсорный ввод, а также обычные вычислительные средства сбора информации , чтобы собирать информацию с большей точностью и представлять ее в более удобном для пользователя виде . ^[1] К ним относятся машинное зрение , машинный слух , машинное осязание и машинное обоняние , поскольку искусственные запахи на химическом соединении , молекулярном , атомном уровне неразличимы и идентичны. ^[4]^[5]

Конечная цель машинного восприятия — дать машинам возможность видеть , чувствовать и воспринимать мир так же, как это делают люди, и, следовательно, иметь возможность объяснять по-человечески, почему они принимают свои решения, предупреждать нас, когда что-то не получается, и, что более важно, объяснять причину, по которой это происходит. ^[6] Эта цель очень похожа на предлагаемые цели для искусственного интеллекта в целом, за исключением того, что машинное восприятие предоставило бы машинам лишь ограниченную чувствительность , а не наделило бы машины полным сознанием , самосознанием и преднамеренностью .

Машинное зрение

Компьютерное зрение — это область, которая включает методы получения, обработки, анализа и понимания изображений и многомерных данных из реального мира для получения числовой или символической информации, например, в форме решений. Компьютерное зрение имеет много приложений, которые уже используются сегодня, такие как распознавание лиц , географическое моделирование и даже эстетическое суждение. ^[7]

Однако машины все еще испытывают трудности с точной интерпретацией визуального воздействия, если указанное воздействие размыто и если точка обзора , с которой рассматривается стимул, часто меняется. Компьютеры также испытывают трудности с определением надлежащей природы некоторого стимула, если он перекрывается или плавно касается другого стимула. Это относится к принципу хорошего продолжения . Машины также испытывают трудности с восприятием и записью стимула, функционирующего в соответствии с принципом видимого движения, который исследовали гештальт-психологи .

Машинный слух

Машинный слух, также известный как машинное прослушивание или компьютерное прослушивание , — это способность компьютера или машины воспринимать и обрабатывать звуковые данные, такие как речь или музыка. ^[8]^[9] Эта область имеет широкий спектр применения, включая запись и сжатие музыки, синтез речи и распознавание речи . ^[10] Более того, эта технология позволяет машине воспроизводить способность человеческого мозга выборочно фокусироваться на определенном звуке среди множества других конкурирующих звуков и фонового шума. Эта конкретная способность называется « анализом слуховой сцены ». Технология позволяет машине сегментировать несколько потоков, происходящих одновременно. ^[8]^[11]^[12] Многие широко используемые устройства, такие как смартфоны, голосовые переводчики и автомобили, используют ту или иную форму машинного слуха. Однако современная технология все еще иногда испытывает трудности с сегментацией речи . Это означает прослушивание слов в предложениях, особенно с учетом человеческого акцента.

Машинное касание

Машинное касание — это область машинного восприятия, где тактильная информация обрабатывается машиной или компьютером. Приложения включают тактильное восприятие свойств поверхности и ловкость , посредством чего тактильная информация может обеспечивать интеллектуальные рефлексы и взаимодействие с окружающей средой. ^[13] (Это, возможно, можно сделать путем измерения того, когда и где происходит трение, а также характера и интенсивности трения). Однако у машин до сих пор нет способа измерения некоторых физических человеческих переживаний, которые мы считаем обычными, включая физическую боль. Например, ученым еще предстоит изобрести механическую замену ноцицепторам в теле и мозге, которые отвечают за обнаружение и измерение физического дискомфорта и страданий человека.

Машинное обоняние

Ученые разрабатывают компьютеры, известные как машинное обоняние , которые также могут распознавать и измерять запахи . Химикаты в воздухе обнаруживаются и классифицируются с помощью устройства, иногда называемого электронным носом . ^[14]^[15]

Машинный вкус

Электронный язык — это инструмент, который измеряет и сравнивает вкусы . Согласно техническому отчету ИЮПАК, «электронный язык» как аналитический инструмент, включающий массив неселективных химических сенсоров с частичной специфичностью к различным компонентам раствора и соответствующий инструмент распознавания образов, способный распознавать количественные и качественные составы простых и сложных растворов ^[16]^[17]

Химические соединения, отвечающие за вкус, обнаруживаются вкусовыми рецепторами человека . Аналогично, многоэлектродные датчики электронных приборов обнаруживают те же самые растворенные органические и неорганические соединения . Как и человеческие рецепторы, каждый датчик имеет спектр реакций, отличный от другого. Информация, предоставляемая каждым датчиком, является дополнительной, а комбинация результатов всех датчиков создает уникальный отпечаток. Большинство порогов обнаружения датчиков аналогичны или лучше, чем у человеческих рецепторов.

В биологическом механизме вкусовые сигналы преобразуются нервами в мозге в электрические сигналы. Процесс сенсоров электронного языка похож: они генерируют электрические сигналы как вольтамперометрические и потенциометрические изменения.

Восприятие и распознавание вкусовых качеств основаны на построении или распознавании активированных сенсорных нервных паттернов мозгом и вкусового отпечатка продукта. Этот шаг достигается статистическим программным обеспечением электронного языка , которое интерпретирует данные сенсора во вкусовые паттерны.

Будущее

Помимо перечисленных выше, некоторые из будущих препятствий, которые науке машинного восприятия еще предстоит преодолеть, включают в себя, среди прочего:

- Воплощенное познание - теория о том, что познание представляет собой полноценный телесный опыт и, следовательно, может существовать, а следовательно, быть измерено и проанализировано в полном объеме только в том случае, если все необходимые человеческие способности и процессы работают сообща через сеть взаимно осознающих и поддерживающих систем.

- Парадокс Моравеца (см. ссылку)

- Принцип подобия - развивающаяся у маленьких детей способность определять, к какой семье относится вновь введенный стимул, даже если этот стимул отличается от членов, с которыми ребенок обычно ассоциирует данную семью. (Примером может служить ребенок, полагающий, что чихуахуа - это собака и домашний питомец, а не вредитель.)

- Бессознательный вывод : естественное поведение человека, заключающееся в определении того, опасен ли новый стимул или нет, что это такое и как к нему относиться, не требуя при этом никаких новых сознательных усилий.

- Врожденная способность человека следовать принципу вероятности , чтобы со временем извлекать уроки из обстоятельств и других людей.

- Теория распознавания по компонентам - способность мысленно анализировать и разбивать даже сложные механизмы на управляемые части, с которыми можно взаимодействовать. Например: человек видит как чашку, так и части ручки, составляющие кружку, полную горячего какао, чтобы использовать ручку, чтобы держать кружку и не обжечься.

- Принцип свободной энергии - определение задолго до того, сколько энергии человек может безопасно делегировать на осознание вещей вне себя без потери необходимой энергии, которая требуется для поддержания жизни и удовлетворительного функционирования. Это позволяет человеку оптимально осознавать мир вокруг себя, не истощая свою энергию настолько, чтобы испытывать разрушительный стресс, усталость от принятия решений и/или истощение.

Смотрите также

Ссылки

^ abcd Малкольм Татум (3 октября 2012 г.). «Что такое машинное восприятие».
^ abc Александр Серов (29 января 2013 г.). «Субъективная реальность и сильный искусственный интеллект». arXiv : 1301.6359 [cs.AI].
^ "Лаборатория машинного восприятия и когнитивной робототехники". www.ccs.fau.edu . Получено 18.06.2016 .
^ Cotton2009-03-01T00:00:00+00:00, Саймон. "Если пахнет - это химия". RSC Education . Получено 2022-05-03 .{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ «Искусственные сети учатся пахнуть как мозг». Новости MIT | Массачусетский технологический институт . Получено 2022-05-03 .
^ "Machine Perception Research - ECE - Virginia Tech". www.ECE.VT.edu . Архивировано из оригинала 7 марта 2021 г. . Получено 10 января 2018 г. .
^ аб Дхар, Сагник; Ордонес, Висенте; Берг, Тамара Л. (2011). «Описываемые атрибуты высокого уровня для прогнозирования эстетики и интересности» (PDF) . ЦВПР 2011 . стр. 1657–1664. дои : 10.1109/CVPR.2011.5995467. hdl : 1951/55408. ISBN 978-1-4577-0394-2. S2CID 14609200.
^ ab Tanguiane ( Tangian ), Andranick (1993). Искусственное восприятие и распознавание музыки . Берлин-Гейдельберг: Springer.
^ Тангян (Tangian), Андраник (1994). «Принцип корреляции восприятия и его применение к распознаванию музыки». Music Perception . 11 (4): 465–502. doi :10.2307/40285634. JSTOR 40285634.
^ ab Lyon, Richard (2010). «Машинный слух: развивающаяся область [Исследовательская цифровая обработка сигналов]. Журнал обработки сигналов IEEE . 27 (5): 131–139. Bibcode : 2010ISPM...27..131L. doi : 10.1109/MSP.2010.937498. S2CID 13143070.
^ Тангиан, Андраник (2001). «Как мы думаем: моделирование взаимодействия памяти и мышления». Когнитивная обработка . 2 : 117–151. doi :10.5445/IR/1000133287. S2CID 237995668.
^ "Лаборатория машинного восприятия и когнитивной робототехники". ccs.FAU.edu . Получено 10 января 2018 г. .
^ Fleer, S.; Moringen, A.; Klatzky, RL; Ritter, H. (2020). «Обучение эффективному исследованию тактильной формы с помощью жесткой матрицы тактильных датчиков», S. Fleer, A. Moringen, R. Klatzky, H. Ritter». PLOS ONE . 15 (1): e0226880. doi : 10.1371/journal.pone.0226880 . PMC 6940144 . PMID 31896135.
^ «Использование искусственного интеллекта для обоняния роз: исследование применяет машинное обучение к обонянию с возможным широким применением в области ароматизаторов и отдушек». ScienceDaily . Получено 03.05.2022 .
^ Марр, Бернард. «Искусственный интеллект развивает обоняние: что может означать цифровой нос на практике?». Forbes . Получено 03.05.2022 .
^ Власов, Ю; Легин А.; Рудницкая А.; Натале, К. Ди; Д'Амико, А. (1 января 2005 г.). «Неспецифические сенсорные матрицы («электронный язык») для химического анализа жидкостей (Технический отчет ИЮПАК)». Чистая и прикладная химия . 77 (11): 1965–1983. дои : 10.1351/pac200577111965 . ISSN 0033-4545. S2CID 109659409.
^ Халилиан, Алиреза; Хан, Мд. Раджибур Рахаман; Канг, Шин-Вон (2017). «Высокочувствительный и широкодиапазонный полированный волоконно-оптический датчик вкуса». Датчики и приводы B: Химические . 249 : 700–707. doi :10.1016/j.snb.2017.04.088.
^ Турк, Мэтью (2000). «Перцептивные медиа: машинное восприятие и взаимодействие человека с компьютером» (PDF) . Китайский журнал компьютеров . 12 .страницы 1235-1244