Машинное восприятие

Машинное восприятие — это способность компьютерной системы интерпретировать данные таким же образом, как люди используют свои чувства для взаимодействия с окружающим миром. ^[1]^[2]^[3] Основной метод, с помощью которого компьютеры воспринимают окружающую среду и реагируют на нее , заключается в использовании подключенного оборудования . До недавнего времени ввод данных был ограничен клавиатурой или мышью, но достижения в области технологий, как в аппаратном, так и в программном обеспечении , позволили компьютерам воспринимать сенсорную информацию так же, как это делают люди. ^[1]^[2]

Машинное восприятие позволяет компьютеру использовать этот сенсорный ввод, а также обычные вычислительные средства сбора информации , собирать информацию с большей точностью и представлять ее в более удобном для пользователя виде . ^[1] К ним относятся компьютерное зрение , машинный слух , машинное прикосновение и машинное обоняние , поскольку искусственные запахи на химическом составе , молекулярном , атомном уровне неразличимы и идентичны. ^[4]^[5]

Конечная цель машинного восприятия — дать машинам возможность видеть , чувствовать и воспринимать мир так, как это делают люди, и, следовательно, дать им возможность объяснять по -человечески, почему они принимают свои решения, предупреждать нас, когда что-то терпит неудачу. и, что более важно, причина, по которой он терпит неудачу. ^[6] Эта цель очень похожа на предполагаемые цели искусственного интеллекта в целом, за исключением того, что машинное восприятие наделяет машины лишь ограниченной чувствительностью , а не наделяет машины полным сознанием , самосознанием и интенциональностью .

Машинное зрение

Компьютерное зрение — это область, которая включает методы получения, обработки, анализа и понимания изображений и многомерных данных из реального мира для получения числовой или символической информации, например, в форме решений. Компьютерное зрение уже используется сегодня во многих приложениях, таких как распознавание лиц , географическое моделирование и даже эстетическое суждение. ^[7]

Однако машинам по-прежнему сложно точно интерпретировать визуальные данные, если они размыты и если точка зрения , с которой рассматривается стимул, часто меняется. Компьютерам также сложно определить правильную природу некоторых стимулов, если они перекрываются или плавно соприкасаются с другим стимулом. Это относится к принципу хорошего продолжения . Машины также с трудом воспринимают и записывают действие стимулов в соответствии с принципом видимого движения, который исследовали гештальт-психологи .

Машинный слух

Машинный слух, также известный как машинное прослушивание или компьютерное прослушивание , — это способность компьютера или машины воспринимать и обрабатывать звуковые данные, такие как речь или музыка. ^[8]^[9] Эта область имеет широкий спектр применения, включая запись и сжатие музыки, синтез речи и распознавание речи. ^[10] Более того, эта технология позволяет машине воспроизвести способность человеческого мозга выборочно фокусироваться на определенном звуке на фоне множества других конкурирующих звуков и фонового шума. Эта особая способность называется « слуховым анализом сцены ». Технология позволяет машине сегментировать несколько потоков, происходящих одновременно. ^[8]^[11]^[12] Многие широко используемые устройства, такие как смартфоны, голосовые переводчики и автомобили, используют ту или иную форму машинного слуха. Однако современные технологии все еще иногда сталкиваются с проблемами сегментации речи . Это значит слышать слова в предложениях, особенно если учитывать человеческий акцент.

Машинное прикосновение

Машинное осязание — это область машинного восприятия, где тактильная информация обрабатывается машиной или компьютером. Приложения включают тактильное восприятие свойств поверхности и ловкость , благодаря чему тактильная информация может обеспечить интеллектуальные рефлексы и взаимодействие с окружающей средой. ^[13] (Этого можно было бы достичь путем измерения того, когда и где возникает трение, а также его характера и интенсивности). Однако машины до сих пор не способны измерить некоторые физические переживания человека, которые мы считаем обычными, включая физическую боль. Например, ученым еще предстоит изобрести механическую замену ноцицепторам в теле и мозге, которые отвечают за распознавание и измерение физического дискомфорта и страданий человека.

Машинное обоняние

Ученые разрабатывают компьютеры, известные как машины обоняния , которые также могут распознавать и измерять запахи . Переносимые по воздуху химические вещества обнаруживаются и классифицируются с помощью устройства, иногда называемого электронным носом . ^[14]^[15]

Машинный вкус

Электронный язык – это инструмент, который измеряет и сравнивает вкусы . Согласно техническому отчету IUPAC, «электронный язык» как аналитический инструмент, включающий набор неселективных химических сенсоров с частичной специфичностью к различным компонентам раствора и соответствующий инструмент распознавания образов, способный распознавать количественный и качественный состав простых и сложных растворов. ^[16]^[17]

Химические соединения , отвечающие за вкус, обнаруживаются вкусовыми рецепторами человека . Точно так же многоэлектродные датчики электронных приборов обнаруживают одни и те же растворенные органические и неорганические соединения . Подобно человеческим рецепторам, каждый сенсор имеет спектр реакций, отличающийся от другого. Информация, предоставляемая каждым датчиком, дополняет друг друга, а комбинация результатов всех датчиков создает уникальный отпечаток пальца. Большинство порогов обнаружения сенсоров аналогичны человеческим рецепторам или превосходят их.

В биологическом механизме вкусовые сигналы преобразуются нервами головного мозга в электрические сигналы. Принцип действия датчиков электронного языка аналогичен: они генерируют электрические сигналы в виде вольтамперометрических и потенциометрических вариаций.

Восприятие и распознавание вкусовых качеств основаны на построении или распознавании мозгом активированных сенсорных нервных паттернов и вкусовых отпечатков продукта. Этот шаг достигается с помощью статистического программного обеспечения электронного языка , которое интерпретирует данные датчиков во вкусовые модели.

Будущее

Помимо перечисленных выше, некоторые из будущих препятствий, которые науке о машинном восприятии еще предстоит преодолеть, включают, помимо прочего:

- Воплощенное познание . Теория, согласно которой познание представляет собой опыт всего тела и, следовательно, может существовать и, следовательно, быть измерено и проанализировано в полной мере только в том случае, если все необходимые человеческие способности и процессы работают вместе через взаимосознающую и поддерживающую сеть систем.

- Парадокс Моравеца (см. ссылку)

- Принцип подобия - у детей раннего возраста развивается способность определять, к какой семье относится вновь введенный стимул, даже если этот стимул отличается от членов, с которыми ребенок обычно ассоциирует указанную семью. (Примером может быть ребенок, который считает, что чихуахуа — это собака и домашний питомец, а не паразит.)

- Бессознательный вывод : естественное человеческое поведение, заключающееся в определении, опасен или нет новый стимул, что это такое, а затем как к нему относиться, не требуя каких-либо новых сознательных усилий.

- Врожденная человеческая способность следовать принципу правдоподобия , чтобы со временем учиться на обстоятельствах и других людях.

- Теория распознавания по компонентам - способность мысленно анализировать и разбивать даже сложные механизмы на управляемые части, с которыми можно взаимодействовать. Например: человек видит и чашку, и части ручки, из которых состоит кружка, полная горячего какао, чтобы использовать ручку, чтобы держать кружку, чтобы не обжечься.

- Принцип свободной энергии - заблаговременное определение того, сколько энергии можно безопасно делегировать осознанию вещей вне себя без потери необходимой энергии, необходимой для поддержания своей жизни и удовлетворительного функционирования. Это позволяет обоим оптимально осознавать окружающий мир, не истощая свою энергию настолько, что они испытывают разрушительный стресс, усталость от принятия решений и / или истощение.