Машинное восприятие — это способность компьютерной системы интерпретировать данные таким же образом, как люди используют свои чувства для взаимодействия с окружающим миром. [1] [2] [3] Основной метод, с помощью которого компьютеры воспринимают окружающую среду и реагируют на нее , заключается в использовании подключенного оборудования . До недавнего времени ввод данных был ограничен клавиатурой или мышью, но достижения в области технологий, как в аппаратном, так и в программном обеспечении , позволили компьютерам воспринимать сенсорную информацию так же, как это делают люди. [1] [2]
Машинное восприятие позволяет компьютеру использовать этот сенсорный ввод, а также обычные вычислительные средства сбора информации , собирать информацию с большей точностью и представлять ее в более удобном для пользователя виде . [1] К ним относятся компьютерное зрение , машинный слух , машинное прикосновение и машинное обоняние , поскольку искусственные запахи на химическом составе , молекулярном , атомном уровне неразличимы и идентичны. [4] [5]
Конечная цель машинного восприятия — дать машинам возможность видеть , чувствовать и воспринимать мир так, как это делают люди, и, следовательно, дать им возможность объяснять по -человечески, почему они принимают свои решения, предупреждать нас, когда что-то терпит неудачу. и, что более важно, причина, по которой он терпит неудачу. [6] Эта цель очень похожа на предполагаемые цели искусственного интеллекта в целом, за исключением того, что машинное восприятие наделяет машины лишь ограниченной чувствительностью , а не наделяет машины полным сознанием , самосознанием и интенциональностью .
Компьютерное зрение — это область, которая включает методы получения, обработки, анализа и понимания изображений и многомерных данных из реального мира для получения числовой или символической информации, например, в форме решений. Компьютерное зрение уже используется сегодня во многих приложениях, таких как распознавание лиц , географическое моделирование и даже эстетическое суждение. [7]
Однако машинам по-прежнему сложно точно интерпретировать визуальные данные, если они размыты и если точка зрения , с которой рассматривается стимул, часто меняется. Компьютерам также сложно определить правильную природу некоторых стимулов, если они перекрываются или плавно соприкасаются с другим стимулом. Это относится к принципу хорошего продолжения . Машины также с трудом воспринимают и записывают действие стимулов в соответствии с принципом видимого движения, который исследовали гештальт-психологи .
Машинный слух, также известный как машинное прослушивание или компьютерное прослушивание , — это способность компьютера или машины воспринимать и обрабатывать звуковые данные, такие как речь или музыка. [8] [9] Эта область имеет широкий спектр применения, включая запись и сжатие музыки, синтез речи и распознавание речи. [10] Более того, эта технология позволяет машине воспроизвести способность человеческого мозга выборочно фокусироваться на определенном звуке на фоне множества других конкурирующих звуков и фонового шума. Эта особая способность называется « слуховым анализом сцены ». Технология позволяет машине сегментировать несколько потоков, происходящих одновременно. [8] [11] [12] Многие широко используемые устройства, такие как смартфоны, голосовые переводчики и автомобили, используют ту или иную форму машинного слуха. Однако современные технологии все еще иногда сталкиваются с проблемами сегментации речи . Это значит слышать слова в предложениях, особенно если учитывать человеческий акцент.
Машинное осязание — это область машинного восприятия, где тактильная информация обрабатывается машиной или компьютером. Приложения включают тактильное восприятие свойств поверхности и ловкость , благодаря чему тактильная информация может обеспечить интеллектуальные рефлексы и взаимодействие с окружающей средой. [13] (Этого можно было бы достичь путем измерения того, когда и где возникает трение, а также его характера и интенсивности). Однако машины до сих пор не способны измерить некоторые физические переживания человека, которые мы считаем обычными, включая физическую боль. Например, ученым еще предстоит изобрести механическую замену ноцицепторам в теле и мозге, которые отвечают за распознавание и измерение физического дискомфорта и страданий человека.
Ученые разрабатывают компьютеры, известные как машины обоняния , которые также могут распознавать и измерять запахи . Переносимые по воздуху химические вещества обнаруживаются и классифицируются с помощью устройства, иногда называемого электронным носом . [14] [15]
Электронный язык – это инструмент, который измеряет и сравнивает вкусы . Согласно техническому отчету IUPAC, «электронный язык» как аналитический инструмент, включающий набор неселективных химических сенсоров с частичной специфичностью к различным компонентам раствора и соответствующий инструмент распознавания образов, способный распознавать количественный и качественный состав простых и сложных растворов. [16] [17]
Химические соединения , отвечающие за вкус, обнаруживаются вкусовыми рецепторами человека . Точно так же многоэлектродные датчики электронных приборов обнаруживают одни и те же растворенные органические и неорганические соединения . Подобно человеческим рецепторам, каждый сенсор имеет спектр реакций, отличающийся от другого. Информация, предоставляемая каждым датчиком, дополняет друг друга, а комбинация результатов всех датчиков создает уникальный отпечаток пальца. Большинство порогов обнаружения сенсоров аналогичны человеческим рецепторам или превосходят их.
В биологическом механизме вкусовые сигналы преобразуются нервами головного мозга в электрические сигналы. Принцип действия датчиков электронного языка аналогичен: они генерируют электрические сигналы в виде вольтамперометрических и потенциометрических вариаций.
Восприятие и распознавание вкусовых качеств основаны на построении или распознавании мозгом активированных сенсорных нервных паттернов и вкусовых отпечатков продукта. Этот шаг достигается с помощью статистического программного обеспечения электронного языка , которое интерпретирует данные датчиков во вкусовые модели.Помимо перечисленных выше, некоторые из будущих препятствий, которые науке о машинном восприятии еще предстоит преодолеть, включают, помимо прочего:
- Воплощенное познание . Теория, согласно которой познание представляет собой опыт всего тела и, следовательно, может существовать и, следовательно, быть измерено и проанализировано в полной мере только в том случае, если все необходимые человеческие способности и процессы работают вместе через взаимосознающую и поддерживающую сеть систем.
- Парадокс Моравеца (см. ссылку)
- Принцип подобия - у детей раннего возраста развивается способность определять, к какой семье относится вновь введенный стимул, даже если этот стимул отличается от членов, с которыми ребенок обычно ассоциирует указанную семью. (Примером может быть ребенок, который считает, что чихуахуа — это собака и домашний питомец, а не паразит.)
- Бессознательный вывод : естественное человеческое поведение, заключающееся в определении, опасен или нет новый стимул, что это такое, а затем как к нему относиться, не требуя каких-либо новых сознательных усилий.
- Врожденная человеческая способность следовать принципу правдоподобия , чтобы со временем учиться на обстоятельствах и других людях.
- Теория распознавания по компонентам - способность мысленно анализировать и разбивать даже сложные механизмы на управляемые части, с которыми можно взаимодействовать. Например: человек видит и чашку, и части ручки, из которых состоит кружка, полная горячего какао, чтобы использовать ручку, чтобы держать кружку, чтобы не обжечься.
- Принцип свободной энергии - заблаговременное определение того, сколько энергии можно безопасно делегировать осознанию вещей вне себя без потери необходимой энергии, необходимой для поддержания своей жизни и удовлетворительного функционирования. Это позволяет обоим оптимально осознавать окружающий мир, не истощая свою энергию настолько, что они испытывают разрушительный стресс, усталость от принятия решений и / или истощение.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка )