Машинное восприятие — это способность компьютерной системы интерпретировать данные способом, аналогичным тому, как люди используют свои чувства для связи с окружающим миром. [1] [2] [3] Основной метод, с помощью которого компьютеры воспринимают окружающую среду и реагируют на нее, — это подключенное оборудование . До недавнего времени ввод данных ограничивался клавиатурой или мышью, но достижения в области технологий, как в области аппаратного обеспечения, так и программного обеспечения , позволили компьютерам воспринимать сенсорные данные способом, аналогичным человеку. [1] [2]
Машинное восприятие позволяет компьютеру использовать этот сенсорный ввод, а также обычные вычислительные средства сбора информации , чтобы собирать информацию с большей точностью и представлять ее в более удобном для пользователя виде . [1] К ним относятся машинное зрение , машинный слух , машинное осязание и машинное обоняние , поскольку искусственные запахи на химическом соединении , молекулярном , атомном уровне неразличимы и идентичны. [4] [5]
Конечная цель машинного восприятия — дать машинам возможность видеть , чувствовать и воспринимать мир так же, как это делают люди, и, следовательно, иметь возможность объяснять по-человечески, почему они принимают свои решения, предупреждать нас, когда что-то не получается, и, что более важно, объяснять причину, по которой это происходит. [6] Эта цель очень похожа на предлагаемые цели для искусственного интеллекта в целом, за исключением того, что машинное восприятие предоставило бы машинам лишь ограниченную чувствительность , а не наделило бы машины полным сознанием , самосознанием и преднамеренностью .
Компьютерное зрение — это область, которая включает методы получения, обработки, анализа и понимания изображений и многомерных данных из реального мира для получения числовой или символической информации, например, в форме решений. Компьютерное зрение имеет много приложений, которые уже используются сегодня, такие как распознавание лиц , географическое моделирование и даже эстетическое суждение. [7]
Однако машины все еще испытывают трудности с точной интерпретацией визуального воздействия, если указанное воздействие размыто и если точка обзора , с которой рассматривается стимул, часто меняется. Компьютеры также испытывают трудности с определением надлежащей природы некоторого стимула, если он перекрывается или плавно касается другого стимула. Это относится к принципу хорошего продолжения . Машины также испытывают трудности с восприятием и записью стимула, функционирующего в соответствии с принципом видимого движения, который исследовали гештальт-психологи .
Машинный слух, также известный как машинное прослушивание или компьютерное прослушивание , — это способность компьютера или машины воспринимать и обрабатывать звуковые данные, такие как речь или музыка. [8] [9] Эта область имеет широкий спектр применения, включая запись и сжатие музыки, синтез речи и распознавание речи . [10] Более того, эта технология позволяет машине воспроизводить способность человеческого мозга выборочно фокусироваться на определенном звуке среди множества других конкурирующих звуков и фонового шума. Эта конкретная способность называется « анализом слуховой сцены ». Технология позволяет машине сегментировать несколько потоков, происходящих одновременно. [8] [11] [12] Многие широко используемые устройства, такие как смартфоны, голосовые переводчики и автомобили, используют ту или иную форму машинного слуха. Однако современная технология все еще иногда испытывает трудности с сегментацией речи . Это означает прослушивание слов в предложениях, особенно с учетом человеческого акцента.
Машинное касание — это область машинного восприятия, где тактильная информация обрабатывается машиной или компьютером. Приложения включают тактильное восприятие свойств поверхности и ловкость , посредством чего тактильная информация может обеспечивать интеллектуальные рефлексы и взаимодействие с окружающей средой. [13] (Это, возможно, можно сделать путем измерения того, когда и где происходит трение, а также характера и интенсивности трения). Однако у машин до сих пор нет способа измерения некоторых физических человеческих переживаний, которые мы считаем обычными, включая физическую боль. Например, ученым еще предстоит изобрести механическую замену ноцицепторам в теле и мозге, которые отвечают за обнаружение и измерение физического дискомфорта и страданий человека.
Ученые разрабатывают компьютеры, известные как машинное обоняние , которые также могут распознавать и измерять запахи . Химикаты в воздухе обнаруживаются и классифицируются с помощью устройства, иногда называемого электронным носом . [14] [15]
Электронный язык — это инструмент, который измеряет и сравнивает вкусы . Согласно техническому отчету ИЮПАК, «электронный язык» как аналитический инструмент, включающий массив неселективных химических сенсоров с частичной специфичностью к различным компонентам раствора и соответствующий инструмент распознавания образов, способный распознавать количественные и качественные составы простых и сложных растворов [16] [17]
Химические соединения, отвечающие за вкус, обнаруживаются вкусовыми рецепторами человека . Аналогично, многоэлектродные датчики электронных приборов обнаруживают те же самые растворенные органические и неорганические соединения . Как и человеческие рецепторы, каждый датчик имеет спектр реакций, отличный от другого. Информация, предоставляемая каждым датчиком, является дополнительной, а комбинация результатов всех датчиков создает уникальный отпечаток. Большинство порогов обнаружения датчиков аналогичны или лучше, чем у человеческих рецепторов.
В биологическом механизме вкусовые сигналы преобразуются нервами в мозге в электрические сигналы. Процесс сенсоров электронного языка похож: они генерируют электрические сигналы как вольтамперометрические и потенциометрические изменения.
Восприятие и распознавание вкусовых качеств основаны на построении или распознавании активированных сенсорных нервных паттернов мозгом и вкусового отпечатка продукта. Этот шаг достигается статистическим программным обеспечением электронного языка , которое интерпретирует данные сенсора во вкусовые паттерны.Помимо перечисленных выше, некоторые из будущих препятствий, которые науке машинного восприятия еще предстоит преодолеть, включают в себя, среди прочего:
- Воплощенное познание - теория о том, что познание представляет собой полноценный телесный опыт и, следовательно, может существовать, а следовательно, быть измерено и проанализировано в полном объеме только в том случае, если все необходимые человеческие способности и процессы работают сообща через сеть взаимно осознающих и поддерживающих систем.
- Парадокс Моравеца (см. ссылку)
- Принцип подобия - развивающаяся у маленьких детей способность определять, к какой семье относится вновь введенный стимул, даже если этот стимул отличается от членов, с которыми ребенок обычно ассоциирует данную семью. (Примером может служить ребенок, полагающий, что чихуахуа - это собака и домашний питомец, а не вредитель.)
- Бессознательный вывод : естественное поведение человека, заключающееся в определении того, опасен ли новый стимул или нет, что это такое и как к нему относиться, не требуя при этом никаких новых сознательных усилий.
- Врожденная способность человека следовать принципу вероятности , чтобы со временем извлекать уроки из обстоятельств и других людей.
- Теория распознавания по компонентам - способность мысленно анализировать и разбивать даже сложные механизмы на управляемые части, с которыми можно взаимодействовать. Например: человек видит как чашку, так и части ручки, составляющие кружку, полную горячего какао, чтобы использовать ручку, чтобы держать кружку и не обжечься.
- Принцип свободной энергии - определение задолго до того, сколько энергии человек может безопасно делегировать на осознание вещей вне себя без потери необходимой энергии, которая требуется для поддержания жизни и удовлетворительного функционирования. Это позволяет человеку оптимально осознавать мир вокруг себя, не истощая свою энергию настолько, чтобы испытывать разрушительный стресс, усталость от принятия решений и/или истощение.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка )