Машинное зрение — это технология и методы, используемые для обеспечения автоматического осмотра и анализа на основе изображений для таких приложений, как автоматический осмотр, управление процессами и управление роботами, обычно в промышленности. Машинное зрение относится ко многим технологиям, программным и аппаратным продуктам, интегрированным системам, действиям, методам и экспертизе. Машинное зрение как дисциплина системной инженерии можно считать отличной от компьютерного зрения , формы компьютерной науки . Оно пытается интегрировать существующие технологии новыми способами и применять их для решения реальных проблем. Этот термин является преобладающим для этих функций в средах промышленной автоматизации, но также используется для этих функций в других средах управления транспортными средствами.
Общий процесс машинного зрения включает планирование деталей требований и проекта, а затем создание решения. Во время выполнения процесс начинается с визуализации, за которой следует автоматизированный анализ изображения и извлечение необходимой информации.
Определения термина «машинное зрение» различаются, но все они включают технологию и методы, используемые для извлечения информации из изображения на автоматизированной основе, в отличие от обработки изображений , где выходом является другое изображение. Извлеченная информация может быть простым сигналом «хорошая часть/плохая часть» или более сложным набором данных, таким как идентификация, положение и ориентация каждого объекта на изображении. Информация может использоваться для таких приложений, как автоматический осмотр и управление роботами и процессами в промышленности, для мониторинга безопасности и управления транспортными средствами. [1] [2] [3] Эта область охватывает большое количество технологий, программных и аппаратных продуктов, интегрированных систем, действий, методов и экспертных знаний. [3] [4] Машинное зрение — практически единственный термин, используемый для этих функций в приложениях промышленной автоматизации; термин менее универсален для этих функций в других средах, таких как безопасность и управление транспортными средствами. Машинное зрение как дисциплина системной инженерии можно считать отличной от компьютерного зрения , формы базовой компьютерной науки ; машинное зрение пытается интегрировать существующие технологии новыми способами и применять их для решения реальных проблем таким образом, чтобы это соответствовало требованиям промышленной автоматизации и аналогичных областей применения. [3] : 5 [5] Термин также используется в более широком смысле на выставках и в торговых группах, таких как Automated Imaging Association и European Machine Vision Association. Это более широкое определение также охватывает продукты и приложения, чаще всего связанные с обработкой изображений. [4] Основными сферами применения машинного зрения являются автоматический контроль и управление промышленными роботами /процессами. [6] [7] : 6–10 [8] В последнее время термины компьютерное зрение и машинное зрение в большей степени слились воедино. [9] : 13 См. глоссарий машинного зрения .
Основными сферами применения машинного зрения являются автоматическая инспекция и сортировка на основе изображений, а также управление роботами.; [6] [7] : 6–10 в этом разделе первое сокращенно называется «автоматическая инспекция». Общий процесс включает планирование деталей требований и проекта, а затем создание решения. [10] [11] В этом разделе описывается технический процесс, который происходит во время работы решения.
Первым шагом в последовательности операций автоматического контроля является получение изображения , как правило, с использованием камер, объективов и освещения, которое было разработано для обеспечения дифференциации, требуемой последующей обработкой. [12] [13] Пакеты программного обеспечения MV и программы, разработанные в них, затем используют различные методы цифровой обработки изображений для извлечения необходимой информации и часто принимают решения (например, прошел/не прошел) на основе извлеченной информации. [14]
Компоненты автоматической системы контроля обычно включают освещение, камеру или другой формирователь изображений, процессор, программное обеспечение и устройства вывода. [7] : 11–13
Устройство формирования изображения (например, камера) может быть либо отделено от основного блока обработки изображения, либо объединено с ним, в этом случае комбинация обычно называется интеллектуальной камерой или интеллектуальным датчиком. [15] [16] Включение полной функции обработки в тот же корпус, что и камера, часто называют встроенной обработкой. [17] При разделении подключение может быть выполнено к специализированному промежуточному оборудованию, пользовательскому устройству обработки или устройству захвата кадров в компьютере с использованием либо аналогового, либо стандартизированного цифрового интерфейса ( Camera Link , CoaXPress ). [18] [19] [20] [21] Реализации MV также используют цифровые камеры, способные к прямому подключению (без устройства захвата кадров) к компьютеру через интерфейсы FireWire , USB или Gigabit Ethernet . [21] [22]
В то время как в МВ чаще всего используется обычная (двумерная видимая световая) визуализация, альтернативы включают мультиспектральную визуализацию , гиперспектральную визуализацию , визуализацию в различных инфракрасных диапазонах, [23] линейную сканирующую визуализацию, трехмерную визуализацию поверхностей и рентгеновскую визуализацию. [6] Ключевыми отличиями в рамках двумерной видимой визуализации МВ являются монохромность и цветность, частота кадров , разрешение и то, является ли процесс визуализации одновременным по всему изображению, что делает его пригодным для движущихся процессов. [24]
Хотя подавляющее большинство приложений машинного зрения решаются с использованием двумерных изображений, приложения машинного зрения, использующие 3D-изображения, являются растущей нишей в отрасли. [25] [26] Наиболее часто используемый метод для 3D-изображения — это сканирующая триангуляция, которая использует движение продукта или изображения в процессе формирования изображения. Лазер проецируется на поверхности объекта. В машинном зрении это достигается с помощью сканирующего движения, либо путем перемещения заготовки, либо путем перемещения камеры и лазерной системы формирования изображения. Линия просматривается камерой под другим углом; отклонение линии представляет собой вариации формы. Линии из нескольких сканирований собираются в карту глубины или облако точек. [27] Стереоскопическое зрение используется в особых случаях, связанных с уникальными особенностями, присутствующими в обоих видах пары камер. [27] Другие 3D-методы, используемые для машинного зрения, — это время пролета и сетка. [27] [25] Одним из методов являются системы на основе сеточных массивов, использующие псевдослучайную структурированную световую систему, которая применялась в системе Microsoft Kinect примерно в 2012 году. [28] [29]
После получения изображения оно обрабатывается. [20] Центральные функции обработки обычно выполняются CPU , GPU , FPGA или их комбинацией. [17] Глубокое обучение и вывод предъявляют более высокие требования к производительности обработки. [30] Обычно используются несколько этапов обработки в последовательности, которая в конечном итоге приводит к желаемому результату. Типичная последовательность может начинаться с таких инструментов, как фильтры, которые изменяют изображение, за которыми следует извлечение объектов, затем извлечение (например, измерения, считывание кодов) данных из этих объектов, после чего следует передача этих данных или сравнение их с целевыми значениями для создания и передачи результатов «прошел/не прошел». Методы обработки изображений машинного зрения включают:
Обычным выходом автоматических систем инспекции являются решения о прохождении/непрохождении. [14] Эти решения могут, в свою очередь, запускать механизмы, которые отклоняют неисправные элементы или подают звуковой сигнал. Другие распространенные выходные данные включают информацию о положении и ориентации объекта для систем наведения роботов. [6] Кроме того, типы выходных данных включают числовые данные измерений, данные, считанные с кодов и символов, подсчеты и классификацию объектов, отображение процесса или результатов, сохраненные изображения, сигналы тревоги от автоматизированных систем мониторинга пространства MV и сигналы управления процессом . [10] [13] Сюда также входят пользовательские интерфейсы, интерфейсы для интеграции многокомпонентных систем и автоматизированного обмена данными. [42]
Термин « глубокое обучение » имеет различные значения, большинство из которых можно применить к методам, используемым в машинном зрении более 20 лет. Однако использование термина в «машинном зрении» началось в конце 2010-х годов с появлением возможности успешно применять такие методы к целым изображениям в промышленном пространстве машинного зрения. [43] Обычное машинное зрение обычно требует «физической» фазы решения автоматической инспекции машинного зрения для создания надежной простой дифференциации дефектов. Примером «простой» дифференциации является то, что дефекты темные, а хорошие части продукта светлые. Распространенной причиной, по которой некоторые приложения были невыполнимы, было то, что было невозможно достичь «простого»; глубокое обучение устраняет это требование, по сути «видя» объект больше так, как это делает человек, что теперь делает возможным выполнение этих автоматических приложений. [43] Система обучается на большом количестве изображений во время фазы обучения, а затем выполняет инспекцию во время использования во время выполнения, что называется «выводом». [43]
Машинное зрение обычно предоставляет информацию о местоположении и ориентации роботу, чтобы позволить роботу правильно захватить продукт. Эта возможность также используется для управления движением, которое проще, чем у роботов, например, контроллер движения с 1 или 2 осями. [6] Общий процесс включает планирование деталей требований и проекта, а затем создание решения. В этом разделе описывается технический процесс, который происходит во время работы решения. Многие из этапов процесса такие же, как и при автоматическом осмотре, за исключением того, что основное внимание уделяется предоставлению информации о положении и ориентации в результате. [6]
Еще в 2006 году один отраслевой консультант сообщил, что рынок машинного зрения в Северной Америке оценивается в 1,5 миллиарда долларов. [44] Однако главный редактор отраслевого журнала о машинном зрении утверждал, что «машинное зрение — это не отрасль как таковая», а скорее «интеграция технологий и продуктов, которые предоставляют услуги или приложения, приносящие пользу настоящим отраслям, таким как автомобилестроение или производство потребительских товаров, сельское хозяйство и оборона». [4]