stringtranslate.com

Разреженное приближение

Теория разреженного приближения (также известная как разреженное представление ) имеет дело с разреженными решениями для систем линейных уравнений . Методы поиска этих решений и их использования в приложениях нашли широкое применение в обработке изображений , обработке сигналов , машинном обучении , медицинской визуализации и многом другом.

Разреженное разложение

Бесшумные наблюдения

Рассмотрим линейную систему уравнений , где — недоопределенная матрица и . Матрица (обычно предполагается, что она имеет полный ранг) называется словарем и является сигналом интереса. Основная проблема разреженного представления определяется как поиск максимально разреженного представления, удовлетворяющего . Из-за недоопределенной природы эта линейная система допускает в общем случае бесконечно много возможных решений, и среди них мы ищем то, у которого наименьшее количество ненулевых элементов. Формально говоря, мы решаем

где — псевдонорма, которая подсчитывает количество ненулевых компонентов . Известно, что эта задача является NP-трудной и сводится к NP-полным задачам выбора подмножества в комбинаторной оптимизации .

Разреженность подразумевает, что только несколько ( ) компонентов в нем не равны нулю. Основной мотивацией для такого разреженного разложения является желание предоставить простейшее возможное объяснение как линейной комбинации как можно меньшего количества столбцов из , также называемых атомами. Таким образом, сигнал можно рассматривать как молекулу, состоящую из нескольких фундаментальных элементов, взятых из .

Хотя поставленная выше задача действительно NP-Hard, ее решение часто можно найти с помощью алгоритмов аппроксимации. Одним из таких вариантов является выпуклая релаксация задачи, полученная путем использования -нормы вместо , где просто суммирует абсолютные значения записей в . Это известно как алгоритм базисного преследования (BP), который может быть обработан с помощью любого решателя линейного программирования . Альтернативным методом аппроксимации является жадный метод, такой как согласованное преследование (MP), который находит местоположение ненулевых элементов по одному за раз.

Удивительно, но при мягких условиях (используя искру (математику) , взаимную когерентность или свойство ограниченной изометрии ) и уровень разреженности решения, можно показать, что проблема разреженного представления имеет единственное решение, и BP и MP гарантированно найдут его идеально. [1] [2] [3]

Шумные наблюдения

Часто наблюдаемый сигнал является шумным. Ослабляя ограничение равенства и налагая -норму на термин подгонки данных, проблема разреженной декомпозиции становится

или представить в форме Лагранжа,

где заменяется .

Как и в случае без шума, эти две проблемы в общем случае являются NP-Hard, но могут быть аппроксимированы с помощью алгоритмов преследования. Более конкретно, изменяя на -норму, мы получаем

что известно как базисное преследование шумоподавления . Аналогично, сопоставление преследований может быть использовано для аппроксимации решения вышеуказанных задач, находя местоположения ненулевых элементов по одному за раз, пока не будет достигнут порог ошибки. Здесь также теоретические гарантии предполагают, что BP и MP приводят к почти оптимальным решениям в зависимости от свойств и мощности решения . [4] [5] [6] Другой интересный теоретический результат относится к случаю, в котором является унитарной матрицей . При этом предположении проблемы, поставленные выше (с или ) допускают решения в замкнутой форме в виде нелинейного сжатия. [4]

Вариации

Существует несколько вариаций базовой задачи разреженной аппроксимации.

Структурированная разреженность : в исходной версии задачи можно выбрать любой атом в словаре. В модели структурированной (блочной) разреженности вместо выбора атомов по отдельности выбираются группы из них. Эти группы могут перекрываться и иметь разный размер. Цель состоит в том, чтобы представить так, чтобы это было разрежено, при этом принудительно создавая эту блочную структуру. [7]

Совместное (совместное) разреженное кодирование : Исходная версия проблемы определена для одного сигнала . В модели совместного (совместного) разреженного кодирования доступен набор сигналов, каждый из которых, как полагают, возникает из (почти) одного и того же набора атомов из . В этом случае задача преследования направлена ​​на восстановление набора разреженных представлений, которые наилучшим образом описывают данные, заставляя их совместно использовать одну и ту же (или близкую) поддержку. [8]

Другие структуры : В более широком смысле, проблема разреженной аппроксимации может быть поставлена ​​при принудительном применении определенной желаемой структуры к шаблону ненулевых местоположений в . Два случая, представляющие интерес и тщательно изученные, — это древовидная структура и, в более общем смысле, распределенная поддержка Больцмана. [9]

Алгоритмы

Как уже упоминалось выше, существуют различные алгоритмы приближения (также называемые алгоритмами преследования ), которые были разработаны для решения проблемы разреженного представления:

Ниже мы рассмотрим некоторые из этих основных методов.

Приложения

Идеи и алгоритмы разреженной аппроксимации широко использовались в обработке сигналов , обработке изображений , машинном обучении , медицинской визуализации , обработке массивов , интеллектуальном анализе данных и т. д. В большинстве этих приложений неизвестный интересующий сигнал моделируется как разреженная комбинация нескольких атомов из заданного словаря, и это используется в качестве регуляризации проблемы. Эти проблемы обычно сопровождаются механизмом обучения словаря , который стремится наилучшим образом соответствовать модели заданным данным. Использование моделей, вдохновленных разрежением, привело к получению современных результатов в широком наборе приложений. [12] [13] [14] Недавние работы показывают, что существует тесная связь между моделированием разреженного представления и глубоким обучением. [15]

Смотрите также

Ссылки

  1. ^ Донохо, Д. Л. и Элад, М. (2003). «Оптимально разреженное представление в общих (неортогональных) словарях с помощью минимизации L1» (PDF) . Труды Национальной академии наук . 100 (5): 2197–2202. Bibcode :2003PNAS..100.2197D. doi : 10.1073/pnas.0437847100 . PMC  153464 . PMID  16576749.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  2. ^ Tropp, JA (2004). «Жадность — это хорошо: результаты алгоритмов для разреженной аппроксимации» (PDF) . IEEE Transactions on Information Theory . 50 (10): 2231–2242. CiteSeerX 10.1.1.321.1443 . doi :10.1109/TIT.2004.834793. S2CID  675692. 
  3. ^ Донохо, ДЛ (2006). «Для большинства больших недоопределенных систем линейных уравнений минимальное решение в норме l1 также является самым разреженным решением» (PDF) . Сообщения по чистой и прикладной математике . 56 (6): 797–829. doi :10.1002/cpa.20132. S2CID  8510060.
  4. ^ ab Elad, M. (2010). Разреженные и избыточные представления: от теории к приложениям в обработке сигналов и изображений . Springer. CiteSeerX 10.1.1.331.8963 . doi :10.1007/978-1-4419-7011-4. ISBN  978-1441970107.
  5. ^ Донохо, Д. Л., Элад, М. и Темпляков, В. (2006). «Стабильное восстановление разреженных сверхполных представлений при наличии шума» (PDF) . IEEE Transactions on Information Theory . 52 (1): 6–18. CiteSeerX 10.1.1.125.5610 . doi :10.1109/TIT.2005.860430. S2CID  14813938. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ Tropp, JA (2006). «Просто расслабьтесь: методы выпуклого программирования для идентификации разреженных сигналов в шуме» (PDF) . IEEE Transactions on Information Theory . 52 (3): 1030–1051. CiteSeerX 10.1.1.184.2957 . doi :10.1109/TIT.2005.864420. S2CID  6496872. 
  7. ^ Eldar, YC, Kuppinger, P. и Bolcskei, H. (2009). «Блочно-разреженные сигналы: отношения неопределенности и эффективное восстановление». IEEE Transactions on Signal Processing . 58 (6): 3042–3054. arXiv : 0906.3173 . Bibcode : 2010ITSP...58.3042E. doi : 10.1109/TSP.2010.2044837. S2CID  335122.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  8. ^ Tropp, JA, Gilbert, AC и Strauss, MJ (2006). «Алгоритмы для одновременной разреженной аппроксимации. Часть I: Жадное преследование». Обработка сигналов . 86 (3): 572–588. doi :10.1016/j.sigpro.2005.05.030.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  9. ^ Пелег, Т. Элдар, YC и Элад, М. (2012). «Использование статистических зависимостей в разреженных представлениях для восстановления сигналов». Труды IEEE по обработке сигналов . 60 (5): 2286–2303. arXiv : 1010.5734 . Bibcode :2012ITSP...60.2286P. doi :10.1109/TSP.2012.2188520. S2CID  3179803.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  10. ^ Needell, D. и Tropp, JA (2009). "CoSaMP: Итеративное восстановление сигнала из неполных и неточных образцов". Applied and Computational Harmonic Analysis . 26 (3): 301–321. arXiv : 0803.2392 . doi : 10.1016/j.acha.2008.07.002.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  11. ^ Зибулевский, М. и Элад, М. (2010). "Оптимизация L1-L2 в обработке сигналов и изображений" (PDF) . Журнал обработки сигналов IEEE . 27 (3): 76–88. Bibcode : 2010ISPM...27...76Z. doi : 10.1109/MSP.2010.936023. S2CID  2783691.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  12. ^ Баранюк, RG Candes, E. Elad, M. и Ma, Y. (2010). «Применение разреженного представления и сжатого зондирования». Труды IEEE . 98 (6): 906–909. doi :10.1109/JPROC.2010.2047424.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  13. ^ Elad, M. Figueiredo, MAT, и Ma, Y. (2010). «О роли разреженных и избыточных представлений в обработке изображений» (PDF) . Труды IEEE . 98 (6): 972–982. CiteSeerX 10.1.1.160.465 . doi :10.1109/JPROC.2009.2037655. S2CID  10992685. Архивировано из оригинала (PDF) 2018-01-17. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  14. ^ Plumbley, MD Blumensath, T. Daudet, L. Gribonval, R. и Davies, ME (2010). «Разреженные представления в аудио и музыке: от кодирования до разделения источников». Труды IEEE . 98 (6): 995–1005. CiteSeerX 10.1.1.160.1607 . doi :10.1109/JPROC.2009.2030345. S2CID  4461063. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  15. ^ Папян, В. Романо, Ю. и Элад, М. (2017). «Сверточные нейронные сети, проанализированные с помощью свёрточного разреженного кодирования» (PDF) . Журнал исследований машинного обучения . 18 (83): 1–52. arXiv : 1607.08194 . Bibcode :2016arXiv160708194P.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )