stringtranslate.com

Подсчет толпы

Марш миллиона человек в Вашингтоне, округ Колумбия , в октябре 1995 года стал предметом большого спора по поводу подсчета людей.

Подсчет толпы, как известно, является актом подсчета общей толпы, присутствующей в определенной области. Люди в определенной области называются толпой . Самый прямой метод — это фактический подсчет каждого человека в толпе. Например, турникеты часто используются для точного подсчета количества людей, входящих на мероприятие. [1]

Современное понимание

С начала 2000-х годов произошел сдвиг в понимании фразы «подсчет толпы». Перейдя от более простого метода подсчета толпы к методу кластеров и карт плотности, существует несколько улучшений методов подсчета толпы. Подсчет толпы также можно определить как оценку количества людей, присутствующих на одной фотографии. [2]

Методы подсчета толпы

Благодаря быстрому прогрессу в технологиях и росту CNN (сверточной нейронной сети) за последнее десятилетие, использование CNN в подсчете толпы резко возросло. Методы, основанные на CNN, можно в основном сгруппировать по следующим различным моделям: [3]

Метод Якобса

Наиболее распространенным методом подсчета толпы на протестах и ​​митингах является метод Джекобса, названный в честь его изобретателя Герберта Джекобса . Метод Джекобса включает в себя деление площади, занятой толпой, на секции, определение среднего количества людей в каждой секции и умножение на количество занятых секций. Согласно отчету Life's Little Mysteries , технологии, иногда используемые для помощи в таких оценках, включают в себя «лазеры, спутники, аэрофотосъемку, трехмерные системы сеток, записанные видеоматериалы и воздушные шары наблюдения, обычно привязанные в нескольких кварталах вокруг места проведения мероприятия и летающие на высоте от 400 до 800 футов (от 120 до 240 метров) над головой». [2]

Подсчет на основе прямой регрессии

Этот метод подсчета толпы включает использование регрессии по глобальным признакам изображения ко всему изображению. Глобальные признаки изображения относятся к различным свойствам определенных областей фотографии. Например, глобальные признаки изображения включают «контурные представления, описания форм, признаки текстуры». [4]

Поскольку информация о распределении объектов не учитывается, локализация объектов не может быть обработана с помощью регрессий. [5] Кроме того, поскольку эта модель оценивает плотность толпы по описаниям шаблонов толпы, она игнорирует отдельных трекеров. [2] Это позволяет моделям на основе регрессии быть очень эффективными на переполненных изображениях; если плотность на пиксель очень высока, лучше всего подходят регрессионные модели.

Более ранние методы подсчета толпы использовали классические регрессионные модели. [6]

Подсчет на основе плотности

Карты плотности объектов основаны на поиске общего количества объектов, расположенных в определенной области. Это определяется интегральным суммированием количества объектов в этой области. [5] Поскольку значения плотности оцениваются через низкие значения, подсчет на основе плотности позволяет пользователю ощутить преимущества моделей, основанных на регрессии, наряду с локализацией информации. [5] Локализация информации относится к акту сохранения информации о местоположении.

Усиление подсчета толпы

Для эффективного использования вышеупомянутых моделей важно иметь большой объем данных. Однако, как пользователи, мы застряли с ограниченными данными, т. е. исходным изображением. Чтобы компенсировать эти проблемы, мы используем такие трюки, как случайное кадрирование. Случайное кадрирование относится к действию случайного выбора определенных подизображений из существующего исходного изображения.

После выполнения нескольких итераций случайной обрезки подизображения передаются в алгоритм машинного обучения , чтобы помочь ему лучше обобщать.

Для решения проблем, связанных с подсчетом толпы в районах с высокой плотностью населения, можно использовать методы подсчета на основе плотности населения. Эти пирамиды изображений обычно используются для подсчета толпы в местах, где люди собираются для совершения ритуалов или отправления религиозных обрядов. Это связано с тем, что в разных местах изображения находятся люди разного масштаба.

Однако, поскольку использование требуемых алгоритмов для пирамид изображений очень дорого, полагаться на эти методы финансово нестабильно. В результате могут быть задействованы модели глубокого слияния. [7]

Эти модели глубокого слияния будут использовать «нейронную сеть(и) для повышения точности регрессии карты плотности». [8] Эти модели сначала отметят местоположение каждого гражданского лица на снимке. Затем модели определят карты плотности области, используя «местоположение пешехода, его форму и искажение перспективы». [8]  Поскольку происходит много итераций алгоритма и процессов сканирования, количество людей подсчитывается через голову человека. Это также связано с тем, что будет много случаев, когда тела гражданских лиц будут перекрывать друг друга.

Важность

Подсчет толпы играет важную роль в «общественной безопасности, языке собраний и видеонаблюдении» [9]   среди прочего. Без контроля толпы, из-за плохого планирования, может произойти несколько ужасных несчастных случаев. Некоторые из самых известных — катастрофа в Хиллборо , которая произошла 15 апреля в Англии. Другой памятный инцидент произошел, когда Луис Фаррахан пригрозил подать в суд на полицию парка Вашингтона, округ Колумбия, за заявление о том, что в организованном им в 1995 году марше миллиона человек приняли участие всего 400 000 человек .

На мероприятиях на улицах или в парке, а не в закрытом помещении, подсчет толпы более сложен и менее точен. Для многих мероприятий, особенно политических митингов или протестов , количество людей в толпе имеет политическое значение, и результаты подсчета являются спорными . Например, во время всемирных протестов против войны в Ираке было много протестов с сильно различающимися подсчетами, предложенными организаторами с одной стороны и полицией с другой стороны.

Ссылки

  1. ^ "Что такое турникеты? (с картинками)". EasyTechJunkie . Получено 11 октября 2022 г.
  2. ^ abc Loy, Chen Change; Chen, Ke; Gong, Shaogang; Xiang, Tao (2021). «Fine-Grained Crowd Counting». IEEE Transactions on Image Processing . 30 : 2114–2126. arXiv : 2007.06146 . Bibcode : 2021ITIP...30.2114W. doi : 10.1109/TIP.2021.3049938. PMID  33439838. S2CID  220496399.
  3. ^ Чу, Хуанпэн; Тан, Цзилинь; Ху, Хаоцзи (01.10.2021). «Пирамидальная сеть признаков, управляемых вниманием, для подсчета толпы». Журнал визуальной коммуникации и представления изображений . 80 : 103319. doi : 10.1016/j.jvcir.2021.103319. ISSN  1047-3203. S2CID  241591128.
  4. ^ Лисин, Дмитрий А.; Маттар, Марван А.; Блашко, Мэтью Б.; Бенфилд, Марк К.; Лернед-Милле, Эрик Г. «Объединение локальных и глобальных признаков изображения для распознавания классов объектов» (PDF) .
  5. ^ abc Kang, D.; Ma, Z.; Chan, AB (май 2019). «За пределами подсчета: сравнение карт плотности для задач анализа толпы — подсчет, обнаружение и отслеживание». IEEE Transactions on Circuits and Systems for Video Technology . 29 (5): 1408–1422. arXiv : 1705.10118 . doi : 10.1109/TCSVT.2018.2837153. S2CID  19706288.
  6. ^ Делуссу, Рита; Путцу, Лоренцо; Фумера, Джорджио (2022). «Подсчет толпы в зависимости от сцены с использованием синтетических обучающих изображений». Распознавание образов . 124 : 108484. Bibcode : 2022PatRe.12408484D. doi : 10.1016/j.patcog.2021.108484. hdl : 11584/341493 . S2CID  245109866.
  7. ^ Хан, Султан Дауд; Салих, Ясир; Зафар, Басим; Нурвали, Абдулфаттах (28.09.2021). «Сеть глубокого слияния для подсчета толпы в местах с высокой плотностью людей». Международный журнал вычислительных интеллектуальных систем . 14 (1): 168. doi : 10.1007/s44196-021-00016-x . ISSN  1875-6883.
  8. ^ ab Tang, Siqi; Pan, Zhisong; Zhou, Xingyu (2017-01-01). «Низкоранговая и разреженная сверточная нейронная сеть с глубоким слиянием для подсчета толпы». Математические проблемы в инженерии . 2017 : 1–11. doi : 10.1155/2017/5046727 .
  9. ^ Чу, Хуанпэн; Тан, Цзилинь; Ху, Хаоцзи (01.10.2021). «Пирамидальная сеть признаков, управляемых вниманием, для подсчета толпы». Журнал визуальной коммуникации и представления изображений . 80 : 103319. doi : 10.1016/j.jvcir.2021.103319. ISSN  1047-3203. S2CID  241591128.

Внешние ссылки