Подсчет толпы, как известно, является актом подсчета общей толпы, присутствующей в определенной области. Люди в определенной области называются толпой . Самый прямой метод — это фактический подсчет каждого человека в толпе. Например, турникеты часто используются для точного подсчета количества людей, входящих на мероприятие. [1]
С начала 2000-х годов произошел сдвиг в понимании фразы «подсчет толпы». Перейдя от более простого метода подсчета толпы к методу кластеров и карт плотности, существует несколько улучшений методов подсчета толпы. Подсчет толпы также можно определить как оценку количества людей, присутствующих на одной фотографии. [2]
Благодаря быстрому прогрессу в технологиях и росту CNN (сверточной нейронной сети) за последнее десятилетие, использование CNN в подсчете толпы резко возросло. Методы, основанные на CNN, можно в основном сгруппировать по следующим различным моделям: [3]
Наиболее распространенным методом подсчета толпы на протестах и митингах является метод Джекобса, названный в честь его изобретателя Герберта Джекобса . Метод Джекобса включает в себя деление площади, занятой толпой, на секции, определение среднего количества людей в каждой секции и умножение на количество занятых секций. Согласно отчету Life's Little Mysteries , технологии, иногда используемые для помощи в таких оценках, включают в себя «лазеры, спутники, аэрофотосъемку, трехмерные системы сеток, записанные видеоматериалы и воздушные шары наблюдения, обычно привязанные в нескольких кварталах вокруг места проведения мероприятия и летающие на высоте от 400 до 800 футов (от 120 до 240 метров) над головой». [2]
Этот метод подсчета толпы включает использование регрессии по глобальным признакам изображения ко всему изображению. Глобальные признаки изображения относятся к различным свойствам определенных областей фотографии. Например, глобальные признаки изображения включают «контурные представления, описания форм, признаки текстуры». [4]
Поскольку информация о распределении объектов не учитывается, локализация объектов не может быть обработана с помощью регрессий. [5] Кроме того, поскольку эта модель оценивает плотность толпы по описаниям шаблонов толпы, она игнорирует отдельных трекеров. [2] Это позволяет моделям на основе регрессии быть очень эффективными на переполненных изображениях; если плотность на пиксель очень высока, лучше всего подходят регрессионные модели.
Более ранние методы подсчета толпы использовали классические регрессионные модели. [6]
Карты плотности объектов основаны на поиске общего количества объектов, расположенных в определенной области. Это определяется интегральным суммированием количества объектов в этой области. [5] Поскольку значения плотности оцениваются через низкие значения, подсчет на основе плотности позволяет пользователю ощутить преимущества моделей, основанных на регрессии, наряду с локализацией информации. [5] Локализация информации относится к акту сохранения информации о местоположении.
Для эффективного использования вышеупомянутых моделей важно иметь большой объем данных. Однако, как пользователи, мы застряли с ограниченными данными, т. е. исходным изображением. Чтобы компенсировать эти проблемы, мы используем такие трюки, как случайное кадрирование. Случайное кадрирование относится к действию случайного выбора определенных подизображений из существующего исходного изображения.
После выполнения нескольких итераций случайной обрезки подизображения передаются в алгоритм машинного обучения , чтобы помочь ему лучше обобщать.
Для решения проблем, связанных с подсчетом толпы в районах с высокой плотностью населения, можно использовать методы подсчета на основе плотности населения. Эти пирамиды изображений обычно используются для подсчета толпы в местах, где люди собираются для совершения ритуалов или отправления религиозных обрядов. Это связано с тем, что в разных местах изображения находятся люди разного масштаба.
Однако, поскольку использование требуемых алгоритмов для пирамид изображений очень дорого, полагаться на эти методы финансово нестабильно. В результате могут быть задействованы модели глубокого слияния. [7]
Эти модели глубокого слияния будут использовать «нейронную сеть(и) для повышения точности регрессии карты плотности». [8] Эти модели сначала отметят местоположение каждого гражданского лица на снимке. Затем модели определят карты плотности области, используя «местоположение пешехода, его форму и искажение перспективы». [8] Поскольку происходит много итераций алгоритма и процессов сканирования, количество людей подсчитывается через голову человека. Это также связано с тем, что будет много случаев, когда тела гражданских лиц будут перекрывать друг друга.
Подсчет толпы играет важную роль в «общественной безопасности, языке собраний и видеонаблюдении» [9] среди прочего. Без контроля толпы, из-за плохого планирования, может произойти несколько ужасных несчастных случаев. Некоторые из самых известных — катастрофа в Хиллборо , которая произошла 15 апреля в Англии. Другой памятный инцидент произошел, когда Луис Фаррахан пригрозил подать в суд на полицию парка Вашингтона, округ Колумбия, за заявление о том, что в организованном им в 1995 году марше миллиона человек приняли участие всего 400 000 человек .
На мероприятиях на улицах или в парке, а не в закрытом помещении, подсчет толпы более сложен и менее точен. Для многих мероприятий, особенно политических митингов или протестов , количество людей в толпе имеет политическое значение, и результаты подсчета являются спорными . Например, во время всемирных протестов против войны в Ираке было много протестов с сильно различающимися подсчетами, предложенными организаторами с одной стороны и полицией с другой стороны.