Карта распределения точек (или карта плотности точек , или просто карта точек ) — это тип тематической карты , на которой используется точечный символ для визуализации географического распределения большого количества связанных явлений. Точечные карты — это тип визуализации единиц измерения, который основан на визуальном разбросе для отображения пространственных закономерностей, особенно различий в плотности. [1] [2] Точки могут обозначать фактическое местонахождение отдельных явлений или быть случайным образом размещены в районах скопления, чтобы обозначать несколько людей. Хотя эти две процедуры и лежащие в их основе модели сильно различаются, общий эффект один и тот же.
Идея использования точек для обозначения относительной плотности возникла в индустриальную эпоху Англии и Франции в 1830-х и 1840 - х годах, когда большинство современных типов тематических карт приобрели относительно современную форму. [3] Это стало возможным благодаря растущей доступности статистических данных и растущему признанию их ценности для научного понимания. Как и в случае с другими типами, самые ранние изобретения этой техники часто оставались незамеченными, а более поздние публикации получили гораздо большую известность.
Утверждалось, что первая карта распределения точек была создана Валентином Симаном в статье 1797 года, анализирующей недавнюю вспышку желтой лихорадки в Нью-Йорке . Хотя относительно небольшое количество случаев не соответствует типичному использованию этого метода для визуализации общего распределения большого количества людей, он все же заслуживает внимания, поскольку, возможно, является первым примером использования карты в качестве аналитического и коммуникационного инструмента. для социальных наук, пространственного анализа и эпидемиологии (хотя его выводы оказались неверными). [4]
Самая ранняя известная карта плотности точек по районам была создана в 1830 году Арманом Жозефом Фрером де Монтизоном (1788–????), францисканским монахом , школьным учителем и печатником. [5] Это относительно простая карта населения по департаментам (административным округам) Франции , где каждая точка представляет 10 000 человек. [6] Карта, похоже, была составлена с использованием той же техники, которая практиковалась в течение следующих двух столетий и до сих пор выполняется с помощью компьютера: количество точек, рассчитанное на основе общей численности населения каждого департамента, случайным образом распределено по каждому департаменту. Результатом является интуитивное визуальное отображение плотности населения , поскольку более высокие уровни населения в пределах административной границы демонстрируют более тесный и плотный рисунок точек. Поскольку точки расположены равномерно, очевидно, что они не отражают фактическое местонахождение людей в отделе. Это пример экологической ошибки , когда ценность территории обобщает все внутри этой территории, чтобы продемонстрировать эту ценность. [7]
Хотя карта Монтизона была первой опубликованной точечной картой такого типа, его нововведение не оказало влияния на практику в течение почти 30 лет, пока в 1859 году карта плотности точек по районам не была заново изобретена Туре Александром на карте распределения населения Швеции и Норвегии. фон Ментцер, офицер шведской армии . [8] Точки на его карте (каждая из которых представляет 200 жителей), по-видимому, были основаны на переписи населения 1855 года, но ясно показывают корректировки, основанные на дополнительных знаниях о распределении населения. [9]
Карта точечных объектов также была заново изобретена в середине XIX века, при этом эпидемиология снова стала ведущей движущей силой, особенно поиск причины холеры, возникновение которой, как было признано, имеет четкие географические закономерности. [10] Среди множества карт, созданных между 1820 и 1850 годами, есть несколько, показывающие расположение каждого случая в регионе. Ярким примером была карта 1849 года, составленная Томасом Шаптером в его истории вспышки холеры 1832-1834 годов в Эксетере . [11] Инновационная карта состоит в использовании различных точечных символов для обозначения случаев за каждый из трех лет. Шаптер не зашел так далеко, чтобы определить причину наблюдаемых им кластеров болезней, его карта оказала большое влияние; Позже Джон Сноу назвал это источником вдохновения для своей работы.
Когда в 1854 году в Лондоне произошла крупная вспышка , доктор Джон Сноу собрал данные об отдельных случаях, особенно об их местонахождении в Сохо (Лондон) , используя зарождающиеся методы пространственного анализа и отслеживания контактов , чтобы прийти к выводу, что зараженная вода была переносчиком болезни , и успешно отключил источник. [12] На карте, которая сопровождала его отчет 1855 года, были показаны отдельные ящики, сложенные в каждом месте дома, четко показывая концентрацию вокруг насоса на Брод-стрит, а также пробелы в местах, где были другие источники воды. [13] Карта теперь считается революционной; хотя ее роль в самом расследовании и ее влияние на разрешение споров о причине заболевания часто переоцениваются [14], она действительно заслуживает признания за понимание Сноу того, что карта была наиболее эффективным инструментом для передачи пространственных закономерностей заболевания. .
В последующие годы точечные карты, похоже, не стали столь распространены, как другие типы тематических карт , возможно, из-за времени, необходимого для их создания. Многие из них рассматривались как достижения, достойные отдельной научной публикации. [15] Гибридный метод появился на картах плотности населения в начале 20-го века, когда в сельских районах использовались репрезентативные точки с пропорциональными кругами для обозначения крупных городов. В этот период метод плотности точек стал стандартизирован, и были разработаны рекомендации по проектированию [16] , так что эту технику можно было преподавать в учебниках по картографии середины 20-го века. [17] [18]
Географические информационные системы сделали создание карт плотности точек относительно простым за счет автоматизации размещения отдельных точек, хотя результаты часто менее удовлетворительны, чем те, которые были созданы вручную. Значительным технологическим достижением стала доступность очень больших наборов данных, таких как миллионы геокодированных сообщений в социальных сетях, а также инновации в способах их визуализации. Полученные карты способны показать подробные закономерности географического распределения.
Недавние достижения в области точечных карт включают использование методов дасимметричного картирования для более точного размещения точек внутри зон, [19] масштабирование точечных карт для отображения разного количества точек на человека при разных уровнях масштабирования, [20] и использование временной интерполяции для анимации точечных карт с течением времени. [2]
Были разработаны два очень разных типа точечных карт, что часто приводит к некоторой путанице в терминологии. Фактически, многие картографы предлагали не группировать их в один тип тематических карт . Хотя они используют очень разные методы, основанные на очень разных источниках данных, с разной семантикой в результате, общая цель одна и та же: визуализировать географическое распределение группового явления (т.е. большого количества людей).
Точечная карта «один к одному» отображает большое количество точечных символов, обозначающих места отдельных случаев явления. Многие виды карт отображают географические объекты в виде точечных символов, например города; эта категория применяется только к тем, которые показывают большое количество экземпляров, каждый из которых изображен анонимно (например, без маркировки), так что внимание сосредоточено на общем распределении, а не на отдельных лицах. На протяжении многих лет этот подход был основной частью картографии преступности , помимо его первоначального использования в эпидемиологии . Это стало особенно популярным в недавнюю эпоху больших данных , таких как картографирование миллионов постов в социальных сетях с геотегами или местоположений мобильных телефонов, хотя эти карты вызывают обеспокоенность по поводу конфиденциальности. [21] [22] [23]
Для отличия этого метода от другого подхода были предложены различные термины, такие как номинальная карта точек , карта точечных объектов и карта контактов . [24] [25] : 135 Другое предложение — использовать термин «карта распределения точек» исключительно для этого типа (с плотностью точек , зарезервированной для другого типа), хотя это не проясняет путаницу, поскольку обе карты призваны показать распределение и плотность. .
В точечной карте «один ко многим» каждая точка на карте не представляет отдельный экземпляр, а скорее типизирует присутствие одного или нескольких индивидуумов, полученных на основе совокупных данных. Данные основаны на заранее определенных географических округах (например, округах, провинциях, странах, переписных участках), в которых данные об отдельных лицах агрегируются в виде статистических сводных переменных, таких как общая численность населения. То есть это тот же тип набора данных, который используется для картограмм и многих карт пропорциональных символов . В отличие от картограммы, единственной допустимой переменной, используемой для карты плотности точек, является общее количество особей. [24] После выбора значения точки (количества людей, представленных каждой точкой), можно рассчитать количество точек, необходимое в каждом округе, и точки случайным образом распределяются по округу. Такое распределение общей площади по площади дает визуальное представление о плотности населения . [18]
Большинство учебников по картографии предпочитают использовать термин «карта плотности точек» или «карта точек» только для точечных карт «один ко многим». [24] [26] [18] Термин «один ко многим» стал проблематичным, поскольку были разработаны интерактивные карты, использующие этот метод, но каждая точка представляет одного человека, [27] хотя это часто критикуют за создание иллюзии знать местонахождение каждого человека. Другие термины, которые были предложены для обозначения этого метода, включают репрезентативную точечную карту , точечную карту на основе района , точечную карту картоплета и карту распространения точек . [28]
Дизайн точечной карты любого типа предполагает балансировку дизайна отдельного точечного символа (особенно его размера) с расстоянием между точками. В точечной карте «один к одному» последнее фиксируется распределением особей и масштабом карты, но в репрезентативной точечной карте на это также влияет выбор картографом значения точек , количества особей, которых каждая точка представляет. Давно признано, что этот выбор взаимозависим, но существует несколько конкурирующих соображений: [18] [24]
Идеальный баланс этих факторов достигается, когда точки начинают сливаться в наиболее плотных областях, отдельные точки достаточно велики, чтобы их можно было увидеть по отдельности, а значение точки настолько мало, что даже в районах с самыми низкими значениями имеется более одной точки. точка. В 1949 году Дж. Росс Маккей разработал набор рекомендаций по расчету этого баланса размера и значения точек, включая инновационную номограмму , которая стала стандартом для профессии. [16] С тех пор совершенствование технологии создания точек, их печати или отображения привело к изменениям в расчете баланса, который был автоматизирован в большинстве программ ГИС. [29]
Однако этот идеальный диапазон кажущихся плотностей накладывает некоторые ограничения на явления, которые можно нанести на карту. Если диапазон плотностей слишком мал (скажем, соотношение между наиболее разреженными и наиболее плотными участками менее 1:10), карта будет выглядеть слишком последовательной, чтобы быть информативной. Если диапазон плотностей слишком велик (соотношение более 1:1000), слишком много районов будут сплошными, если только значение точки не уменьшится настолько, что станет невидимым. [24] Усовершенствования в технологии проектирования помогли несколько смягчить это ограничение, например, использование полупрозрачных точек, которые могут показать различие между плотностями, при которых точки просто сливаются, и более высокими плотностями, когда множество слоев точек расположены друг над другом. [27] Однако это имеет побочный эффект: отдельные точки становятся очень тусклыми.
Другая проблема при проектировании может возникнуть при использовании карты типа «один к одному», когда несколько точек встречаются в одном и том же месте, создавая ложное впечатление более низкой плотности (т. е. они выглядят как одна точка, а не множество). Хотя многие пользователи программного обеспечения ГИС не учитывают эту проблему, для ее смягчения было разработано несколько автоматизированных алгоритмов, обычно основанных на решении, разработанном в ранних картах Шаптера и Сноу, заключающемся в небольшом распределении точек, чтобы они были различимы, но все же выглядят плотно упакованными. [30]
Одна из проблем, связанных с плотностью точек, которая подробно изучалась, заключается в том, насколько точно читатели карт могут интерпретировать видимую плотность. Начиная с 1930-х годов, повторные исследования показали тенденцию недооценивать плотность территории, показанной точками. [31]
Другая критика заключается в том, что агрегированные данные о округах имеют присущие им проблемы, которые могут привести к тем же неправильным интерпретациям, что и другие типы тематических карт, основанных на такого рода данных, таких как картографические карты , включая экологическую ошибку и проблему модифицируемых единиц площади . Фактически, точечная техника может усугубить проблему, поскольку детальный вид отдельных точек создает иллюзию более подробных данных, чем сплошной цвет картоплета. Кроме того, читатели карт могут легко интерпретировать точки, особенно на редких участках, как местоположения реальных поселений. [24]
Как и в случае с картограммами, проблему изменяемых единиц площади можно смягчить, используя настолько маленькие районы, насколько это возможно, хотя это может привести к увеличению проблемы экстремального изменения плотности, обсуждавшейся выше. Другим решением, общим с картографированием картоплетов, является дасиметрический метод . В приложении плотности точек используются внешние знания о распределении явления для корректировки размещения точек. Самый простой подход — это бинарный метод , при котором создается слой земли, на котором, как известно, нет особей (в случае человеческой популяции это могут быть такие объекты, как водоемы и земли, находящиеся в государственной собственности), и используется его в качестве маски для исключения точек. от рисования там, заставляя их размещаться более плотно в оставшейся области. [24] Традиционно применялся более тонкий подход при размещении точек вручную, концентрируя их в тех частях района, где плотность была известна как более высокая, что приводило к появлению эффекта постепенного изменения плотности, а не резкого изменения на границах округа. [18] Были разработаны автоматизированные алгоритмы, имитирующие этот метод, использующие вспомогательную информацию, такую как расположение городских точек, для изменения распределения точек по каждому району, хотя они не получили широкого распространения в программном обеспечении ГИС. [32]