Картографическая генерализация , или генерализация карты , включает все изменения в карте, которые производятся при получении карты меньшего масштаба из карты большего масштаба или картографических данных. Это основная часть картографического дизайна . Независимо от того, выполняется ли генерализация вручную картографом или компьютером или набором алгоритмов , она стремится абстрагировать пространственную информацию на высоком уровне детализации до информации, которая может быть отображена на карте на более низком уровне детализации.
Картограф имеет лицензию на корректировку содержания своих карт для создания подходящей и полезной карты, которая передает пространственную информацию, при этом соблюдая правильный баланс между целью карты и точной детализацией отображаемого объекта. Хорошо обобщенные карты — это те, которые подчеркивают наиболее важные элементы карты, при этом представляя мир наиболее верным и узнаваемым образом.
В первой половине 20-го века картографы начали серьезно задумываться о том, как объекты, которые они рисовали, зависели от масштаба. Эдуард Имхоф , один из самых выдающихся академических и профессиональных картографов того времени, опубликовал исследование городских планов на картах в различных масштабах в 1937 году, перечислив несколько форм генерализации, которые имели место, включая те, которые позже были названы символизацией, слиянием, упрощением, улучшением и смещением. [1] Поскольку аналитические подходы к географии возникли в 1950-х и 1960-х годах, генерализация, особенно упрощение линий и сглаживание растров, стала объектом изучения. [2] [3] [4]
Обобщение, вероятно, было наиболее тщательно изученным аспектом картографии с 1970-х по 1990-е годы. Вероятно, это потому, что оно вписывалось в оба основных направления исследований той эпохи: картографическая коммуникация (особенно алгоритмы обработки сигналов, основанные на теории информации ), и возможности, предоставляемые технологическим прогрессом (из-за его потенциала для автоматизации). Ранние исследования были сосредоточены в основном на алгоритмах автоматизации отдельных операций обобщения. [5] К концу 1980-х годов академические картографы мыслили масштабнее, разрабатывая общую теорию обобщения и исследуя использование экспертных систем и других зарождающихся технологий искусственного интеллекта для автоматизации всего процесса, включая решения о том, какие инструменты использовать и когда. [6] [7] Эти пути несколько зашли в тупик в конце 1990-х годов, совпав с общей потерей веры в обещания ИИ и ростом постмодернистской критики последствий автоматизации проектирования.
В последние годы сообщество генерализации переживает возрождение, отчасти подпитываемое обновленными возможностями ИИ. Еще одной недавней тенденцией стало сосредоточение на многомасштабном картографировании , интеграции баз данных ГИС , разработанных для нескольких целевых масштабов, сужения сферы необходимости генерализации до масштабных «пробелов» между ними, более управляемого уровня для автоматизации. [8]
Обобщение часто определяется просто как удаление деталей, но оно основано на понятии, изначально заимствованном из теории информации , об объеме информации или деталей, обнаруженных на карте, и о том, как этот объем контролируется масштабом карты, ее назначением и предполагаемой аудиторией. Если для данного картографического проекта существует оптимальный объем информации, то обобщение — это процесс взятия существующих доступных данных, часто называемых (особенно в Европе) цифровой моделью ландшафта (DLM), которая обычно, но не всегда, имеет больший объем информации, чем необходимо, и ее обработки для создания нового набора данных, часто называемого цифровой картографической моделью (DCM), с желаемым объемом. [6]
Для понимания этого процесса было предложено много общих концептуальных моделей, часто пытающихся охватить процесс принятия решений человеком-мастером-картографом. Одна из самых популярных моделей, разработанная Макмастером и Ши в 1988 году, делит эти решения на три фазы: Философские цели , общие причины, по которым обобщение желательно или необходимо, и критерии оценки его успешности; Картометрическая оценка , характеристики данной карты (или объекта на этой карте), которые требуют обобщения; и Пространственные и атрибутивные преобразования , набор операторов обобщения, доступных для использования на данном объекте, слое или карте. [7] На первой, наиболее концептуальной фазе Макмастер и Ши показывают, как обобщение играет центральную роль в разрешении часто противоречивых целей картографического дизайна в целом: функциональность против эстетики, информационное богатство против ясности и желание сделать больше против ограничений технологии и среды. Эти конфликты можно свести к базовому конфликту между потребностью в большем количестве данных на карте и потребностью в меньшем количестве, используя обобщение в качестве инструмента для их уравновешивания.
Одной из проблем подхода теории информации к обобщению является его основа на измерении количества информации на карте до и после процедур обобщения. [9] Можно представить себе карту, количественно определяемую ее плотностью информации на карте , средним числом «битов» информации на единицу площади на карте (или ее следствием, разрешением информации , средним расстоянием между битами), и ее плотностью или разрешением информации на земле , теми же мерами на единицу площади на Земле. Масштаб, таким образом, будет пропорционален соотношению между ними, и изменение масштаба потребует корректировки одного или обоих из них посредством обобщения.
Но что считается «битом» картографической информации? В конкретных случаях это несложно, например, подсчет общего количества объектов на карте или количества вершин в одной строке (возможно, сокращенного до количества выступающих вершин); такая прямолинейность объясняет, почему они были ранними целями для исследований обобщения. [4] Однако это является проблемой для карты в целом, в которой возникают такие вопросы, как «сколько графической информации содержится в метке карты: один бит (все слово), бит для каждого символа или бит для каждой вершины или кривой в каждом символе, как если бы они были объектами каждой области?» Каждый вариант может быть актуален в разное время.
Это измерение еще больше усложняется ролью символики карты , которая может влиять на кажущуюся плотность информации . Карта с сильной визуальной иерархией (т. е. с менее важными слоями, которые подавлены, но все еще присутствуют) несет эстетику «ясности», поскольку на первый взгляд кажется, что она содержит меньше данных, чем есть на самом деле; наоборот, карта без визуальной иерархии, в которой все слои кажутся одинаково важными, может быть обобщена как «загроможденная», поскольку первое впечатление состоит в том, что она содержит больше данных, чем есть на самом деле. [10] Таким образом, проектирование карты для достижения желаемой эстетики гештальта заключается в управлении кажущейся плотностью информации, а не фактической плотностью информации. По словам Эдварда Тафти , [11]
Запутанность и беспорядок — это неудачи дизайна, а не атрибуты информации. Поэтому суть в том, чтобы найти стратегии дизайна, которые раскрывают детали и сложность, а не обвинять данные в избытке сложности.
В недавних работах признается роль символов карты, включая типологию операторов обобщения Рота-Брюэра [12] , хотя они поясняют, что символика не является формой обобщения, а лишь партнером обобщения в достижении желаемой видимой плотности информации. [13]
Существует множество картографических методов, которые используются для корректировки количества географических данных на карте. За десятилетия исследований генерализации было опубликовано более дюжины уникальных списков таких операторов генерализации со значительными различиями. Фактически, существует множество обзоров, сравнивающих списки, [5] [12] [14] и даже в них отсутствуют несколько важных, таких как тот, что был найден в первом учебнике Джона Китса (1973), который, по-видимому, опередил свое время. [15] Некоторые из этих операций были автоматизированы с помощью нескольких алгоритмов с инструментами, доступными в географических информационных системах и другом программном обеспечении; другие оказались намного сложнее, и большинство картографов все еще выполняют их вручную.
Также называется фильтром, пропуском.
Один из первых операторов, который был признан и проанализирован, впервые появившийся в списке Китса 1973 года, [4] [15] выборка — это процесс простого удаления целых географических объектов с карты. Существует два типа выборки, которые объединены в некоторых моделях и разделены в других:
При выборе объектов выбор того, какие объекты оставить или исключить, сложнее, чем может показаться. Использование простого атрибута реального размера (население города, ширина дороги или объем трафика, объем речного стока), хотя часто легкодоступного в существующих данных ГИС, часто приводит к выбору, который чрезмерно сконцентрирован в некоторых областях и разрежен в других. Таким образом, картографы часто фильтруют их, используя степень их региональной важности , их известность в своей локальной области, а не карту в целом, что дает более сбалансированную карту, но ее сложнее автоматизировать. Было разработано много формул для автоматического ранжирования региональной важности объектов, например, путем уравновешивания исходного размера с расстоянием до ближайшего объекта значительно большего размера, аналогично мерам топографической известности , но это гораздо сложнее для линейных объектов, чем для точек, и иногда приводит к нежелательным результатам (например, «проблема Балтимора», в которой города, которые кажутся важными, остаются без внимания).
Другой подход заключается в ручном кодировании субъективной оценки региональной значимости в данные ГИС, которые впоследствии можно использовать для фильтрации объектов; такой подход был применен для набора данных Natural Earth , созданного картографами.
Еще одним ранним направлением исследований обобщения, [4] [15] упрощение, является удаление вершин в линиях и границах областей. Было разработано множество алгоритмов, но большинство из них включают поиск по вершинам линии, удаляя те, которые вносят наименьший вклад в общую форму линии. Алгоритм Рамера–Дугласа–Пейкера (1972/1973) является одним из самых ранних и до сих пор наиболее распространенных методов упрощения линий. [16] Большинство этих алгоритмов, особенно ранних, уделяли больше внимания сокращению размера наборов данных в дни ограниченного цифрового хранения, чем качественному внешнему виду на картах, и часто создают линии, которые выглядят чрезмерно угловатыми, особенно на кривых, таких как реки. Некоторые другие алгоритмы включают алгоритм Ванга-Мюллера (1998), который ищет критические изгибы и, как правило, более точен за счет времени обработки, а также алгоритм Чжоу-Джонса (2005) и алгоритм Висвалингама-Уайатта (1992), которые используют свойства треугольников внутри многоугольника, чтобы определить, какие вершины следует удалить. [17]
Для линейных объектов (и границ областей) сглаживание похоже на упрощение и в прошлом иногда сочеталось с упрощением. Разница в том, что сглаживание предназначено для того, чтобы сделать общую форму линии более простой за счет удаления мелких деталей; что на самом деле может потребовать больше вершин, чем оригинал. Упрощение имеет тенденцию делать изогнутую линию угловатой, в то время как сглаживание имеет тенденцию делать наоборот.
Принцип сглаживания также часто используется для обобщения растровых представлений полей , часто с использованием подхода Kernel smoother . Это был фактически один из первых опубликованных алгоритмов обобщения, Уолдо Тоблером в 1966 году. [3]
Также называется растворением, слиянием, агломерацией или объединением.
Эта операция, определенная Имхофом в 1937 году, [1] включает объединение соседних объектов в один объект того же типа в масштабах, где различие между ними не важно. Например, горная цепь может состоять из нескольких изолированных хребтов в естественной среде, но отображаться как непрерывная цепь на карте в мелком масштабе. Или соседние здания в комплексе могут быть объединены в одно «здание». Для правильной интерпретации читатель карты должен знать, что из-за ограничений масштаба объединенные элементы не являются идеальными изображениями природных или искусственных объектов. [18] Растворение — это распространенный инструмент ГИС, который используется для этой операции генерализации, [19] но были разработаны дополнительные инструменты ГИС-инструменты для конкретных ситуаций, таких как поиск очень маленьких полигонов и их слияние в соседние более крупные полигоны. Этот оператор отличается от агрегации, поскольку не происходит изменения размерности (т. е. линии растворяются в линиях, а полигоны в полигоны), а исходные и конечные объекты имеют один и тот же концептуальный тип (например, здание становится зданием).
Также называется объединением или регионализацией.
Агрегация — это слияние нескольких объектов в новый составной объект, часто с увеличенным измерением (обычно указывает на области). Новый объект имеет онтологический тип, отличный от исходных индивидуумов, поскольку он концептуализирует группу. Например, множество «зданий» можно превратить в один регион, представляющий «городскую территорию» (не «здание»), или кластер «деревьев» в «лес». [16] Некоторое программное обеспечение ГИС имеет инструменты агрегации, которые идентифицируют кластеры объектов и объединяют их. [20] Агрегация отличается от слияния тем, что она может работать в разных измерениях, например, агрегировать точки в линии, точки в полигоны, линии в полигоны и полигоны в полигоны, и что существует концептуальное различие между источником и продуктом.
Также называется уточнением распределения.
Typify — это оператор символики, который заменяет большой набор схожих объектов меньшим количеством репрезентативных символов, что приводит к более разреженной и чистой карте. [21] Например, область с десятками мин может быть обозначена только 3 или 4 символами мин, которые не представляют фактические местоположения шахт, а только общее присутствие мин в области. В отличие от оператора агрегации, который заменяет множество связанных объектов одним «групповым» объектом, символы, используемые в операторе typify, по-прежнему представляют отдельных лиц, просто «типичных» лиц. Он уменьшает плотность объектов, сохраняя при этом их относительное расположение и дизайн. При использовании оператора typify создается новый набор символов, он не изменяет пространственные данные. Этот оператор можно использовать для точечных, линейных и полигональных объектов.
Также называется Символизировать
Этот оператор уменьшает размерность объекта, например, распространенную практику представления городов (2-мерных) в виде точек (0-мерных) и дорог (2-мерных) в виде линий (1-мерных). Часто к результирующей геометрии применяется символ карты , чтобы дать общее представление о ее исходной протяженности, например, диаметр точки для представления населения города или толщина линии для представления количества полос на дороге. Имхоф (1937) подробно обсуждает эти конкретные обобщения. [1] Этот оператор часто имитирует похожую когнитивную практику обобщения. Например, однозначное обсуждение расстояния между двумя городами подразумевает точечную концептуализацию города, а использование фраз вроде «вверх по дороге» или «вдоль дороги» или даже уличных адресов подразумевает линейную концептуализацию дороги.
Этот оператор в первую очередь упрощает атрибуты объектов, хотя может также возникнуть геометрическое упрощение. Хотя категоризация используется для самых разных целей, в этом случае задача состоит в том, чтобы взять большой диапазон значений, который слишком сложен для представления на карте заданного масштаба, и сократить его до нескольких категорий, которые гораздо проще представить, особенно если географические закономерности приводят к большим регионам одной и той же категории. Примером может служить слой земельного покрова со 120 категориями и сгруппировать их в 5 категорий (городской, сельскохозяйственный, лесной, водный, пустыня), что сделает карту пространственно более простой. Для дискретных полей (также известных как категориальные покрытия или карты классов областей), представленных в виде векторных полигонов , таких как земельный покров , тип климата , тип почвы , зонирование города или геология поверхности , переклассификация часто приводит к появлению смежных полигонов с той же категорией, что требует последующей операции растворения для их объединения.
Преувеличение — это частичная корректировка геометрии или символики , чтобы сделать некоторые аспекты объекта больше, чем они есть на самом деле, чтобы сделать их более заметными, узнаваемыми или выше в визуальной иерархии . Например, набор узких поворотов на дороге будет проходить вместе на мелкомасштабной карте, поэтому дорога перерисовывается с петлями больше и дальше друг от друга, чем в реальности. Примером символики может быть рисование автомагистралей в виде толстых линий на мелкомасштабной карте, которые были бы шириной в мили, если измерять в соответствии с масштабом. Преувеличение часто требует последующей операции смещения, поскольку преувеличенный объект перекрывает фактическое местоположение близлежащих объектов, что требует их корректировки. [16]
Также называется разрешением конфликтов.
Смещение может быть использовано, когда два объекта находятся так близко друг к другу, что они будут перекрываться в меньших масштабах, особенно когда оператор преувеличения сделал два объекта больше, чем они есть на самом деле. Обычное место, где это может произойти, — это города Браззавиль и Киншаса по обе стороны реки Конго в Африке. Они оба являются столицами своих стран, и на обзорных картах они будут отображаться с немного большим символом, чем другие города. В зависимости от масштаба карты символы будут перекрываться. Смещая их оба от реки (и от их истинного местоположения), можно избежать наложения символов. Другой распространенный случай — когда дорога и железная дорога проходят параллельно друг другу. Китс (1973) был одним из первых, кто использовал современные термины для преувеличения и смещения и обсуждал их тесную связь, но они были признаны еще Имхофом (1937) [1] [15]
Это добавление символов или других деталей на карту меньшего масштаба, чтобы сделать определенную особенность более осмысленной, особенно когда такое понимание важно для цели карты. Распространенным примером является добавление символа моста, чтобы подчеркнуть, что пересечение дороги находится не на уровне земли, а на эстакаде . В большом масштабе такой символ может быть не нужен из-за другой символики и увеличенного пространства для отображения фактического отношения. Это добавление может показаться нелогичным, если думать об обобщении только как об удалении деталей. Это один из наименее часто упоминаемых операторов. [12]
По мере развития ГИС примерно с конца 1960-х годов и далее стала очевидна необходимость в автоматических алгоритмических методах генерализации. В идеале агентства, ответственные за сбор и поддержание пространственных данных, должны стараться сохранять только одно каноническое представление заданного объекта на максимально возможном уровне детализации. Таким образом, при изменении объекта в реальном мире будет обновляться только одна запись. [5] Из этих крупномасштабных данных в идеале должно быть возможно посредством автоматизированного генерализации создавать карты и другие продукты данных в любом требуемом масштабе. Альтернативой является поддержание отдельных баз данных, каждая из которых имеет масштаб, требуемый для заданного набора картографических проектов, каждая из которых требует внимания, когда что-то меняется в реальном мире.
В это время было разработано несколько общих подходов к обобщению:
На поверхности Земли гораздо больше мелких географических объектов, чем крупных, или на картах гораздо больше мелких объектов, чем крупных. Это понятие гораздо большего количества мелких объектов, чем крупных, также называется пространственной неоднородностью, которая была сформулирована как закон масштабирования. [22] Картографическое обобщение или любые методы картирования в целом по сути своей направлены на сохранение базового масштабирования многочисленных наименьших, очень немногих наибольших и некоторых между наименьшим и наибольшим. [23] Этот процесс картирования может быть эффективно и действенно достигнут с помощью разрывов «голова/хвост» , [24] [25] новой схемы классификации или инструмента визуализации для данных с распределением с тяжелым хвостом. Закон масштабирования, вероятно, заменит радикальный закон Тепфера, чтобы стать универсальным законом для различных методов картирования. В основе закона масштабирования лежит некий сдвиг парадигмы от евклидовой геометрии к фрактальной, от нерекурсивного мышления к рекурсивному мышлению. [26]
Феномен Балтимора [ нужна цитата ] или эффект Балтимора — это тенденция к тому, что город (или другой объект) исключается из карт из-за ограничений по пространству, в то время как более мелкие города включаются в ту же карту просто потому, что для их отображения есть место. Это явление обязано своим названием городу Балтимор, штат Мэриленд , который, как правило, исключается из карт из-за наличия более крупных городов в непосредственной близости в Среднеатлантических Соединенных Штатах, а именно Вашингтона, округ Колумбия , столицы Соединенных Штатов . И наоборот, поскольку более крупные города рядом с Балтимором появляются на картах, более мелкие и менее известные города, такие как Алис-Спрингс и Юлара в Австралии, также могут отображаться в том же масштабе просто потому, что для них достаточно места на карте. [ нужна цитата ]
Хотя феномен Балтимора чаще встречается на автоматизированных картографических сайтах, он не происходит в каждом масштабе. Популярные картографические сайты, такие как Google Maps, Bing Maps, OpenStreetMap и Yahoo Maps, начнут отображать Балтимор только на определенных уровнях масштабирования: 5-й, 6-й, 7-й и т. д. [ необходима цитата ]