Геокод — это код , представляющий географическую сущность ( местоположение или объект ). Это уникальный идентификатор сущности, позволяющий отличить ее от других в конечном наборе географических сущностей. В общем случае геокод — это понятный человеку и короткий идентификатор.
Типичные геокоды и представляемые ими сущности:
AF
(например, для Афганистана или BR
для Бразилии ), и его соглашения о подразделениях, такие как коды подразделений AF (например, AF-GHO
для провинции Гор ) или коды подразделений BR (например, для штата Амазонас ).BR-AM
6vjyngd
в центре Бразилии ) или код OLC (например, ячейка ~0,004 км 258PJ642P+4
в той же точке).70040
представляет центральную область Бразилии для почтовой рассылки).Стандарт ISO 19112:2019 (раздел 3.1.2) принял термин «географический идентификатор» вместо геокода, чтобы охватить длинные метки: пространственная ссылка в форме метки или кода, который идентифицирует местоположение . Например, для ISO название страны «Китайская Народная Республика» является меткой.
Геокоды в основном используются (в основном как атомарный тип данных ) для маркировки , обеспечения целостности данных , геотегирования и пространственного индексирования .
В теоретической информатике система геокодирования представляет собой хеш-функцию, сохраняющую локальность .
Существуют некоторые общие аспекты многих геокодов (или систем геокодирования), которые можно использовать в качестве критериев классификации:
Набор всех геокодов, используемых в качестве уникальных идентификаторов ячеек полного покрытия географической поверхности (или любой четко определенной области, такой как страна или океаны), представляет собой систему геокодирования (также называемую схемой геокодирования ). Синтаксис и семантика геокодов также являются компонентами определения системы:
/[A-Z]{2,2}/
).Многие синтаксические и семантические характеристики также обобщены посредством классификации.
Любой геокод может быть переведен из формального (и расширенного) выражения географической сущности, или наоборот, геокод может быть переведен в сущность. Первый называется процесс кодирования , второй — декодирования . Действующие лица и процесс, вовлеченные в процесс, как определено OGC , [3] :
В приложениях пространственного индексирования геокод также может быть преобразован между понятным человеку (например, шестнадцатеричным ) и внутренним (например, двоичным 64-битным целым числом без знака ) представлениями.
Геокоды, такие как коды стран , коды городов и т. д., происходят из таблицы официальных названий и соответствующих официальных кодов и геометрий (обычно многоугольников административных областей). «Официальный» в контексте контроля и консенсуса, обычно таблица, контролируемая организацией по стандартизации или государственным органом. Таким образом, наиболее общим случаем является таблица стандартных названий и соответствующих стандартных кодов (и ее официальных геометрий).
Строго говоря, «имя», связанное с геокодом, является топонимом , а таблица (например, топоним к стандартному коду) является ресурсом для разрешения топонима : это процесс установления связи , обычно осуществляемый программным агентом, между топонимом и «однозначным пространственным следом того же места». [4] Любая стандартизированная система разрешения топонима, имеющая коды или закодированные сокращения, может использоваться в качестве системы геокодирования . Агент «разрешителя» в этом контексте также является геокодером .
Иногда имена переводятся в числовые коды, чтобы быть компактными или машиночитаемыми. Поскольку числа в этом случае являются идентификаторами имен, мы можем рассматривать «числовые имена» — так что этот набор кодов будет своего рода «системой стандартных имен».
В контексте геокодирования разбиение пространства — это процесс деления географического пространства на два или более непересекающихся подмножества , в результате чего получается мозаика подразделений. Каждое подразделение может быть снова разделено рекурсивно , в результате чего получается иерархическая мозаика.
Когда названия подразделений выражены в виде кодов, а синтаксис кода может быть разложен на родительско-дочерние отношения с помощью четко определенной синтаксической схемы, набор геокодов настраивает иерархическую систему. Фрагмент геокода (связанный с названием подразделения) может быть аббревиатурой, числовым или буквенно-цифровым кодом.
Популярным примером является система геокодирования ISO 3166-2 , представляющая названия стран и названия соответствующих административных единиц, разделенных дефисом. Например , ГерманияDE
— простой геокод, и ее подразделения (показаны) для Баден-Вюртемберга , для Баварии , ..., для Северного Рейна-Вестфалии и т. д. Область действия — только первый уровень иерархии. Для большего количества уровней существуют другие соглашения, такие как код HASC. [5] [6] Коды HASC являются буквенными, а их фрагменты имеют постоянную длину (2 буквы). Примеры:DE-BW
DE-BY
DE-NW
DE.NW
- Северный Рейн-Вестфалия . Двухуровневый иерархический геокод.DE.NW.CE
- Крайс Косфельд . Трехуровневый иерархический геокод.Два геокода иерархической системы геокодирования с одинаковым префиксом представляют разные части одного и того же местоположения. Например, DE.NW.CE
и DE.NW.BN
представляет географически внутренние части DE.NW
, общий префикс.
Изменяя критерии подразделения, мы можем получить другие иерархические системы. Например, для гидрологических критериев существует система геокодирования, гидрологический код единицы США (HUC), который является числовым представлением названий бассейнов в иерархической схеме синтаксиса (первый уровень проиллюстрирован). Например, HUC 17
является идентификатором " Тихоокеанского северо-западного бассейна Колумбии "; HUC 1706
" Нижнего бассейна Снейк ", пространственного подмножества HUC 17
и надмножества 17060102
("река Имнаха").
Вдохновленная классическими буквенно-цифровыми сетками , дискретная глобальная сетка ( DGG ) представляет собой регулярную мозаику , которая покрывает всю поверхность Земли (земной шар). Регулярность мозаики определяется использованием ячеек одинаковой формы во всей сетке или «почти одинаковой формы и почти одинаковой площади» в интересующем регионе, например, стране.
Все ячейки сетки имеют идентификатор (ID ячейки DGG), а центр ячейки может использоваться в качестве опорного для преобразования ID ячейки в географическую точку. Когда компактное, понятное человеку выражение ID ячейки стандартизировано, оно становится геокодом.
Геокоды разных систем геокодирования могут представлять одну и ту же позицию на земном шаре с одинаковой формой и точностью, но отличаться длиной строки , цифровым алфавитом, разделителями и т. д. Неглобальные сетки также различаются по области действия и в целом геометрически оптимизированы (избегают наложений, пробелов или потери единообразия) для локального использования.
Каждая ячейка сетки может быть преобразована в новую локальную сетку в повторяющемся процессе . В проиллюстрированном примере ячейка TQ 2980
является подъячейкой TQ 29
, то есть подъячейкой TQ
. Система географических регулярных сеточных ссылок является основой иерархической системы геокодирования .
Два геокода иерархической системы сетки геокодирования могут использовать правило префикса: геокоды с одинаковым префиксом представляют разные части одного и того же более широкого местоположения . Снова используем боковую иллюстрацию: TQ 28
и TQ 61
представляет географически внутренние части , TQ
общий префикс.
Иерархический геокод может быть разделен на ключи. Geohash 6vd23gq
— это ключ q
ячейки 6vd23g
, которая является ячейкой 6vd23
(ключа g
), и так далее, поцифровые ключи. OLC 58PJ642P
— это ключ 48
ячейки 58PJ64
, которая является ячейкой 58Q8
(ключа 48
), и так далее, двузначные ключи. В случае OLC есть вторая схема ключей после +
разделителя: 58PJ642P+48
— это ключ 2
ячейки 58PJ642P+4
. Он использует две схемы ключей. Некоторые системы геокодирования (например, геометрия S2) также используют начальный префикс с неиерархической схемой ключей.
В целом, как техническое и некомпактное необязательное представление, системы геокодирования (основанные на иерархических сетках) также предлагают возможность выражения идентификатора своей ячейки с помощью мелкозернистой схемы, более длинного пути ключей. Например, Geohash 6vd2
, который является кодом base32 , может быть расширен до base4 0312312002
, который также является схемой с ключами по цифрам. Геометрически каждая ячейка Geohash представляет собой прямоугольник, который рекуррентно подразделяет пространство на 32 новых прямоугольника, поэтому разделение base4 на 4 является пределом кодирования-расширения. [7]
Однородность формы и площади ячеек в сетке может быть важна для других целей, например, для пространственной статистики . Существуют стандартные способы построения сетки, покрывающей весь земной шар с ячейками равной площади, правильной формы и другими свойствами: Дискретная глобальная система сеток (DGGS) представляет собой ряд дискретных глобальных сеток, удовлетворяющих всем стандартизированным требованиям, определенным в 2017 году OGC . [ 8] Когда читаемые человеком коды, полученные из идентификаторов ячеек DGGS, также стандартизированы, ее можно классифицировать как систему геокодирования на основе DGGS .
Существуют также смешанные системы, использующие синтаксическое разделение, где, например, первая часть (префикс кода) является кодом имени, а другая часть (суффикс кода) является кодом сетки. Пример:
FR-4J.Q2
— , где FR
— код имени [9] , а 4J.Q2
— код сетки. Семантически Франция — это контекст, для получения ее локальной сетки.Для мнемонической связной семантики в приложениях мелкозернистого геокодирования наиболее подходящими являются смешанные решения.
Любая система геокодирования, основанная на регулярной сетке, в целом также является более коротким способом выражения широтной/долготной координаты. Но геокод с более чем 6 символами трудно запомнить. С другой стороны, геокод, основанный на стандартном имени (или сокращении или полном имени), легче запомнить.
Это говорит о том, что «смешанный код» может решить проблему, сократив количество символов, когда имя может использоваться как «контекст» для геокода на основе сетки. Например, в книге, где автор говорит «все геокоды здесь контекстуализированы городом главы». В главе о Париже, где все места имеют Geohash с префиксом u09
, этот код можно удалить —. Например, Geohash u09tut
можно сократить до tut
, или, с помощью явного кода для контекста «FR-Paris tut
». Это возможно только тогда, когда разрешение контекста (например, перевод из «FR-Paris» в префикс u09
) хорошо известно.
Фактически существует методология для иерархических геокодов на основе сетки с неизменяемым размером, где префикс кода описывает более широкую область, которая может быть связана с именем. Таким образом, можно сократить, заменив префикс на связанный контекст. Наиболее распространенным контекстом является официальное имя. Примеры:
Примеры столбца смешанной ссылки значительно проще, чем запоминание столбца кода DGG . Методы различаются, например, OLC можно сократить, исключив его первые четыре цифры и прикрепив подходящую достаточно близкую локализацию. [10]
Когда смешанная ссылка также короткая (9 символов во втором примере) и есть синтаксическое соглашение для ее выражения (предположим CP‑PR~bgxed
), это соглашение генерирует новую систему геокодирования имени и сетки. Это не относится к первому примеру, поскольку, строго говоря, "Cape Verde, Praia" не является кодом.
Чтобы быть одновременно системой имен и сеток и смешанным соглашением ссылок, система должна быть обратимой. Чистые системы имен и сеток, такие как Mapcode , без возможности преобразования в глобальный код, не являются смешанными ссылками, поскольку не существует алгоритма для преобразования смешанного геокода в геокод на основе сетки.
Геокоды, используемые и имеющие общую область применения:
Геокоды могут использоваться вместо официальных названий улиц и/или номеров домов , особенно когда данному местоположению не был присвоен адрес властями. Их также можно использовать в качестве «альтернативного адреса», если его можно преобразовать в Geo URI . Даже если геокод не является официальным обозначением местоположения, его можно использовать в качестве «местного стандарта», чтобы разрешить домам получать посылки, получать доступ к экстренным службам, регистрироваться для голосования и т. д.
Геокоды в использовании, как почтовые индексы . Геокод, признанный Всемирным почтовым союзом и принятый страной в качестве «официального почтового индекса» , также является допустимым почтовым индексом. Не все почтовые индексы являются географическими, и для некоторых систем почтовых индексов существуют коды, которые не являются геокодами (например, в системе Великобритании ). Примеры, а не полный список:
Геокоды, используемые в сфере телефонии и радиовещания:
Геокоды, используемые в определенной области применения:
Другие геокоды:
Некоторые стандарты и серверы имен включают: ISO 3166, FIPS, INSEE, Geonames, IATA и ICAO .
Также был предложен ряд коммерческих решений: