stringtranslate.com

Формат файла ГИС

Формат файла ГИС — это стандарт для кодирования географической информации в компьютерный файл как специализированный тип формата файла для использования в географических информационных системах (ГИС) и других геопространственных приложениях. С 1970-х годов на основе различных моделей данных были созданы десятки форматов для различных целей. Они были созданы правительственными картографическими агентствами (такими как Геологическая служба США или Национальное агентство геопространственной разведки ), поставщиками программного обеспечения ГИС, организациями по стандартизации, такими как Открытый геопространственный консорциум , неформальными сообществами пользователей и даже отдельными разработчиками.

История

Первые ГИС-установки 1960-х годов, такие как Канадская географическая информационная система, были основаны на специальном программном обеспечении и хранили данные в специальных файловых структурах, разработанных для нужд конкретного проекта. По мере их появления их можно будет сравнивать, чтобы найти лучшие практики и общие структуры. [1] Когда в 1970-х и начале 1980-х годов было разработано программное обеспечение ГИС общего назначения, включая программы академических лабораторий, таких как Гарвардская лаборатория компьютерной графики и пространственного анализа , правительственные учреждения (например, Map Overlay and Statistical System (MOSS) разработали Службой рыболовства и дикой природы США и Бюро землеустройства ) и новыми компаниями-разработчиками программного обеспечения ГИС, такими как Esri и Intergraph , каждая программа была построена на основе собственного проприетарного (и часто секретного) формата файлов. [2] Поскольку каждая ГИС-установка была фактически изолирована от всех остальных, обмен данными между ними не был основным фактором.

К началу 1990-х годов распространение ГИС во всем мире и растущая потребность в обмене данными, вскоре ускорившаяся появлением Всемирной паутины и инфраструктур пространственных данных , привели к необходимости совместимых данных и стандартных форматов. Первой попыткой стандартизации стал стандарт передачи пространственных данных США , выпущенный в 1994 году и предназначенный для кодирования широкого спектра данных федерального правительства. [3] Хотя этот конкретный формат не получил широкой поддержки, он привел к другим усилиям по стандартизации, особенно к Открытому геопространственному консорциуму (OGC), который разработал или принял несколько независимых от поставщиков стандартов, некоторые из которых были приняты Международными стандартами. Организация (ИСО). [4]

Еще одним событием 1990-х годов стал публичный выпуск проприетарных форматов файлов поставщиками программного обеспечения ГИС, что позволило использовать их в другом программном обеспечении. Наиболее ярким примером этого стала публикация формата Esri Shapefile [5], который к концу 1990-х годов стал самым популярным де-факто стандартом для обмена данными во всей геопространственной отрасли. [6] Когда проприетарные форматы не использовались совместно (например, покрытие ESRI ARC/INFO), разработчики программного обеспечения часто перепроектировали их, чтобы обеспечить импорт и экспорт в другое программное обеспечение, что еще больше облегчало обмен данными. Одним из результатов этого стало появление бесплатных программных библиотек с открытым исходным кодом , таких как Библиотека абстракции геопространственных данных (GDAL) , которые значительно облегчили интеграцию пространственных данных в любом формате в разнообразное программное обеспечение. [7]

В 2000-е годы потребность в специализированных пространственных файлах несколько снизилась благодаря появлению пространственных баз данных , которые включали пространственные данные в реляционные базы данных общего назначения. Однако новые форматы файлов продолжают появляться, особенно с распространением веб-картографии; такие форматы, как язык разметки Keyhole (KML) и GeoJSON , легче интегрировать в языки веб-разработки, чем традиционные файлы ГИС.

Характеристики формата

Для хранения пространственных данных создано более ста различных форматов, из которых 20–30 в настоящее время широко используются для различных целей. Их можно отличить по нескольким признакам:

Растровые форматы

Цифровая модель рельефа, карта (изображение) и векторные данные

Как и любое цифровое изображение, растровые данные ГИС основаны на регулярной мозаике пространства в прямоугольной сетке строк и столбцов ячеек ( также известных как пиксели ), при этом в каждой ячейке хранится измеренное значение. Основное отличие от фотографии заключается в том, что сетка привязана к географическому пространству, а не к полю зрения. Разрешение набора растровых данных — это ширина его ячейки в наземных единицах.

Поскольку сетка представляет собой образец непрерывного пространства, растровые данные чаще всего используются для представления географических полей , в которых свойство изменяется непрерывно или дискретно в пространстве. Общие примеры включают изображения дистанционного зондирования , рельеф/высоту над уровнем моря , плотность населения , погоду и климат , свойства почвы и многие другие. Растровые данные могут представлять собой изображения, в которых каждый пиксель (или ячейка) содержит значение цвета. Значение, записанное для каждой ячейки, может иметь любой уровень измерения , включая дискретное качественное значение, такое как тип землепользования, или непрерывное количественное значение, такое как температура, или нулевое значение , если данные недоступны. Хотя растровая ячейка хранит одно значение, ее можно расширить с помощью растровых каналов для представления цветов RGB (красный, зеленый, синий), цветовых карт (сопоставление между тематическим кодом и значением RGB) или расширенной таблицы атрибутов с одной строкой. для каждого уникального значения ячейки. Его также можно использовать для представления отдельных географических объектов , но обычно только в исключительных случаях.

Растровые данные хранятся в различных форматах; от стандартной файловой структуры TIFF, JPEG и т. д. до данных больших двоичных объектов (BLOB), хранящихся непосредственно в системе управления реляционными базами данных (RDBMS), аналогично другим классам объектов на основе векторов. Хранилище базы данных при правильной индексации обычно позволяет быстрее извлекать растровые данные, но может потребовать хранения миллионов записей значительного размера.

Примеры растровых форматов

Векторные форматы

Простая векторная карта, в которой используются все векторные элементы: точки для колодцев, линии для рек и многоугольник для озера.

Набор векторных данных (иногда называемый набором объектных данных) хранит информацию о дискретных объектах, используя кодировку векторной логической модели данных для представления местоположения или геометрии каждого объекта, а также кодировку других его свойств, которая обычно основана на технологии реляционных баз данных . . Обычно один набор данных собирает информацию о наборе тесно связанных или похожих объектов, например обо всех дорогах города.

Модель данных Vector использует координатную геометрию для представления каждой фигуры в виде одного из нескольких геометрических примитивов , чаще всего точек (одна координата нулевого измерения ), линий (одномерный упорядоченный список координат, соединенных прямыми линиями) и многоугольников ( одномерный упорядоченный список координат, соединенных прямыми линиями). самозамыкающаяся граничная линия, ограничивающая двумерную область). Многие структуры данных были разработаны для кодирования этих примитивов в виде цифровых данных, но большинство современных форматов векторных файлов основаны на спецификации простых функций Открытого геопространственного консорциума (OGC) , часто напрямую включая ее хорошо известный текст (WKT) или хорошо известный двоичный файл. (WKB) кодировки.

Помимо геометрии каждого объекта, набор векторных данных также должен иметь возможность хранить его атрибуты . Например, база данных, описывающая озера, может содержать информацию о глубине каждого озера, качестве воды и уровне загрязнения. С 1970-х годов почти все форматы векторных файлов приняли модель реляционной базы данных либо в принципе, либо непосредственно с использованием программного обеспечения РСУБД . Таким образом, весь набор данных хранится в таблице , где каждая строка представляет один объект, содержащий столбцы для каждого атрибута. [12] : 256 

Для интеграции геометрии и атрибутов в единую структуру формата векторного файла использовались две стратегии: [13]

Геопространственная топология часто является важной частью векторных данных, представляя внутренние пространственные отношения (особенно смежность) между объектами. Топология векторных форматов файлов управляется четырьмя способами. В топологических структурах данных , особенно в гарвардской POLYVRT и ее преемнике , покрытии ARC/INFO , топологические связи между точками, линиями и полигонами являются неотъемлемой частью кодирования этих функций. [8] : 46–49  И наоборот, нетопологические или спагетти-данные (такие как шейп-файл Esri и большинство пространственных баз данных ) не содержат топологической информации, причем каждая геометрия полностью независима от всех остальных. Набор топологических данных (часто используемый в сетевом анализе ) дополняет данные спагетти отдельным файлом, кодирующим топологические соединения. [12] : 218  База правил топологии — это список желаемых правил топологии, используемых для обеспечения пространственной целостности данных спагетти, таких как «полигоны округов не должны перекрываться» и «полигоны штатов должны иметь общие границы с полигонами округов». [13]

Наборы векторных данных обычно представляют собой отдельные географические объекты , такие как здания, деревья и округа. Однако их также можно использовать для представления географических полей путем хранения мест, где была отобрана выборка из пространственно непрерывного поля. Точки выборки (например, метеостанции и сети датчиков ), контурные линии и триангулированные нерегулярные сети (TIN) используются для представления высоты или других значений, которые непрерывно изменяются в пространстве. TIN записывают значения в точках, которые соединяются линиями, образуя неправильную сетку треугольников. Грань треугольников представляет поверхность местности.

Примеры форматов векторных файлов

Форматы, которые обычно используются в настоящее время:

Исторические форматы, редко используемые сегодня:

Преимущества и недостатки

Есть несколько важных преимуществ и недостатков использования растровой или векторной модели данных для представления реальности:

Интегрированные форматы файлов

Современные объектно-реляционные базы данных теперь могут хранить разнообразные сложные данные, используя тип данных больших двоичных объектов , включая как растровые сетки, так и векторную геометрию. Это позволяет некоторым системам пространственных баз данных хранить данные обеих моделей в одной базе данных.

Смотрите также

Рекомендации

  1. ^ Томлинсон, Роджер Ф.; Калкинс, Хью В.; Марбл, Дуэйн Ф. (1976). Компьютерная обработка географических данных . ЮНЕСКО Пресс.
  2. ^ Крисман, Ник (2006). Составление карты неизведанного: как компьютерное картографирование в Гарварде стало ГИС . Эсри Пресс. ISBN 978-1-58948-118-3.
  3. ^ «Стандарт передачи пространственных данных» . Геологическая служба США. дои : 10.3133/fs07799 . Проверено 6 января 2023 г.
  4. ^ «Стандарты OGC». Открытый геопространственный консорциум . ОГК . Проверено 6 января 2023 г.
  5. ^ ab «Техническое описание шейп-файла ESRI» (PDF) . Техническая библиотека Esri . Эсри. Июль 1998 года . Проверено 6 января 2023 г.
  6. ^ Ло, Чор Панг; Юнг, Альберт К.В. (2002). Концепции и методы географических информационных систем . Прентис Холл. п. 185. ИСБН 0-13-080427-4.
  7. ^ «Программное обеспечение, использующее GDAL» . Библиотека абстракции географических данных . ОСГЕО . Проверено 6 января 2023 г.
  8. ^ Аб Болстад, Пол (2019). Основы ГИС: первый учебник по географическим информационным системам . Анн-Арбор, Мичиган: XanEdu. п. 69. ИСБН 978-1-59399-552-2.
  9. ^ "Дуговая оцифрованная растровая графика (ADRG)" . Цифровое сохранение . Библиотека Конгресса . 25 сентября 2011 г. Проверено 13 марта 2014 г.
  10. ^ «Различные поддерживаемые растровые форматы GDAL» .
  11. ^ «Формат растрового продукта» . Цифровое сохранение . Библиотека Конгресса . 27 октября 2011 г. Проверено 13 марта 2014 г.
  12. ^ аб Лонгли, Пол А.; Гудчайлд, Майкл Ф.; Магуайр, Дэвид Дж.; Ринд, Дэвид В. (2011). Географические информационные системы и наука (3-е изд.). Уайли.
  13. ^ Аб Чанг, Кан-цун (2014). Введение в географические информационные системы (7-е изд.). МакГроу-Хилл. стр. 50–57. ISBN 978-0-07-352290-6.
  14. ^ ab «Архитектура базы геоданных». Документация ArcGIS Pro . Эсри . Проверено 8 января 2023 г.
  15. ^ «Стандарт кодирования GeoPackage OGC» . Стандарты Открытого геопространственного консорциума . ОГК . Проверено 8 января 2023 г.