Пространственный анализ — это любой из формальных методов , который изучает сущности, используя их топологические , геометрические или географические свойства. Пространственный анализ включает в себя множество методов, использующих различные аналитические подходы, особенно пространственную статистику . Он может применяться в таких разнообразных областях, как астрономия , с ее исследованиями размещения галактик в космосе , или в инженерии по производству чипов, с ее использованием алгоритмов «места и маршрута» для построения сложных структур проводки. В более узком смысле пространственный анализ — это геопространственный анализ , метод, применяемый к структурам в масштабе человека, в первую очередь при анализе географических данных . Он также может применяться в геномике, как в данных транскриптомики .
В пространственном анализе возникают сложные проблемы, многие из которых не определены и не решены полностью, но составляют основу для текущих исследований. Наиболее фундаментальной из них является проблема определения пространственного расположения изучаемых объектов. Классификация методов пространственного анализа затруднена из-за большого количества различных областей исследований, различных фундаментальных подходов, которые могут быть выбраны, и множества форм, которые могут принимать данные.
Пространственный анализ начался с ранних попыток картографии и геодезии . Геодезия восходит как минимум к 1400 г. до н. э. в Египте: размеры налогооблагаемых земельных участков измерялись с помощью измерительных веревок и отвесов. [1] Многие области способствовали ее развитию в современной форме. Биология внесла свой вклад посредством ботанических исследований глобального распространения растений и их локальных местоположений, этологических исследований перемещения животных, ландшафтно-экологических исследований растительных блоков, экологических исследований пространственной динамики популяций и изучения биогеографии . Эпидемиология внесла свой вклад посредством ранних работ по картированию заболеваний, в частности, работы Джона Сноу по картированию вспышки холеры, с исследованиями по картированию распространения заболеваний и с исследованиями местоположения для оказания медицинской помощи. Статистика внесла большой вклад посредством работы в области пространственной статистики. Экономика внесла значительный вклад посредством пространственной эконометрики . Географическая информационная система в настоящее время является основным участником из-за важности географического программного обеспечения в современном аналитическом инструментарии. Дистанционное зондирование внесло большой вклад в морфометрический и кластерный анализ. Компьютерная наука внесла большой вклад посредством изучения алгоритмов, особенно в вычислительной геометрии . Математика продолжает предоставлять фундаментальные инструменты для анализа и раскрывать сложность пространственной сферы, например, с недавними работами по фракталам и масштабной инвариантности . Научное моделирование обеспечивает полезную основу для новых подходов. [ необходима цитата ]
Пространственный анализ сталкивается со многими фундаментальными проблемами в определении своих объектов изучения, в построении аналитических операций, которые будут использоваться, в использовании компьютеров для анализа, в ограничениях и особенностях анализов, которые известны, и в представлении аналитических результатов. Многие из этих проблем являются активными предметами современных исследований. [ необходима цитата ]
Распространенные ошибки часто возникают в пространственном анализе, некоторые из-за математики пространства, некоторые из-за особых способов пространственного представления данных, некоторые из-за доступных инструментов. Данные переписи, поскольку они защищают индивидуальную конфиденциальность путем агрегирования данных в локальные единицы, поднимают ряд статистических вопросов. Фрактальная природа береговой линии делает точные измерения ее длины сложными, если не невозможными. Компьютерное программное обеспечение, подгоняющее прямые линии к изгибу береговой линии, может легко вычислить длины линий, которые оно определяет. Однако эти прямые линии могут не иметь никакого внутреннего значения в реальном мире, как это было показано для береговой линии Британии . [ необходима цитата ]
Эти проблемы представляют собой проблему в пространственном анализе из-за силы карт как средства представления. Когда результаты представляются в виде карт, представление объединяет пространственные данные, которые в целом точны, с аналитическими результатами, которые могут быть неточными, что приводит к впечатлению, что аналитические результаты более точны, чем показывают данные. [2]
Проблема изменяемой площадной единицы (MAUP) является источником статистического смещения , которое может существенно повлиять на результаты проверки статистических гипотез . MAUP влияет на результаты, когда точечные измерения пространственных явлений агрегируются в пространственные разделы или площадные единицы (такие как регионы или районы ), как, например, плотность населения или показатели заболеваемости . [3] [4] Полученные сводные значения (например, итоги, показатели, пропорции, плотности) зависят как от формы, так и от масштаба агрегационной единицы. [5]
Например, данные переписи могут быть объединены в округа, переписные участки, почтовые индексы, полицейские участки или любые другие произвольные пространственные разбиения. Таким образом, результаты объединения данных зависят от выбора картографом того, какую «изменяемую территориальную единицу» использовать в своем анализе. Карта- карта переписи , вычисляющая плотность населения с использованием границ штатов, даст радикально иные результаты, чем карта, которая вычисляет плотность на основе границ округов. Кроме того, границы округов переписи также могут меняться с течением времени, [6] что означает, что MAUP необходимо учитывать при сравнении прошлых данных с текущими данными.В теории вычислительной сложности задача коммивояжёра ( TSP) задаёт следующий вопрос: «Данный список городов и расстояний между каждой парой городов, каков кратчайший возможный маршрут, который посещает каждый город ровно один раз и возвращается в исходный город?» Это NP-трудная задача комбинаторной оптимизации , важная в теоретической информатике и исследовании операций .
Задача о путешествующем покупателе , задача о маршрутизации транспортного средства и задача о кольцевой звезде [15] представляют собой три обобщения задачи TSP.
Решающая версия TSP (где задана длина L , задача состоит в том, чтобы решить, есть ли в графе тур, длина которого не превышает L ) относится к классу NP-полных задач. Таким образом, возможно, что худшее время выполнения для любого алгоритма для TSP увеличивается суперполиномиально (но не более чем экспоненциально ) с числом городов.
Проблема была впервые сформулирована в 1930 году и является одной из наиболее интенсивно изучаемых проблем оптимизации. Она используется в качестве эталона для многих методов оптимизации. Несмотря на то, что проблема является вычислительно сложной, известно много эвристик и точных алгоритмов , так что некоторые примеры с десятками тысяч городов могут быть решены полностью, и даже проблемы с миллионами городов могут быть аппроксимированы с точностью до небольшой доли 1%. [16]В геометрии задача Вебера , названная в честь Альфреда Вебера , является одной из самых известных задач в теории местоположения . Она требует нахождения точки на плоскости, которая минимизирует сумму транспортных расходов из этой точки в n пунктов назначения, где различные пункты назначения связаны с различными расходами на единицу расстояния.
Задача Вебера обобщает геометрическую медиану , которая предполагает, что транспортные расходы на единицу расстояния одинаковы для всех пунктов назначения, и задачу вычисления точки Ферма , геометрической медианы трех точек. По этой причине ее иногда называют задачей Ферма–Вебера, хотя то же самое название использовалось и для задачи невзвешенной геометрической медианы. Задача Вебера, в свою очередь, обобщается задачей притяжения–отталкивания, которая допускает, чтобы некоторые из расходов были отрицательными, так что большее расстояние от некоторых точек является лучшим.Определение пространственного присутствия сущности ограничивает возможный анализ, который может быть применен к этой сущности, и влияет на окончательные выводы, которые могут быть сделаны. Хотя это свойство в основе своей верно для любого анализа , оно особенно важно в пространственном анализе, поскольку инструменты для определения и изучения сущностей благоприятствуют конкретным характеристикам изучаемых сущностей. Статистические методы благоприятствуют пространственному определению объектов как точек, поскольку существует очень мало статистических методов, которые работают непосредственно с линейными, площадными или объемными элементами. Компьютерные инструменты благоприятствуют пространственному определению объектов как однородных и отдельных элементов из-за ограниченного числа элементов базы данных и доступных вычислительных структур, а также легкости, с которой эти примитивные структуры могут быть созданы. [ необходима цитата ]
Пространственная зависимость — это пространственное соотношение значений переменных (для тем, определенных в пространстве, таких как осадки ) или местоположений (для тем, определенных как объекты, таких как города). Пространственная зависимость измеряется как существование статистической зависимости в наборе случайных величин , каждая из которых связана с различным географическим положением . Пространственная зависимость важна в приложениях, где разумно постулировать существование соответствующего набора случайных величин в местах, которые не были включены в выборку. Таким образом, осадки могут быть измерены в наборе мест установки дождемеров, и такие измерения могут рассматриваться как результаты случайных величин, но осадки явно выпадают в других местах и снова будут случайными. Поскольку осадки проявляют свойства автокорреляции , методы пространственной интерполяции могут использоваться для оценки количества осадков в местах, близких к местам измерения. [32]
Как и в случае с другими типами статистической зависимости, наличие пространственной зависимости обычно приводит к тому, что оценки среднего значения из выборки оказываются менее точными, чем если бы выборки были независимыми, хотя при наличии отрицательной зависимости выборочное среднее значение может быть лучше, чем в случае независимости. Другая проблема, нежели оценка общего среднего, — это проблема пространственной интерполяции : здесь проблема заключается в оценке ненаблюдаемых случайных результатов переменных в местах, промежуточных по отношению к местам, где проводятся измерения, при этом существует пространственная зависимость между наблюдаемыми и ненаблюдаемыми случайными величинами. [ необходима цитата ]
Инструменты для исследования пространственной зависимости включают: пространственную корреляцию , пространственные ковариационные функции и полувариограммы . Методы пространственной интерполяции включают Кригинг , который является типом наилучшего линейного несмещенного прогнозирования . Тема пространственной зависимости важна для геостатистики и пространственного анализа. [ необходима ссылка ]
Пространственная зависимость — это ковариация свойств в географическом пространстве: характеристики в проксимальных местоположениях, по-видимому, коррелируют, как положительно, так и отрицательно. [33] Пространственная зависимость приводит к проблеме пространственной автокорреляции в статистике, поскольку, как и временная автокорреляция, это нарушает стандартные статистические методы, которые предполагают независимость между наблюдениями. Например, регрессионный анализ, который не компенсирует пространственную зависимость, может иметь нестабильные оценки параметров и давать ненадежные тесты значимости. Пространственные регрессионные модели (см. ниже) фиксируют эти отношения и не страдают от этих недостатков. Также уместно рассматривать пространственную зависимость как источник информации, а не как что-то, что нужно исправить. [34]
Эффекты расположения также проявляются как пространственная неоднородность или кажущаяся вариация процесса относительно местоположения в географическом пространстве. Если пространство не является однородным и безграничным, каждое местоположение будет иметь некоторую степень уникальности относительно других местоположений. Это влияет на отношения пространственной зависимости и, следовательно, на пространственный процесс. Пространственная неоднородность означает, что общие параметры, оцененные для всей системы, могут неадекватно описывать процесс в любом заданном месте. [ необходима цитата ]
Пространственная ассоциация — это степень, в которой вещи расположены в пространстве схожим образом. Анализ закономерностей распределения двух явлений выполняется путем наложения карт. Если распределения схожи, то пространственная ассоциация сильна, и наоборот. [35] В географической информационной системе анализ может быть выполнен количественно. Например, набор наблюдений (в виде точек или извлеченных из растровых ячеек) в совпадающих местоположениях может быть пересечён и исследован с помощью регрессионного анализа .
Подобно пространственной автокорреляции , это может быть полезным инструментом для пространственного прогнозирования. В пространственном моделировании концепция пространственной ассоциации позволяет использовать ковариаты в уравнении регрессии для прогнозирования географического поля и, таким образом, создания карты.
Второе измерение пространственной ассоциации (SDA) раскрывает связь между пространственными переменными посредством извлечения географической информации в местах за пределами выборок. SDA эффективно использует недостающую географическую информацию за пределами выборок в методах первого измерения пространственной ассоциации (FDA), которые исследуют пространственную ассоциацию с использованием наблюдений в местах выборок. [36]
Масштаб пространственных измерений является постоянной проблемой в пространственном анализе; более подробная информация доступна в теме проблема изменяемой площади единицы (MAUP). Ландшафтные экологи разработали ряд масштабно-инвариантных метрик для аспектов экологии, которые являются фрактальными по своей природе. [37] В более общих чертах, ни один масштабно-независимый метод анализа не является общепринятым для пространственной статистики. [ необходима ссылка ]
Пространственная выборка включает определение ограниченного числа местоположений в географическом пространстве для точного измерения явлений, которые подвержены зависимости и неоднородности. [ требуется ссылка ] Зависимость предполагает, что поскольку одно место может предсказать значение другого места, нам не нужны наблюдения в обоих местах. Но неоднородность предполагает, что это отношение может меняться в пространстве, и поэтому мы не можем доверять наблюдаемой степени зависимости за пределами региона, который может быть небольшим. Базовые схемы пространственной выборки включают случайную, кластерную и систематическую. Эти базовые схемы могут применяться на нескольких уровнях в обозначенной пространственной иерархии (например, городская территория, город, район). Также возможно использовать вспомогательные данные, например, используя значения свойств в качестве руководства в схеме пространственной выборки для измерения уровня образования и дохода. Пространственные модели, такие как статистика автокорреляции, регрессия и интерполяция (см. ниже), также могут диктовать дизайн выборки. [ требуется ссылка ]
Фундаментальные проблемы пространственного анализа приводят к многочисленным проблемам в анализе, включая предвзятость, искажение и прямые ошибки в полученных выводах. Эти проблемы часто взаимосвязаны, но были предприняты различные попытки отделить конкретные проблемы друг от друга. [38]
Обсуждая береговую линию Британии , Бенуа Мандельброт показал, что некоторые пространственные концепции по своей сути бессмысленны, несмотря на презумпцию их обоснованности. Длины в экологии напрямую зависят от масштаба, в котором они измеряются и ощущаются. Поэтому, хотя геодезисты обычно измеряют длину реки, эта длина имеет смысл только в контексте релевантности метода измерения изучаемому вопросу. [39]
Локационная ошибка относится к ошибке, вызванной конкретной пространственной характеристикой, выбранной для элементов исследования, в частности выбором размещения для пространственного присутствия элемента. [39]
Пространственные характеристики могут быть упрощенными или даже неверными. Исследования людей часто сводят пространственное существование людей к одной точке, например, к их домашнему адресу. Это может легко привести к плохому анализу, например, при рассмотрении передачи болезней, которая может произойти на работе или в школе, а значит, далеко от дома. [39]
Пространственная характеристика может неявно ограничивать предмет исследования. Например, пространственный анализ данных о преступлениях в последнее время стал популярным, но эти исследования могут описывать только конкретные виды преступлений, которые можно описать пространственно. Это приводит к множеству карт нападений, но не к каким-либо картам хищений с политическими последствиями в концептуализации преступлений и разработке политики для решения этой проблемы. [39]
Это описывает ошибки, возникающие из-за рассмотрения элементов как отдельных «атомов» вне их пространственного контекста. [39] Заблуждение заключается в переносе индивидуальных выводов на пространственные единицы. [40]
Экологическое заблуждение описывает ошибки, возникающие из-за проведения анализа совокупных данных при попытке сделать выводы по отдельным единицам. [39] [41] Ошибки возникают отчасти из-за пространственного агрегирования. Например, пиксель представляет среднюю температуру поверхности в пределах области. Экологическое заблуждение заключается в предположении, что все точки в пределах области имеют одинаковую температуру.
Математическое пространство существует всякий раз, когда у нас есть набор наблюдений и количественные меры их атрибутов. Например, мы можем представить доходы людей или годы обучения в системе координат, где местоположение каждого человека может быть указано относительно обоих измерений. Расстояние между людьми в этом пространстве является количественной мерой их различий относительно дохода и образования. Однако в пространственном анализе мы имеем дело с определенными типами математических пространств, а именно с географическим пространством. В географическом пространстве наблюдения соответствуют местоположениям в пространственной измерительной структуре, которые фиксируют их близость в реальном мире. Местоположение в пространственной измерительной структуре часто представляет собой местоположения на поверхности Земли, но это не является строго необходимым. Пространственная измерительная структура может также фиксировать близость относительно, скажем, межзвездного пространства или внутри биологического объекта, такого как печень. Основополагающим принципом является первый закон географии Тоблера : если взаимосвязь между сущностями увеличивается с близостью в реальном мире, то представление в географическом пространстве и оценка с использованием методов пространственного анализа являются подходящими.
Евклидово расстояние между местоположениями часто представляет их близость, хотя это только одна возможность. Существует бесконечное количество расстояний в дополнение к евклидовому, которые могут поддерживать количественный анализ. Например, расстояния «Манхэттена» (или « Таксиста »), где движение ограничено путями, параллельными осям, могут быть более значимыми, чем евклидовы расстояния в городских условиях. В дополнение к расстояниям, другие географические отношения, такие как связность (например, наличие или степень общих границ) и направление, также могут влиять на отношения между сущностями. Также возможно вычислить пути с минимальной стоимостью через поверхность стоимости; например, это может представлять близость между местоположениями, когда путешествие должно происходить по пересеченной местности.
Пространственные данные существуют во многих разновидностях, и нелегко прийти к системе классификации, которая была бы одновременно исключительной, исчерпывающей, творческой и удовлетворительной. -- Г. Аптон и Б. Фингельтон [42]
Городские и региональные исследования имеют дело с большими таблицами пространственных данных, полученных из переписей и опросов. Необходимо упростить огромное количество подробной информации, чтобы извлечь основные тенденции. Многомерный анализ (или факторный анализ , FA) позволяет изменять переменные, преобразуя множество переменных переписи, обычно коррелированных между собой, в меньшее количество независимых «факторов» или «главных компонентов», которые на самом деле являются собственными векторами матрицы корреляции данных, взвешенными по обратным их собственным значениям. Такое изменение переменных имеет два основных преимущества:
Факторный анализ зависит от измерения расстояний между наблюдениями: выбор значимой метрики имеет решающее значение. Евклидова метрика (анализ главных компонент), расстояние хи-квадрат (анализ соответствий) или обобщенное расстояние Махаланобиса (дискриминантный анализ) являются наиболее широко используемыми. [43] Были предложены более сложные модели, использующие общности или вращения. [44]
Использование многомерных методов в пространственном анализе началось в 1950-х годах (хотя некоторые примеры восходят к началу века) и достигло кульминации в 1970-х годах, с ростом мощности и доступности компьютеров. Уже в 1948 году в основополагающей публикации два социолога, Уэнделл Белл и Эшреф Шевки, [45] показали, что большинство городских жителей в США и в мире можно представить тремя независимыми факторами: 1- «социально-экономический статус», противопоставляющий богатые и бедные районы и распределенный по секторам, идущим вдоль автомагистралей от центра города, 2- «жизненный цикл», т. е. возрастная структура домохозяйств, распределенных концентрическими кругами, и 3- «раса и этническая принадлежность», определяющие участки мигрантов, расположенные в пределах города. В 1961 году в новаторском исследовании британские географы использовали FA для классификации британских городов. [46] Брайан Дж. Берри из Чикагского университета и его студенты широко использовали этот метод, [47] применяя его к большинству важных городов мира и демонстрируя общие социальные структуры. [48] Использование факторного анализа в географии, которое стало таким простым благодаря современным компьютерам, было очень широким, но не всегда очень разумным. [49]
Поскольку извлеченные векторы определяются матрицей данных, невозможно сравнивать факторы, полученные из разных переписей. Решение состоит в объединении нескольких матриц переписей в единую таблицу, которую затем можно анализировать. Однако это предполагает, что определение переменных не изменилось с течением времени, и приводит к очень большим таблицам, с которыми трудно работать. Лучшее решение, предложенное психометристами, [50] группирует данные в «кубическую матрицу» с тремя записями (например, местоположения, переменные, периоды времени). Затем трехфакторный факторный анализ создает три группы факторов, связанных небольшой кубической «основной матрицей». [51] Этот метод, демонстрирующий эволюцию данных с течением времени, не получил широкого распространения в географии. [52] Однако в Лос-Анджелесе [53] он продемонстрировал традиционно игнорируемую роль центра города как организующего центра для всего города в течение нескольких десятилетий.
Пространственная автокорреляционная статистика измеряет и анализирует степень зависимости между наблюдениями в географическом пространстве. Классическая пространственная автокорреляционная статистика включает Морана , Гири , Гетиса и эллипс стандартного отклонения. Эта статистика требует измерения матрицы пространственных весов , которая отражает интенсивность географической связи между наблюдениями в районе, например, расстояния между соседями, длины общей границы или то, попадают ли они в указанный направленный класс, такой как «запад». Классическая пространственная автокорреляционная статистика сравнивает пространственные веса с ковариационной связью в парах местоположений. Пространственная автокорреляция, которая более положительна, чем ожидалось от случайности, указывает на кластеризацию схожих значений по всему географическому пространству, в то время как значительная отрицательная пространственная автокорреляция указывает на то, что соседние значения более непохожи, чем ожидалось от случайности, что предполагает пространственную картину, похожую на шахматную доску.
Пространственная автокорреляционная статистика, такая как Moran's и Geary's, является глобальной в том смысле, что она оценивает общую степень пространственной автокорреляции для набора данных. Возможность пространственной неоднородности предполагает, что оцененная степень автокорреляции может значительно различаться в зависимости от географического пространства. Локальная пространственная автокорреляционная статистика предоставляет оценки, дезагрегированные до уровня единиц пространственного анализа, что позволяет оценивать отношения зависимости в зависимости от пространства. статистика сравнивает окрестности с глобальным средним и выявляет локальные регионы сильной автокорреляции. Также доступны локальные версии и статистики.
Пространственное взаимодействие или « гравитационные модели » оценивают поток людей, материалов или информации между точками в географическом пространстве. Факторы могут включать переменные, движущие происхождение, такие как количество пассажиров в жилых районах, переменные привлекательности места назначения, такие как количество офисных помещений в районах занятости, и отношения близости между местами, измеряемые в таких терминах, как расстояние поездки или время в пути. Кроме того, топологические или соединительные отношения между областями должны быть определены, особенно учитывая часто противоречивые отношения между расстоянием и топологией; например, два пространственно близких района могут не демонстрировать никакого значительного взаимодействия, если они разделены шоссе. После указания функциональных форм этих отношений аналитик может оценить параметры модели, используя наблюдаемые данные о потоке и стандартные методы оценки, такие как обычные наименьшие квадраты или максимальное правдоподобие. Конкурирующие версии направлений моделей пространственного взаимодействия включают близость между пунктами назначения (или источниками) в дополнение к близости источника-назначения; это отражает эффекты кластеризации пункта назначения (источника) на потоки.
Методы пространственной интерполяции оценивают переменные в ненаблюдаемых местах в географическом пространстве на основе значений в наблюдаемых местах. Базовые методы включают обратное взвешивание расстояний : это ослабляет переменную с уменьшением близости от наблюдаемого места. Кригинг — более сложный метод, который интерполирует в пространстве в соответствии с пространственным отношением запаздывания, которое имеет как систематические, так и случайные компоненты. Это может учитывать широкий диапазон пространственных отношений для скрытых значений между наблюдаемыми местами. Кригинг обеспечивает оптимальные оценки с учетом предполагаемого отношения запаздывания, а оценки ошибок могут быть сопоставлены для определения того, существуют ли пространственные закономерности.
Методы пространственной регрессии фиксируют пространственную зависимость в регрессионном анализе , избегая статистических проблем, таких как нестабильные параметры и ненадежные тесты значимости, а также предоставляя информацию о пространственных связях между задействованными переменными. В зависимости от конкретного метода пространственная зависимость может войти в регрессионную модель как связи между независимыми переменными и зависимыми, между зависимыми переменными и их пространственным лагом или в терминах ошибок. Географически взвешенная регрессия (GWR) является локальной версией пространственной регрессии, которая генерирует параметры, дезагрегированные по пространственным единицам анализа. [54] Это позволяет оценить пространственную неоднородность в предполагаемых связях между независимыми и зависимыми переменными. Использование байесовского иерархического моделирования [55] в сочетании с методами Монте-Карло с марковскими цепями (MCMC) недавно показало свою эффективность при моделировании сложных связей с использованием моделей Пуассона-Гамма-CAR, Пуассона-логнормального-SAR или сверхдисперсного логит-распределения. Статистические пакеты для реализации таких байесовских моделей с использованием MCMC включают WinBugs , CrimeStat и множество пакетов, доступных через язык программирования R. [ 56]
Пространственные стохастические процессы, такие как гауссовские процессы , также все чаще используются в пространственном регрессионном анализе. Версии GWR на основе моделей, известные как модели с пространственно изменяющимися коэффициентами, были применены для проведения байесовского вывода. [55] Пространственные стохастические процессы могут стать вычислительно эффективными и масштабируемыми моделями гауссовских процессов, такими как гауссовские предсказательные процессы [57] и гауссовские процессы ближайшего соседа (NNGP). [58]
Модели пространственного взаимодействия являются агрегированными и нисходящими: они определяют общее управляющее отношение для потока между локациями. Эта характеристика также свойственна городским моделям, таким как те, которые основаны на математическом программировании, потоках между экономическими секторами или теории ставок и ренты. Альтернативная перспектива моделирования заключается в представлении системы на максимально возможном уровне дезагрегации и изучении восходящего возникновения сложных моделей и отношений из поведения и взаимодействий на индивидуальном уровне. [ необходима цитата ]
Теория сложных адаптивных систем , применяемая к пространственному анализу, предполагает, что простые взаимодействия между близкими сущностями могут приводить к сложным, постоянным и функциональным пространственным сущностям на агрегатных уровнях. Два фундаментальных метода пространственного моделирования — это клеточные автоматы и агентное моделирование. Моделирование клеточных автоматов накладывает фиксированную пространственную структуру, такую как ячейки сетки, и задает правила, которые диктуют состояние ячейки на основе состояний ее соседних ячеек. С течением времени возникают пространственные закономерности, поскольку ячейки меняют состояния на основе своих соседей; это изменяет условия для будущих периодов времени. Например, ячейки могут представлять местоположения в городской местности, а их состояния могут быть различными типами землепользования. Закономерности, которые могут возникать из простых взаимодействий локального землепользования, включают офисные районы и городскую застройку . Агентное моделирование использует программные сущности (агенты), которые имеют целенаправленное поведение (цели) и могут реагировать, взаимодействовать и изменять свою среду, стремясь к своим целям. В отличие от ячеек в клеточных автоматах, симулянты могут позволять агентам быть мобильными относительно пространства. Например, можно моделировать транспортный поток и динамику с помощью агентов, представляющих отдельные транспортные средства, которые пытаются минимизировать время в пути между указанными пунктами отправления и назначения. При достижении минимального времени в пути агенты должны избегать столкновений с другими транспортными средствами, также стремящимися минимизировать свое время в пути. Клеточные автоматы и агентное моделирование являются дополнительными стратегиями моделирования. Их можно интегрировать в общую географическую систему автоматов, где некоторые агенты фиксированы, а другие мобильны.
Калибровка играет ключевую роль в подходах моделирования и моделирования как CA, так и ABM. Первоначальные подходы к CA предлагали надежные подходы калибровки, основанные на стохастических методах Монте-Карло. [62] [63] Подходы ABM опираются на правила принятия решений агентами (во многих случаях извлеченные из качественных методов исследования, таких как анкеты). [64] Современные алгоритмы машинного обучения калибруются с использованием обучающих наборов, например, для того, чтобы понять качества построенной среды. [65]
Пространственный анализ концептуальной геологической модели является основной целью любого алгоритма MPS. Метод анализирует пространственную статистику геологической модели, называемую тренировочным образом, и генерирует реализации явлений, которые соответствуют этим входным многоточечным статистикам.
Недавний алгоритм MPS, используемый для выполнения этой задачи, — это метод на основе шаблонов, разработанный Honarkhah. [66] В этом методе для анализа шаблонов в тренировочном изображении используется подход на основе расстояния. Это позволяет воспроизводить многоточечную статистику и сложные геометрические особенности тренировочного изображения. Каждый выход алгоритма MPS — это реализация, представляющая случайное поле. Вместе несколько реализаций могут использоваться для количественной оценки пространственной неопределенности.
Один из последних методов представлен Тахмасеби и др. [67] и использует функцию кросс-корреляции для улучшения воспроизведения пространственной картины. Они называют свой метод моделирования MPS алгоритмом CCSIM. Этот метод способен количественно оценить пространственную связность, изменчивость и неопределенность. Кроме того, метод не чувствителен к любому типу данных и способен моделировать как категориальные, так и непрерывные сценарии. Алгоритм CCSIM может использоваться для любых стационарных, нестационарных и многомерных систем и может обеспечить высококачественную модель визуальной привлекательности., [68] [69]
Геопространственный и гидропространственный анализ , или просто пространственный анализ , [70] представляет собой подход к применению статистического анализа и других аналитических методов к данным, имеющим географический или пространственный аспект. Такой анализ обычно использует программное обеспечение, способное отображать карты, обрабатывать пространственные данные и применять аналитические методы к наземным или географическим наборам данных, включая использование географических информационных систем и геоматики . [71] [72] [73]
Географические информационные системы (ГИС) — обширная область, предоставляющая разнообразные возможности, предназначенные для сбора, хранения, обработки, анализа, управления и представления всех типов географических данных — использует геопространственный и гидропространственный анализ в различных контекстах, операциях и приложениях.
Геопространственный и гидропространственный анализ с использованием ГИС был разработан для решения проблем в области наук об окружающей среде и жизни, в частности экологии , геологии и эпидемиологии . Он распространился почти на все отрасли, включая оборону, разведку, коммунальные услуги, природные ресурсы (например, нефть и газ, лесное хозяйство и т. д.), социальные науки, медицину и общественную безопасность (например, управление чрезвычайными ситуациями и криминология), снижение и управление рисками стихийных бедствий (DRRM) и адаптацию к изменению климата (CCA). Пространственная статистика обычно является результатом наблюдения, а не эксперимента. Гидропространственный анализ особенно используется для водной стороны и членов, связанных с поверхностью воды, столбом, дном, поддоном и прибрежными зонами.
Векторные ГИС обычно связаны с такими операциями, как наложение карт (объединение двух или более карт или слоев карт в соответствии с предопределенными правилами), простая буферизация (выявление областей карты в пределах указанного расстояния от одного или более объектов, таких как города, дороги или реки) и аналогичными базовыми операциями. Это отражает (и отражается) использование термина пространственный анализ в Open Geospatial Consortium ( OGC ) «простые спецификации объектов». Для растровых ГИС, широко используемых в науках об окружающей среде и дистанционном зондировании, это обычно означает ряд действий, применяемых к ячейкам сетки одной или нескольких карт (или изображений), часто включающих фильтрацию и/или алгебраические операции (алгебра карт). Эти методы включают обработку одного или нескольких растровых слоев в соответствии с простыми правилами, что приводит к новому слою карты, например, замена каждого значения ячейки некоторой комбинацией значений ее соседей или вычисление суммы или разности определенных значений атрибутов для каждой ячейки сетки в двух соответствующих наборах растровых данных. Описательная статистика, такая как количество клеток, средние значения, дисперсии, максимумы, минимумы, кумулятивные значения, частоты и ряд других мер и расчетов расстояний также часто включаются в этот общий термин пространственный анализ. Пространственный анализ включает в себя большое разнообразие статистических методов (описательная, исследовательская и объяснительная статистика ), которые применяются к данным, которые изменяются пространственно и которые могут меняться с течением времени. Некоторые более продвинутые статистические методы включают Getis-ord Gi* или Anselin Local Moran's I, которые используются для определения шаблонов кластеризации пространственно привязанных данных.
Геопространственный и гидропространственный анализ выходит за рамки операций по двухмерному и трехмерному картированию и пространственной статистики. Он многомерен и также временен и включает:
Традиционно геопространственные и гидропространственные вычисления выполнялись в основном на персональных компьютерах (ПК) или серверах. Однако из-за растущих возможностей мобильных устройств геопространственные вычисления на мобильных устройствах являются быстрорастущей тенденцией. [74] Портативный характер этих устройств, а также наличие полезных датчиков, таких как приемники глобальной навигационной спутниковой системы (GNSS) и датчики барометрического давления, делают их полезными для сбора и обработки геопространственной и гидропространственной информации в полевых условиях. В дополнение к локальной обработке геопространственной информации на мобильных устройствах, еще одной растущей тенденцией являются облачные геопространственные вычисления. В этой архитектуре данные могут собираться в полевых условиях с помощью мобильных устройств, а затем передаваться на облачные серверы для дальнейшей обработки и окончательного хранения. Аналогичным образом геопространственная и гидропространственная информация может быть предоставлена подключенным мобильным устройствам через облако, что позволяет получать доступ к обширным базам данных геопространственной и гидропространственной информации в любом месте, где доступно беспроводное соединение для передачи данных.
Географические информационные системы (ГИС) и лежащая в основе географическая информационная наука , которая продвигает эти технологии, оказывают сильное влияние на пространственный анализ. Растущая способность собирать и обрабатывать географические данные означает, что пространственный анализ происходит в средах, все более насыщенных данными. Системы сбора географических данных включают в себя дистанционное зондирование изображений, системы мониторинга окружающей среды , такие как интеллектуальные транспортные системы, и технологии определения местоположения, такие как мобильные устройства, которые могут сообщать местоположение в режиме, близком к реальному времени. ГИС предоставляют платформы для управления этими данными, вычисления пространственных отношений, таких как расстояние, связность и направленные отношения между пространственными единицами, и визуализации как необработанных данных, так и результатов пространственного анализа в картографическом контексте. Подтипы включают: