Приложения машинного обучения (ML) в науках о Земле включают геологическое картирование , обнаружение утечек газа и идентификацию геологических объектов . Машинное обучение — это подраздел искусственного интеллекта, направленный на разработку программ, которые способны классифицировать, кластеризовать, идентифицировать и анализировать обширные и сложные наборы данных без необходимости явного программирования для этого. [1] Науки о Земле — это изучение происхождения, эволюции и будущего [2] Земли . Земную систему можно разделить на четыре основных компонента, включая твердую землю , атмосферу , гидросферу и биосферу . [3]
В зависимости от характера задачи могут применяться различные алгоритмы. Некоторые алгоритмы могут работать значительно лучше других для определенных целей. Например, сверточные нейронные сети (CNN) хороши для интерпретации изображений, в то время как более общие нейронные сети могут использоваться для классификации почв , [4] но могут быть более вычислительно затратными для обучения, чем альтернативы, такие как машины опорных векторов . Диапазон задач, к которым применяется МО (включая глубокое обучение ), постоянно растет в последние десятилетия, как и развитие других технологий, таких как беспилотные летательные аппараты (БПЛА), [5] технология дистанционного зондирования сверхвысокого разрешения и высокопроизводительные вычисления . [6] Это привело к доступности больших высококачественных наборов данных и более продвинутых алгоритмов.
Проблемы в науках о Земле часто сложны. [7] Сложно применять известные и описанные математические модели к естественной среде, поэтому машинное обучение обычно является лучшей альтернативой для таких нелинейных проблем. [8] Экологические данные обычно нелинейны и состоят из взаимодействий более высокого порядка, и вместе с отсутствующими данными традиционная статистика может быть недостаточно эффективной, поскольку к модели применяются нереалистичные предположения, такие как линейность. [9] [10] Ряд исследователей обнаружили, что машинное обучение превосходит традиционные статистические модели в науках о Земле, например, при характеристике структуры лесного полога , [11] прогнозировании сдвигов ареалов, вызванных климатом , [12] и определении геологических фаций. [13] Характеристика структуры лесного полога позволяет ученым изучать реакцию растительности на изменение климата. [14] Прогнозирование сдвигов ареалов, вызванных климатом, позволяет политикам применять подходящий метод разговора для преодоления последствий изменения климата. [15] Определение геологических фаций помогает геологам понять геологию территории, что имеет важное значение для ее развития и управления. [16]
В науках о Земле некоторые данные часто труднодоступны или их трудно собрать, поэтому желательно выводить данные из данных, которые легко доступны с помощью метода машинного обучения. [10] Например, геологическое картирование в тропических лесах является сложной задачей, поскольку густой растительный покров и выходы горных пород плохо видны. [17] Применение дистанционного зондирования с подходами машинного обучения обеспечивает альтернативный способ быстрого картирования без необходимости ручного картирования в недоступных районах. [17]
Машинное обучение также может сократить усилия, прилагаемые экспертами, поскольку ручные задачи классификации и аннотирования и т. д. являются узкими местами в рабочем процессе исследований в области наук о Земле. [10] Геологическое картирование, особенно в обширных, отдаленных районах, является трудоемким, затратным и требует больших затрат времени при использовании традиционных методов. [18] Внедрение подходов дистанционного зондирования и машинного обучения может обеспечить альтернативное решение для устранения некоторых потребностей в полевом картировании. [18]
Последовательность и отсутствие предвзятости также являются преимуществом машинного обучения по сравнению с ручной работой людей. В исследовании, сравнивающем эффективность человеческого и машинного обучения при идентификации динофлагеллятов , было обнаружено, что машинное обучение не так подвержено систематической предвзятости, как люди. [19] Эффект новизны, присутствующий у людей, заключается в том, что классификация часто смещается в сторону самых последних вспомненных классов. [19] В задаче маркировки исследования, если один вид динофлагеллятов редко встречается в образцах, то эксперты-экологи обычно не будут классифицировать его правильно. [19] Систематическая предвзятость сильно ухудшает точность классификации людей. [19]
Широкое использование машинного обучения в различных областях привело к широкому спектру применяемых алгоритмов методов обучения. Выбор оптимального алгоритма для конкретной цели может привести к значительному повышению точности: [20] например, литологическое картирование золотоносных гранитно-зеленокаменных пород в Хутти, Индия, с гиперспектральными данными AVIRIS-NG показывает более чем 10% разницу в общей точности между использованием опорных векторных машин (SVM) и случайного леса . [21]
Некоторые алгоритмы также могут раскрывать скрытую важную информацию: модели белого ящика являются прозрачными моделями , выходные данные которых можно легко объяснить, в то время как модели черного ящика являются противоположностью. [20] Например, хотя SVM дал наилучший результат в точности оценки восприимчивости к оползням, результат не может быть переписан в виде экспертных правил, которые объясняют, как и почему область была отнесена к этому конкретному классу. [7] Напротив, деревья решений прозрачны и легко понятны, и пользователь может наблюдать и устранять смещение, если таковое присутствует в таких моделях. [7]
Если вычислительные ресурсы имеют значение, то менее предпочтительными являются методы обучения, требующие больших вычислительных ресурсов, такие как глубокие нейронные сети, несмотря на то, что они могут превосходить другие алгоритмы, например, в классификации почв. [4]
Геологическое или литологическое картирование создает карты, показывающие геологические особенности и геологические единицы. Картирование перспективности полезных ископаемых использует различные наборы данных, такие как геологические карты и аэромагнитные изображения , для создания карт, которые специализированы для разведки полезных ископаемых. [22] Геологическое, литологическое и перспективное картирование полезных ископаемых может быть выполнено путем обработки данных с помощью методов МО, с вводом спектральных изображений, полученных с помощью дистанционного зондирования и геофизических данных. [23] Также используется спектральное изображение — изображение диапазонов длин волн в электромагнитном спектре, в то время как обычное изображение захватывает три диапазона длин волн (красный, зеленый, синий) в электромагнитном спектре. [24]
Случайные леса и SVM — это некоторые алгоритмы, которые обычно используются с геофизическими данными дистанционного зондирования, в то время как простая линейная итеративная кластеризация — сверточная нейронная сеть (SLIC-CNN) [5] и сверточные нейронные сети (CNN) [18] обычно применяются к аэрофотоснимкам. Крупномасштабное картирование может быть выполнено с использованием геофизических данных из геофизических данных дистанционного зондирования с воздуха и со спутника [21] , а мелкомасштабное картирование может быть выполнено с использованием изображений с беспилотных летательных аппаратов (БПЛА) для более высокого разрешения. [5]
Растительный покров является одним из основных препятствий для геологического картирования с помощью дистанционного зондирования, как сообщается в различных исследованиях, как в крупномасштабном, так и мелкомасштабном картировании. Растительность влияет на качество спектральных изображений, [23] или скрывает информацию о горных породах на аэрофотоснимках. [5]
Подверженность оползням относится к вероятности оползня в определенном географическом месте, которая зависит от местных условий рельефа. [27] Картографирование восприимчивости к оползням может выделить области, подверженные риску оползней, что полезно для городского планирования и управления стихийными бедствиями. [7] Такие наборы данных для алгоритмов МО обычно включают топографическую информацию, литологическую информацию, спутниковые снимки и т. д., а некоторые могут включать землепользование, почвенно-растительный покров, информацию о дренаже и растительный покров [7] [28] [29] [30] в соответствии с требованиями исследования. Как обычно, для обучения модели МО для картирования восприимчивости к оползням требуются обучающие и тестовые наборы данных. [7] Существует два метода распределения наборов данных для обучения и тестирования: один заключается в случайном разделении исследуемой области для наборов данных; другой заключается в разделении всего исследования на две смежные части для двух наборов данных. Для проверки моделей классификации общепринятой практикой является разделение исследуемой области случайным образом; [7] [31] Однако, было бы более полезно, если бы исследуемая область могла быть разделена на две смежные части, чтобы алгоритм автоматизации мог выполнить картографирование новой области с вводом обработанных экспертом данных о смежных землях. [7]
Разрывы , такие как плоскости разломов и плоскости напластования, имеют важные последствия в гражданском строительстве. [32] Разрывы горных пород могут быть автоматически распознаны машинным обучением с помощью фотограмметрического анализа, даже при наличии мешающих объектов, таких как растительность. [33] При обучении МО для классификации изображений аугментация данных является обычной практикой, чтобы избежать переобучения и увеличить размер и изменчивость набора данных для обучения. [33] Например, при исследовании распознавания разрывов горных пород 68 изображений для обучения и 23 изображения для тестирования были подготовлены с помощью случайного разделения. [33] Было выполнено аугментация данных , увеличив размер набора данных для обучения до 8704 изображений путем переворачивания и случайной обрезки. [33] Подход позволил точно распознать разрывы горных пород в большинстве случаев. [33] Как отрицательное значение прогноза (NPV) , так и специфичность были более 0,99. [33] Это продемонстрировало надежность анализа разрывов с помощью машинного обучения.
Количественная оценка утечки углекислого газа из геологического хранилища привлекла повышенное внимание, поскольку общественность интересуется, хранится ли углекислый газ под землей безопасно и эффективно. [34] Утечку углекислого газа из геологического хранилища можно обнаружить косвенно с помощью дистанционного зондирования и неконтролируемого алгоритма кластеризации, такого как метод анализа итеративных самоорганизующихся данных (ISODATA). [35] Увеличение концентрации CO2 в почве вызывает реакцию на стресс у растений, ингибируя дыхание растений, поскольку кислород вытесняется углекислым газом. [36] Сигнал стресса растительности можно обнаружить с помощью нормализованного индекса разности красного края (NDRE). [36] Гиперспектральные изображения обрабатываются неконтролируемым алгоритмом, кластеризующим пиксели с похожими реакциями растений. [36] Гиперспектральная информация в областях с известной утечкой CO2 извлекается таким образом, чтобы области с утечкой можно было сопоставить с кластеризованными пикселями со спектральными аномалиями. [36] Хотя этот подход позволяет эффективно определять утечку CO 2 , существуют некоторые ограничения, требующие дальнейшего изучения. [36] NDRE может быть неточным по таким причинам, как более высокое поглощение хлорофилла, изменчивость растительности и эффекты затенения; поэтому некоторые напряженные пиксели могут быть неправильно классифицированы как здоровые. [36] Сезонность , высота уровня грунтовых вод также могут влиять на реакцию растительности на стресс от CO 2 . [36]
Система оценки скального массива (RMR) [37] является широко принятой системой классификации скального массива геомеханическими средствами с вводом шести параметров. Количество притока воды является одним из входных данных схемы классификации, представляющей состояние грунтовых вод. Количественная оценка притока воды в забоях скального туннеля традиционно проводилась путем визуального наблюдения в полевых условиях, что является трудоемким и длительным и сопряжено с проблемами безопасности. [38] Машинное обучение может определять приток воды, анализируя изображения, сделанные на строительной площадке. [38] Классификация подхода в основном следует системе RMR, но объединяет влажное и мокрое состояния, поскольку их трудно различить только при визуальном осмотре. [38] [37] Изображения были классифицированы на неповрежденное состояние, влажное состояние, капающее состояние, текущее состояние и фонтанирующее состояние. [38] Точность классификации изображений составила приблизительно 90%. [38]
Самым популярным экономически эффективным методом исследования почвы является испытание на проникновение конуса (CPT) . [39] Испытание проводится путем проталкивания металлического конуса через почву: сила, необходимая для проталкивания с постоянной скоростью, регистрируется как квазинепрерывный журнал. [4] Машинное обучение может классифицировать почву с помощью входных данных CPT. [4] При попытке классификации с помощью МО необходимо выполнить две задачи для анализа данных, а именно сегментацию и классификацию. [4] Сегментация может быть выполнена с помощью алгоритма кластеризации и классификации ограничений (CONCC) для разделения данных одной серии на сегменты. [4] Затем классификация может быть выполнена с помощью таких алгоритмов, как деревья решений, SVM или нейронные сети. [4]
Открытые геологические структуры, такие как антиклинали , рябь и ксенолиты , могут быть автоматически идентифицированы с помощью моделей глубокого обучения . [40] Исследования показали, что трехслойные сверточные нейронные сети и трансферное обучение имеют высокую точность (около 80% и 90% соответственно), в то время как другие, такие как k -ближайших соседей (k-NN), регулярные нейронные сети и экстремальный градиентный бустинг (XGBoost), имеют низкую точность (в диапазоне от 10% до 30%). [40] Были протестированы как изображения в оттенках серого, так и цветные изображения, при этом разница в точности была небольшой, что означает, что цвет не очень важен для идентификации геологических структур. [40]
Системы оповещения о землетрясениях часто уязвимы для локального импульсного шума, поэтому выдают ложные оповещения. [41] Ложные оповещения можно устранить, отделив формы волн землетрясений от шумовых сигналов с помощью методов МО. Метод состоит из двух частей: первая — неконтролируемое обучение с генеративно-состязательной сетью (GAN) для изучения и извлечения особенностей первых прибывших P-волн , а вторая — использование случайного леса для различения P-волн. Этот подход достиг 99,2% распознавания P-волн и может избежать ложных срабатываний шумовых сигналов с точностью 98,4%. [41]
Землетрясения можно воспроизводить в лабораторных условиях, чтобы имитировать реальные. С помощью машинного обучения можно идентифицировать модели акустических сигналов как предвестников землетрясений. Прогнозирование времени, оставшегося до отказа, было продемонстрировано в исследовании с непрерывными акустическими временными рядами данных, записанными из разлома. Примененный алгоритм представлял собой случайный лес, обученный с набором событий скольжения, хорошо справляющийся с прогнозированием времени до отказа. Он идентифицировал акустические сигналы для прогнозирования отказов, причем один из них ранее не был идентифицирован. Хотя это лабораторное землетрясение не такое сложное, как естественное, был достигнут прогресс, который направляет будущую работу по прогнозированию землетрясений. [42]
Данные о речном стоке в реальном времени являются неотъемлемой частью принятия решений (например, эвакуации или регулирования уровня воды в водохранилище во время наводнения). [43] Данные о речном стоке можно оценить по данным, предоставленным гидрометрами , которые измеряют уровень воды в реке. Однако вода и мусор от наводнения могут повредить гидрометры, что приведет к отсутствию важных данных в реальном времени. Способность машинного обучения выводить недостающие данные [10] позволяет ему прогнозировать речной сток как с использованием исторических данных гидрометров, так и с использованием данных в реальном времени. Модель оценки гидрологии речного стока с использованием машинного обучения (SHEM) может служить этой цели. Чтобы проверить ее точность, результат прогнозирования сравнивался с фактическими зарегистрированными данными, и было обнаружено, что точность составляет от 0,78 до 0,99.
Для машинного обучения требуется достаточный объем данных для обучения и проверки. [10] Однако некоторые очень полезные продукты, такие как данные спутникового дистанционного зондирования, имеют данные только за десятилетия с 1970-х годов. Если кого-то интересуют годовые данные, то доступно всего менее 50 образцов. [45] Такого объема данных может быть недостаточно. При исследовании автоматической классификации геологических структур слабостью модели является небольшой набор данных для обучения, даже с помощью дополнения данных для увеличения размера набора данных. [40] Другое исследование прогнозирования речного стока показало, что точность зависит от доступности достаточных исторических данных, поэтому достаточные данные для обучения определяют производительность машинного обучения. [44] Недостаточные данные для обучения могут привести к проблеме, называемой переобучением. Переобучение приводит к неточностям в машинном обучении [46], поскольку модель узнает о шуме и нежелательных деталях.
Машинное обучение не может выполнять некоторые задачи так, как это легко делает человек. Например, при количественной оценке притока воды в скальные туннели по изображениям для системы оценки скального массива (RMR) [38] сырость и мокрое состояние не были классифицированы машинным обучением, поскольку различить их только с помощью визуального осмотра невозможно. В некоторых задачах машинное обучение не может полностью заменить ручную работу человека.
Во многих алгоритмах машинного обучения, например, в искусственных нейронных сетях (ИНС), он рассматривается как подход « черного ящика », поскольку четкие взаимосвязи и описания того, как результаты генерируются в скрытых слоях, неизвестны. [47] Подход «белого ящика», такой как дерево решений, может раскрыть пользователям детали алгоритма. [48] Если кто-то хочет исследовать взаимосвязи, такие подходы «черного ящика» не подходят. Однако производительность алгоритмов «черного ящика» обычно лучше. [49]
{{cite book}}
: CS1 maint: multiple names: authors list (link)