Аксиома , постулат или предположение — это утверждение , которое принимается за истинное , служит предпосылкой или отправной точкой для дальнейших рассуждений и аргументов. Слово происходит от древнегреческого слова ἀξίωμα ( axíōma ), означающего «то, что считается достойным или подходящим» или «то, что выдает себя за очевидное». [1] [2]
Точное определение различается в зависимости от области изучения. В классической философии аксиома — это утверждение, которое настолько очевидно или общепризнанно, что принимается без споров или вопросов. [3] В современной логике аксиома — это предпосылка или отправная точка для рассуждения. [4]
В математике аксиома может быть «логической аксиомой» или «нелогической аксиомой». Логические аксиомы считаются истинными в системе логики, которую они определяют, и часто отображаются в символической форме (например, ( A и B ) влечет A ), в то время как нелогические аксиомы являются существенными утверждениями об элементах области действия конкретной математической теории, например, a + 0 = a в целочисленной арифметике.
Нелогические аксиомы также могут называться «постулатами», «предположениями» или «собственными аксиомами». [5] В большинстве случаев нелогическая аксиома — это просто формальное логическое выражение, используемое в дедукции для построения математической теории, и может быть или не быть самоочевидной по своей природе (например, постулат о параллельности в евклидовой геометрии ). Аксиоматизировать систему знаний — значит показать, что ее утверждения могут быть выведены из небольшого, хорошо понятного набора предложений (аксиом), и обычно существует много способов аксиоматизировать заданную математическую область.
Любая аксиома — это утверждение, которое служит отправной точкой, из которой логически выводятся другие утверждения. Имеет ли смысл (и если да, то что это значит) для аксиомы быть «истинной» — это предмет споров в философии математики . [6]
Слово аксиома происходит от греческого слова ἀξίωμα ( axíōma ), отглагольного существительного от глагола ἀξιόειν ( axioein ), означающего «считать достойным», но также «требовать», который в свою очередь происходит от ἄξιος ( áxios ), означающего «находящийся в равновесии», и, следовательно, «имеющий (такую же) ценность (как)», «достойный», «надлежащий». Среди древнегреческих философов и математиков аксиомы считались непосредственно очевидными положениями, основополагающими и общими для многих областей исследования, и самоочевидно истинными без каких-либо дополнительных аргументов или доказательств. [7]
Корневое значение слова постулат – «требовать»; например, Евклид требует, чтобы кто-то согласился с тем, что некоторые вещи могут быть сделаны (например, любые две точки могут быть соединены прямой линией). [8]
Древние геометры поддерживали некоторое различие между аксиомами и постулатами. Комментируя книги Евклида, Прокл замечает, что « Гемин считал, что этот [4-й] постулат следует классифицировать не как постулат, а как аксиому, поскольку он не утверждает, как первые три постулата, возможность некоторой конструкции, но выражает существенное свойство». [9] Боэций перевел «постулат» как petitio и назвал аксиомы notiones communes, но в более поздних рукописях это употребление не всегда строго соблюдалось. [ необходима цитата ]
Логико-дедуктивный метод, посредством которого выводы (новые знания) следуют из предпосылок (старых знаний) посредством применения обоснованных аргументов ( силлогизмов , правил вывода ), был разработан древними греками и стал основным принципом современной математики. Исключая тавтологии , ничто не может быть выведено, если ничего не предполагается. Аксиомы и постулаты, таким образом, являются основными предположениями, лежащими в основе данного корпуса дедуктивных знаний. Они принимаются без демонстрации. Все другие утверждения ( теоремы , в случае математики) должны быть доказаны с помощью этих основных предположений. Однако интерпретация математических знаний изменилась с древних времен до современных, и, следовательно, термины аксиома и постулат имеют несколько иное значение для современных математиков, чем они имели для Аристотеля и Евклида . [7]
Древние греки считали геометрию всего лишь одной из нескольких наук и считали теоремы геометрии равными научным фактам. Таким образом, они разработали и использовали логико-дедуктивный метод как средство избежания ошибок, а также для структурирования и передачи знаний. Апостериорная аналитика Аристотеля является окончательным изложением классического взгляда. [10]
«Аксиома» в классической терминологии относится к самоочевидному предположению, общему для многих отраслей науки. Хорошим примером может служить утверждение, что:
Если от равных отнять равное количество, получится равное количество.
В основе различных наук лежали некоторые дополнительные гипотезы , которые принимались без доказательств. Такая гипотеза называлась постулатом . В то время как аксиомы были общими для многих наук, постулаты каждой конкретной науки были разными. Их обоснованность должна была быть установлена с помощью реального опыта. Аристотель предупреждает, что содержание науки не может быть успешно передано, если учащийся сомневается в истинности постулатов. [11]
Классический подход хорошо проиллюстрирован [a] в «Началах » Евклида , где дан список постулатов (здравых геометрических фактов, взятых из нашего опыта), за которыми следует список «общих понятий» (очень простых, самоочевидных утверждений).
Урок, усвоенный математикой за последние 150 лет, заключается в том, что полезно лишать смысла математические утверждения (аксиомы, постулаты, предложения , теоремы) и определения. Нужно признать необходимость примитивных понятий или неопределенных терминов или концепций в любом исследовании. Такая абстракция или формализация делает математические знания более общими, способными иметь множество различных значений и, следовательно, полезными в различных контекстах. Алессандро Падоа , Марио Пьери и Джузеппе Пеано были пионерами этого движения.
Структуралистская математика идет дальше и разрабатывает теории и аксиомы (например, теорию поля , теорию групп , топологию , векторные пространства ) без какого-либо конкретного применения в уме. Различие между «аксиомой» и «постулатом» исчезает. Постулаты Евклида выгодно мотивируются тем, что они приводят к огромному количеству геометрических фактов. Истинность этих сложных фактов основывается на принятии основных гипотез. Однако, отбрасывая пятый постулат Евклида, можно получить теории, которые имеют значение в более широких контекстах (например, гиперболическая геометрия ). Таким образом, нужно просто быть готовым использовать такие ярлыки, как «прямая» и «параллельный», с большей гибкостью. Развитие гиперболической геометрии научило математиков, что полезно рассматривать постулаты как чисто формальные утверждения, а не как факты, основанные на опыте.
Когда математики используют аксиомы поля , намерения становятся еще более абстрактными. Предложения теории поля не касаются какого-либо одного конкретного приложения; математик теперь работает в полной абстракции. Существует много примеров полей; теория поля дает правильные знания о них всех.
Неверно говорить, что аксиомы теории поля — это «предложения, которые считаются истинными без доказательства». Скорее, аксиомы поля — это набор ограничений. Если какая-либо заданная система сложения и умножения удовлетворяет этим ограничениям, то можно мгновенно узнать много дополнительной информации об этой системе.
Современная математика формализует свои основы до такой степени, что математические теории можно рассматривать как математические объекты, а саму математику можно рассматривать как раздел логики . Фреге , Рассел , Пуанкаре , Гильберт и Гёдель являются некоторыми из ключевых фигур в этом развитии.
Еще один урок, который усвоила современная математика, — это необходимость тщательно проверять предполагаемые доказательства на предмет скрытых предположений.
В современном понимании набор аксиом — это любой набор формально сформулированных утверждений, из которых следуют другие формально сформулированные утверждения — путем применения определенных четко определенных правил. С этой точки зрения логика становится просто еще одной формальной системой. Набор аксиом должен быть последовательным ; из аксиом должно быть невозможно вывести противоречие. Набор аксиом также должен быть неизбыточным; утверждение, которое может быть выведено из других аксиом, не обязательно должно рассматриваться как аксиома.
Это была ранняя надежда современных логиков, что различные разделы математики, возможно, вся математика, могут быть выведены из последовательного набора основных аксиом. Ранним успехом формалистской программы была формализация Гильбертом [b] евклидовой геометрии , [12] и связанная с этим демонстрация последовательности этих аксиом.
В более широком контексте была предпринята попытка основать всю математику на теории множеств Кантора . Здесь возникновение парадокса Рассела и подобных антиномий наивной теории множеств повысило вероятность того, что любая подобная система может оказаться противоречивой.
Формалистский проект потерпел неудачу столетие назад, когда Гёдель показал , что для любого достаточно большого набора аксиом ( например, аксиом Пеано ) возможно построить утверждение, истинность которого не зависит от этого набора аксиом. Как следствие , Гёдель доказал, что непротиворечивость теории, подобной арифметике Пеано, является недоказуемым утверждением в рамках этой теории. [13]
Разумно верить в непротиворечивость арифметики Пеано, поскольку она удовлетворяется системой натуральных чисел , бесконечной , но интуитивно доступной формальной системой. Однако в настоящее время не существует известного способа продемонстрировать непротиворечивость современных аксиом Цермело–Френкеля для теории множеств. Более того, используя методы принуждения ( Коэн ), можно показать, что континуум-гипотеза (Кантора) независима от аксиом Цермело–Френкеля. [14] Таким образом, даже этот очень общий набор аксиом не может рассматриваться как окончательная основа для математики.
Экспериментальные науки — в отличие от математики и логики — также имеют общие основополагающие утверждения, из которых может быть построено дедуктивное рассуждение, чтобы выразить предложения, которые предсказывают свойства — либо все еще общие, либо гораздо более специализированные для конкретного экспериментального контекста. Например, законы Ньютона в классической механике, уравнения Максвелла в классическом электромагнетизме, уравнение Эйнштейна в общей теории относительности, законы генетики Менделя , закон естественного отбора Дарвина и т. д. Эти основополагающие утверждения обычно называются принципами или постулатами, чтобы отличать их от математических аксиом .
На самом деле, роль аксиом в математике и постулатов в экспериментальных науках различна. В математике никто не «доказывает» и не «опровергает» аксиому. Набор математических аксиом дает набор правил, которые фиксируют концептуальную область, в которой теоремы логически следуют. Напротив, в экспериментальных науках набор постулатов должен позволять выводить результаты, которые соответствуют или не соответствуют экспериментальным результатам. Если постулаты не позволяют выводить экспериментальные предсказания, они не устанавливают научную концептуальную основу и должны быть дополнены или сделаны более точными. Если постулаты позволяют выводить предсказания экспериментальных результатов, сравнение с экспериментами позволяет фальсифицировать ( сфальсифицировать ) теорию, которую устанавливают постулаты. Теория считается действительной до тех пор, пока она не была фальсифицирована.
Теперь переход между математическими аксиомами и научными постулатами всегда слегка размыт, особенно в физике. Это происходит из-за интенсивного использования математических инструментов для поддержки физических теорий. Например, введение законов Ньютона редко устанавливает в качестве предварительного условия ни евклидову геометрию, ни дифференциальное исчисление, которые они подразумевают. Это стало более очевидным, когда Альберт Эйнштейн впервые ввел специальную теорию относительности , где инвариантной величиной больше не является евклидова длина (определяемая как ) > , а интервал пространства-времени Минковского (определяемый как ), а затем общую теорию относительности , где плоская геометрия Минковского заменяется псевдоримановой геометрией на искривленных многообразиях .
В квантовой физике в течение некоторого времени сосуществовали два набора постулатов, что является прекрасным примером фальсификации. « Копенгагенская школа » ( Нильс Бор , Вернер Гейзенберг , Макс Борн ) разработала операциональный подход с полным математическим формализмом, который включает описание квантовой системы векторами («состояниями») в сепарабельном гильбертовом пространстве и физические величины как линейные операторы, которые действуют в этом гильбертовом пространстве. Этот подход полностью фальсифицируем и до сих пор давал самые точные предсказания в физике. Но он имеет неудовлетворительный аспект, не позволяя отвечать на вопросы, которые можно было бы задать естественным образом. По этой причине другой подход « скрытых переменных » некоторое время разрабатывался Альбертом Эйнштейном, Эрвином Шредингером , Дэвидом Бомом . Он был создан для того, чтобы попытаться дать детерминистское объяснение таким явлениям, как запутанность . Этот подход предполагал, что описание Копенгагенской школы не было полным, и постулировал, что некая пока неизвестная переменная должна быть добавлена в теорию, чтобы позволить ответить на некоторые из вопросов, на которые она не отвечает (основополагающие элементы которых обсуждались как парадокс ЭПР в 1935 году). Серьёзно восприняв эту идею, Джон Белл вывел в 1964 году предсказание, которое привело бы к различным экспериментальным результатам ( неравенства Белла ) в случае Копенгагена и скрытой переменной. Эксперимент был впервые проведён Аленом Аспектом в начале 1980-х годов, и результат исключил простой подход скрытой переменной (сложные скрытые переменные всё ещё могли бы существовать, но их свойства всё ещё были бы более тревожными, чем проблемы, которые они пытаются решить). Это не означает, что концептуальная структура квантовой физики может считаться полной сейчас, поскольку некоторые открытые вопросы всё ещё существуют (граница между квантовой и классической сферами, что происходит во время квантового измерения, что происходит в полностью замкнутой квантовой системе, такой как сама вселенная и т. д.).
В области математической логики проводится четкое различие между двумя понятиями аксиом: логическими и нелогическими (что-то похожее на древнее различие между «аксиомами» и «постулатами» соответственно).
Это определенные формулы на формальном языке , которые являются универсально допустимыми , то есть формулы, которые удовлетворяются любым присвоением значений. Обычно в качестве логических аксиом берется по крайней мере некоторый минимальный набор тавтологий, достаточный для доказательства всех тавтологий в языке; в случае логики предикатов требуется больше логических аксиом, чем требуется, чтобы доказать логические истины , которые не являются тавтологиями в строгом смысле.
В пропозициональной логике принято принимать в качестве логических аксиом все формулы следующих форм, где , , и могут быть любыми формулами языка и где включенными примитивными связками являются только " " для отрицания непосредственно следующего предложения и " " для импликации из антецедента в последующие предложения:
Каждый из этих шаблонов является схемой аксиом , правилом для генерации бесконечного числа аксиом. Например, если , , и являются пропозициональными переменными , то и оба являются примерами схемы аксиом 1, и, следовательно, являются аксиомами. Можно показать, что с помощью только этих трех схем аксиом и modus ponens можно доказать все тавтологии пропозиционального исчисления. Можно также показать, что ни одна пара этих схем не является достаточной для доказательства всех тавтологий с помощью modus ponens .
Альтернативно могут быть построены другие схемы аксиом, включающие те же самые или другие наборы примитивных связок. [15]
Эти схемы аксиом также используются в исчислении предикатов , но для включения квантификатора в исчисление необходимы дополнительные логические аксиомы. [16]
Аксиома равенства.
Пусть будет языком первого порядка . Для каждой переменной приведенная ниже формула является универсальной.
Это означает, что для любого переменного символа формула может рассматриваться как аксиома. Также, в этом примере, чтобы это не впало в неопределенность и бесконечную серию «примитивных понятий», либо точное понятие того, что мы подразумеваем под (или, если на то пошло, «быть равным»), должно быть сначала хорошо установлено, либо должно быть навязано чисто формальное и синтаксическое использование символа , рассматривая его только как строку и только как строку символов, и математическая логика действительно это делает.
Другой, более интересный пример схемы аксиом — это тот, который предоставляет нам то, что известно как Универсальная Инстанциация :
Схема аксиом для универсальной инстанциации.
При наличии формулы на языке первого порядка , переменной и термина , который можно заменить на в , следующая формула является универсально допустимой.
Где символ обозначает формулу с термином, заменяемым на . (См. Замена переменных .) В неформальных терминах этот пример позволяет нам утверждать, что если мы знаем, что определенное свойство выполняется для каждого и которое обозначает конкретный объект в нашей структуре, то мы должны иметь возможность утверждать . Опять же, мы утверждаем, что формула верна , то есть мы должны иметь возможность дать «доказательство» этого факта или, точнее говоря, метадоказательство . Эти примеры являются метатеоремами нашей теории математической логики, поскольку мы имеем дело с самой концепцией доказательства . Помимо этого, мы также можем иметь экзистенциальное обобщение :
Схема аксиом для экзистенциального обобщения. При наличии формулы на языке первого порядка , переменной и термина , который можно заменить на в , следующая формула является универсально допустимой.
Нелогические аксиомы — это формулы, которые играют роль предположений, специфичных для теории. Рассуждения о двух различных структурах, например, натуральных числах и целых числах , могут включать одни и те же логические аксиомы; нелогические аксиомы направлены на то, чтобы охватить то, что является особенным в конкретной структуре (или наборе структур, таких как группы ). Таким образом, нелогические аксиомы, в отличие от логических аксиом, не являются тавтологиями . Другое название нелогической аксиомы — постулат . [5]
Почти каждая современная математическая теория начинается с заданного набора нелогических аксиом, и считалось, что, в принципе, каждая теория может быть аксиоматизирована таким образом и формализуется до простого языка логических формул. [ необходима цитата ] [ необходимы дополнительные пояснения ]
Нелогические аксиомы часто просто называют аксиомами в математическом дискурсе . Это не означает, что утверждается, что они истинны в каком-то абсолютном смысле. Например, в некоторых группах групповая операция коммутативна , и это можно утверждать с помощью введения дополнительной аксиомы, но и без этой аксиомы мы можем довольно успешно развивать (более общую) теорию групп, и мы даже можем принять ее отрицание в качестве аксиомы для изучения некоммутативных групп.
Таким образом, аксиома — это элементарная основа формальной логической системы , которая вместе с правилами вывода определяет дедуктивную систему .
В этом разделе приводятся примеры математических теорий, которые полностью разработаны из набора нелогических аксиом (далее — аксиом). Строгое рассмотрение любой из этих тем начинается с спецификации этих аксиом.
Базовые теории, такие как арифметика , действительный анализ и комплексный анализ, часто вводятся неаксиоматически, но неявно или явно, как правило, предполагается, что используемые аксиомы являются аксиомами теории множеств Цермело–Френкеля с выбором, сокращенно ZFC, или какой-либо очень похожей системы аксиоматической теории множеств, такой как теория множеств фон Неймана–Бернейса–Геделя , консервативное расширение ZFC. Иногда используются немного более сильные теории, такие как теория множеств Морса–Келли или теория множеств с сильно недоступным кардиналом, допускающая использование вселенной Гротендика , но на самом деле большинство математиков могут фактически доказать все, что им нужно, в системах, более слабых, чем ZFC, таких как арифметика второго порядка . [ требуется ссылка ]
Изучение топологии в математике распространяется через топологию точечных множеств , алгебраическую топологию , дифференциальную топологию и все связанные с ней параферналии, такие как теория гомологии , теория гомотопии . Развитие абстрактной алгебры принесло с собой теорию групп , кольца , поля и теорию Галуа .
Этот список можно расширить, включив в него большинство областей математики, включая теорию меры , эргодическую теорию , теорию вероятностей , теорию представлений и дифференциальную геометрию .
Аксиомы Пеано являются наиболее широко используемой аксиоматизацией арифметики первого порядка . Они представляют собой набор аксиом, достаточно сильных, чтобы доказать многие важные факты теории чисел , и они позволили Гёделю установить его знаменитую вторую теорему о неполноте . [17]
У нас есть язык , где — постоянный символ, а — унарная функция , и следующие аксиомы:
Стандартная структура имеет вид , где — множество натуральных чисел, — функция следования и естественным образом интерпретируется как число 0.
Вероятно, самый старый и самый известный список аксиом — это 4 + 1 постулат Евклида о планарной геометрии . Аксиомы называются «4 + 1», потому что в течение почти двух тысячелетий пятый (параллельный) постулат («через точку вне прямой проходит ровно одна параллель») предполагался выводимым из первых четырех. В конечном итоге было обнаружено, что пятый постулат не зависит от первых четырех. Можно предположить, что существует ровно одна параллель, проходящая через точку вне прямой, или что их существует бесконечно много. Этот выбор дает нам две альтернативные формы геометрии, в которых внутренние углы треугольника в сумме составляют ровно 180 градусов или меньше соответственно, и известны как евклидова и гиперболическая геометрии. Если также удалить второй постулат («прямую можно продолжить бесконечно»), то возникает эллиптическая геометрия , в которой нет параллели, проходящей через точку вне прямой, и в которой внутренние углы треугольника в сумме составляют более 180 градусов.
Цели исследования находятся в области действительных чисел . Действительные числа однозначно выбираются (с точностью до изоморфизма ) свойствами дедекиндова полного упорядоченного поля , что означает, что любое непустое множество действительных чисел с верхней границей имеет наименьшую верхнюю границу. Однако выражение этих свойств в виде аксиом требует использования логики второго порядка . Теоремы Лёвенгейма–Скулема говорят нам, что если мы ограничимся логикой первого порядка , любая система аксиом для действительных чисел допускает другие модели, включая как модели, которые меньше действительных чисел, так и модели, которые больше. Некоторые из последних изучаются в нестандартном анализе .
Дедуктивная система состоит из набора логических аксиом, набора нелогических аксиом и набора правил вывода . Желательным свойством дедуктивной системы является то, что она должна быть полной . Система называется полной, если для всех формул
то есть для любого утверждения, которое является логическим следствием , фактически существует вывод утверждения из . Иногда это выражается как «все, что истинно, доказуемо», но следует понимать, что «истинный» здесь означает «сделанный истинным набором аксиом», а не, например, «истинный в предполагаемой интерпретации». Теорема полноты Гёделя устанавливает полноту определенного обычно используемого типа дедуктивной системы.
Обратите внимание, что «полнота» здесь имеет иное значение, чем в контексте первой теоремы Гёделя о неполноте , которая утверждает, что ни один рекурсивный , непротиворечивый набор нелогических аксиом теории арифметики не является полным , в том смысле, что всегда будет существовать арифметическое утверждение, такое, что ни , ни не может быть доказано из данного набора аксиом.
Таким образом, с одной стороны, существует понятие полноты дедуктивной системы , а с другой стороны , полноты набора нелогических аксиом . Теорема о полноте и теорема о неполноте, несмотря на свои названия, не противоречат друг другу.
Ранние математики считали аксиоматическую геометрию моделью физического пространства , и, очевидно, могла быть только одна такая модель. Идея о том, что могут существовать альтернативные математические системы, очень беспокоила математиков 19-го века, и разработчики таких систем, как булева алгебра, предприняли тщательные усилия, чтобы вывести их из традиционной арифметики. Галуа показал незадолго до своей безвременной смерти, что эти усилия были в значительной степени напрасны. В конечном счете, абстрактные параллели между алгебраическими системами были сочтены более важными, чем детали, и родилась современная алгебра . С современной точки зрения, аксиомы могут быть любым набором формул, если только они не являются противоречивыми.
утверждение или предложение, которое считается установленным, принятым или само собой разумеющимся.
{{citation}}
: CS1 maint: location missing publisher (link)