Химическая формула — это способ представления информации о химических пропорциях атомов , составляющих определенное химическое соединение или молекулу , с использованием символов химических элементов , чисел, а иногда и других символов, таких как скобки, тире, квадратные скобки, запятые и знаки плюс (+) и минус (−). Они ограничены одной типографской строкой символов, которая может включать подстрочные и надстрочные индексы . Химическая формула не является химическим названием , поскольку она не содержит никаких слов. Хотя химическая формула может подразумевать определенные простые химические структуры , это не то же самое, что полная химическая структурная формула . Химические формулы могут полностью определить структуру только самых простых молекул и химических веществ и, как правило, более ограничены по мощности, чем химические названия и структурные формулы.
Простейшие типы химических формул называются эмпирическими формулами , которые используют буквы и цифры, указывающие численные пропорции атомов каждого типа. Молекулярные формулы указывают простые числа каждого типа атомов в молекуле, без информации о структуре. Например, эмпирическая формула глюкозы — CH2O (в два раза больше атомов водорода , чем углерода и кислорода ), а ее молекулярная формула — C6H12O6 ( 12 атомов водорода , шесть атомов углерода и кислорода).
Иногда химическая формула усложняется, будучи записанной в виде сжатой формулы (или сжатой молекулярной формулы, иногда называемой «полуструктурной формулой»), которая передает дополнительную информацию о конкретных способах, которыми атомы химически связаны друг с другом, либо в ковалентных связях , ионных связях или различных комбинациях этих типов. Это возможно, если соответствующую связь легко показать в одном измерении. Примером является сжатая молекулярная/химическая формула для этанола , которая является CH 3 −CH 2 −OH или CH 3 CH 2 OH . Однако даже сжатая химическая формула неизбежно ограничена в своей способности показывать сложные связи между атомами, особенно атомами, которые имеют связи с четырьмя или более различными заместителями .
Поскольку химическая формула должна быть выражена в виде одной строки символов химических элементов , она часто не может быть столь же информативной, как истинная структурная формула, которая является графическим представлением пространственных отношений между атомами в химических соединениях (см., например, рисунок структурных и химических формул бутана справа). По причинам структурной сложности одна конденсированная химическая формула (или полуструктурная формула) может соответствовать различным молекулам, известным как изомеры . Например, глюкоза разделяет свою молекулярную формулу C 6 H 12 O 6 с рядом других сахаров , включая фруктозу , галактозу и маннозу . Существуют линейные эквивалентные химические названия , которые могут и однозначно определяют любую сложную структурную формулу (см. химическую номенклатуру ), но такие названия должны использовать много терминов (слов), а не простые символы элементов, числа и простые типографские символы, которые определяют химическую формулу.
Химические формулы могут использоваться в химических уравнениях для описания химических реакций и других химических превращений, таких как растворение ионных соединений в растворе. Хотя, как уже отмечалось, химические формулы не обладают всей мощью структурных формул для демонстрации химических взаимоотношений между атомами, их достаточно для отслеживания числа атомов и числа электрических зарядов в химических реакциях, таким образом уравновешивая химические уравнения , так что эти уравнения могут использоваться в химических задачах, связанных с сохранением атомов и сохранением электрического заряда.
Химическая формула определяет каждый составной элемент по его химическому символу и указывает пропорциональное число атомов каждого элемента. В эмпирических формулах эти пропорции начинаются с ключевого элемента, а затем назначают числа атомов других элементов в соединении по соотношениям к ключевому элементу. Для молекулярных соединений все эти числа соотношений могут быть выражены как целые числа. Например, эмпирическая формула этанола может быть записана как C2H6O , поскольку все молекулы этанола содержат два атома углерода, шесть атомов водорода и один атом кислорода. Однако некоторые типы ионных соединений не могут быть записаны полностью целочисленными эмпирическими формулами. Примером является карбид бора , формула которого CBn представляет собой переменное неполное числовое соотношение с n в диапазоне от более 4 до более 6,5.
Когда химическое соединение формулы состоит из простых молекул , химические формулы часто используют способы, чтобы предположить структуру молекулы. Эти типы формул по-разному известны как молекулярные формулы и конденсированные формулы . Молекулярная формула перечисляет число атомов, чтобы отразить их в молекуле, так что молекулярная формула для глюкозы - C 6 H 12 O 6 , а не эмпирическая формула глюкозы, которая - CH 2 O . Однако, за исключением очень простых веществ, молекулярные химические формулы не содержат необходимой структурной информации и являются неоднозначными.
Для простых молекул конденсированная (или полуструктурная) формула — это тип химической формулы, которая может полностью подразумевать правильную структурную формулу. Например, этанол может быть представлен конденсированной химической формулой CH 3 CH 2 OH , а диметиловый эфир — конденсированной формулой CH 3 OCH 3 . Эти две молекулы имеют одинаковые эмпирические и молекулярные формулы ( C 2 H 6 O ), но могут быть различены показанными конденсированными формулами, которых достаточно для представления полной структуры этих простых органических соединений .
Конденсированные химические формулы также могут использоваться для представления ионных соединений , которые не существуют как дискретные молекулы, но тем не менее содержат ковалентно связанные кластеры внутри них. Эти многоатомные ионы представляют собой группы атомов, которые ковалентно связаны вместе и имеют общий ионный заряд, например, ион сульфата [SO 4 ] 2− . Каждый многоатомный ион в соединении записывается индивидуально, чтобы проиллюстрировать отдельные группировки. Например, соединение дихлоргексоксид имеет эмпирическую формулу ClO 3 и молекулярную формулу Cl 2 O 6 , но в жидкой или твердой формах это соединение более правильно отображается ионной конденсированной формулой [ClO 2 ] + [ClO 4 ] − , которая иллюстрирует, что это соединение состоит из ионов [ClO 2 ] + и ионов [ClO 4 ] − . В таких случаях сокращенная формула должна быть достаточно сложной, чтобы отражать хотя бы один представитель каждого вида ионов.
Химические формулы, описанные здесь, отличаются от гораздо более сложных химических систематических названий, которые используются в различных системах химической номенклатуры . Например, одно систематическое название глюкозы — (2 R ,3 S ,4 R ,5 R )-2,3,4,5,6-пентагидроксигексаналь. Это название, интерпретируемое по правилам, лежащим в его основе, полностью определяет структурную формулу глюкозы, но название не является химической формулой в обычном понимании и использует термины и слова, не используемые в химических формулах. Такие названия, в отличие от базовых формул, могут представлять полные структурные формулы без графиков.
В химии эмпирическая формула химического вещества — это простое выражение относительного числа каждого типа атомов или соотношения элементов в соединении. Эмпирические формулы являются стандартом для ионных соединений , таких как CaCl 2 , и для макромолекул, таких как SiO 2 . Эмпирическая формула не ссылается на изомерию , структуру или абсолютное число атомов. Термин эмпирический относится к процессу элементного анализа , методу аналитической химии, используемому для определения относительного процентного состава чистого химического вещества по элементу.
Например, гексан имеет молекулярную формулу C 6 H 14 , а (для одного из его изомеров, н-гексана) структурную формулу CH 3 CH 2 CH 2 CH 2 CH 2 CH 3 , что подразумевает, что он имеет цепочечную структуру из 6 атомов углерода и 14 атомов водорода . Однако эмпирическая формула гексана — C 3 H 7 . Аналогично эмпирическая формула перекиси водорода , H 2 O 2 , — это просто HO , выражая соотношение компонентов 1:1. Формальдегид и уксусная кислота имеют одну и ту же эмпирическую формулу, CH 2 O . Это также молекулярная формула формальдегида, но у уксусной кислоты в два раза больше атомов.
Как и другие типы формул, подробно описанные ниже, эмпирическая формула показывает количество элементов в молекуле и определяет, является ли она бинарным соединением , тройным соединением , четверным соединением или содержит еще больше элементов.
Молекулярные формулы просто указывают количество каждого типа атомов в молекуле молекулярного вещества. Они такие же, как эмпирические формулы для молекул, которые имеют только один атом определенного типа, но в остальном могут иметь большее количество. Примером разницы является эмпирическая формула для глюкозы, которая является CH 2 O ( соотношение 1:2:1), в то время как ее молекулярная формула является C 6 H 12 O 6 ( число атомов 6:12:6). Для воды обе формулы являются H 2 O. Молекулярная формула дает больше информации о молекуле, чем ее эмпирическая формула, но ее сложнее установить.
В дополнение к указанию числа атомов каждого элементамолекулы, структурная формула указывает, как организованы атомы, и показывает (или подразумевает) химические связи между атомами. Существует несколько типов структурных формул, сосредоточенных на различных аспектах молекулярной структуры.
На двух диаграммах показаны две молекулы, которые являются структурными изомерами друг друга, поскольку обе имеют одинаковую молекулярную формулу C4H10 , но , как показано, имеют разные структурные формулы.
Связность молекулы часто оказывает сильное влияние на ее физические и химические свойства и поведение. Две молекулы, состоящие из одинакового количества атомов одного и того же типа (т. е. пара изомеров ) , могут иметь совершенно разные химические и/или физические свойства, если атомы связаны по-разному или находятся в разных положениях. В таких случаях структурная формула полезна, так как она иллюстрирует, какие атомы связаны с какими другими. Из связности часто можно вывести примерную форму молекулы .
Конденсированная (или полуструктурная) формула может представлять типы и пространственное расположение связей в простом химическом веществе, хотя она не обязательно определяет изомеры или сложные структуры. Например, этан состоит из двух атомов углерода, связанных друг с другом одинарной связью, причем каждый атом углерода имеет три атома водорода, связанных с ним. Его химическая формула может быть представлена как CH 3 CH 3 . В этилене между атомами углерода есть двойная связь (и, таким образом, каждый углерод имеет только два водорода), поэтому химическая формула может быть записана: CH 2 CH 2 , и тот факт, что между атомами углерода есть двойная связь, подразумевается, поскольку валентность углерода равна четырем. Однако более явный метод заключается в записи H 2 C=CH 2 или реже H 2 C::CH 2 . Две линии (или две пары точек) указывают, что двойная связь соединяет атомы по обе стороны от них.
Тройная связь может быть обозначена тремя линиями ( HC≡CH ) или тремя парами точек ( HC:::CH ), а в случае возникновения неоднозначности для обозначения одинарной связи может использоваться одна линия или пара точек.
Молекулы с несколькими функциональными группами , которые являются одинаковыми, можно выразить, заключив повторяющуюся группу в круглые скобки . Например, изобутан можно записать как (CH 3 ) 3 CH . Эта сжатая структурная формула подразумевает иную связность, чем другие молекулы, которые могут быть образованы с использованием тех же атомов в тех же пропорциях ( изомеры ). Формула (CH 3 ) 3 CH подразумевает центральный атом углерода, связанный с одним атомом водорода и тремя метильными группами ( CH 3 ). То же самое количество атомов каждого элемента (10 водородов и 4 углерода, или C 4 H 10 ) можно использовать для создания прямой цепной молекулы, н - бутана : CH 3 CH 2 CH 2 CH 3 .
Алкен, называемый бут-2-ен, имеет два изомера, которые химическая формула CH 3 CH=CHCH 3 не идентифицирует. Относительное положение двух метильных групп должно быть указано дополнительным обозначением, указывающим, находятся ли метильные группы по одну сторону двойной связи ( цис или Z ) или по разные стороны друг от друга ( транс или E ). [1]
Как отмечено выше, для представления полных структурных формул многих сложных органических и неорганических соединений может потребоваться химическая номенклатура , которая выходит далеко за рамки доступных ресурсов, используемых выше в простых сокращенных формулах. См. номенклатуру органической химии ИЮПАК и номенклатуру неорганической химии ИЮПАК 2005 для примеров. Кроме того, линейные системы наименований, такие как Международный химический идентификатор (InChI), позволяют компьютеру строить структурную формулу, а упрощенная система молекулярного ввода строк (SMILES) позволяет вводить более удобочитаемые ASCII-данные. Однако все эти системы номенклатуры выходят за рамки стандартов химических формул и технически являются системами химических наименований, а не формульными системами. [2]
Для полимеров в конденсированных химических формулах повторяющиеся единицы заключаются в скобки. Например, молекула углеводорода , которая описывается как CH 3 (CH 2 ) 50 CH 3 , представляет собой молекулу с пятьюдесятью повторяющимися единицами. Если число повторяющихся единиц неизвестно или варьируется, для обозначения этой формулы можно использовать букву n : CH 3 (CH 2 ) n CH 3 .
Для ионов заряд конкретного атома может быть обозначен правым верхним индексом. Например, Na + или Cu 2+ . Общий заряд заряженной молекулы или многоатомного иона также может быть показан таким образом, например, для гидроксония H 3 O + или сульфата SO2−4. Здесь + и − используются вместо +1 и −1 соответственно.
Для более сложных ионов скобки [ ] часто используются для заключения ионной формулы, как в [B 12 H 12 ] 2− , которая встречается в таких соединениях, как додекаборат цезия , Cs 2 [B 12 H 12 ] . Скобки ( ) могут быть вложены внутри скобок для указания повторяющейся единицы, как в хлориде гексамминкобальта(III) , [Co(NH 3 ) 6 ] 3+ Cl−3. Здесь (NH 3 ) 6 указывает, что ион содержит шесть аммиачных групп ( NH 3 ), связанных с кобальтом , а [ ] охватывает всю формулу иона с зарядом +3. [ необходимо дополнительное объяснение ]
Это строго необязательно; химическая формула действительна как с информацией об ионизации, так и без нее, а хлорид гексамминкобальта(III) может быть записан как [Co(NH 3 ) 6 ] 3+ Cl−3или [Co(NH 3 ) 6 ]Cl 3 . Скобки, как и круглые скобки, ведут себя в химии так же, как и в математике, группируя термины вместе – они не используются специально только для состояний ионизации. В последнем случае здесь скобки указывают на 6 групп одинаковой формы, связанных с другой группой размером 1 (атом кобальта), а затем весь пучок, как группа, связан с 3 атомами хлора. В первом случае яснее, что связь, соединяющая хлоры, является ионной , а не ковалентной .
Хотя изотопы больше относятся к ядерной химии или химии стабильных изотопов , чем к обычной химии, различные изотопы могут быть обозначены с помощью префикса в виде надстрочного индекса в химической формуле. Например, фосфат-ион, содержащий радиоактивный фосфор-32, — это [ 32 PO 4 ] 3− . Также исследование, включающее соотношения стабильных изотопов, может включать молекулу 18 O 16 O .
Левый нижний индекс иногда используется избыточно для указания атомного номера . Например, 8 O 2 для дикислорода, и16
8О
2 для наиболее распространенных изотопных видов дикислорода. Это удобно при написании уравнений ядерных реакций , чтобы более наглядно показать баланс заряда.
Символ @ ( знак at ) указывает на атом или молекулу, захваченную внутри клетки, но не связанную с ней химически. Например, бакминстерфуллерен ( C 60 ) с атомом (M) будет просто представлен как MC 60 независимо от того, находится ли M внутри фуллерена без химической связи или снаружи, связанный с одним из атомов углерода. Используя символ @, это будет обозначено как M@C 60 , если M находится внутри углеродной сети. Примером нефуллерена является [As@Ni 12 As 20 ] 3− , ион, в котором один атом мышьяка (As) захвачен в клетке, образованной другими 32 атомами.
Эта нотация была предложена в 1991 году [3] с открытием фуллереновых клеток ( эндоэдральных фуллеренов ), которые могут захватывать атомы, такие как La , образуя, например, La@C 60 или La@C 82 . Выбор символа был объяснен авторами как лаконичный, легко печатаемый и передаваемый в электронном виде (знак at включен в ASCII , на котором основано большинство современных схем кодирования символов), а также визуальными аспектами, предполагающими структуру эндоэдрального фуллерена.
Химические формулы чаще всего используют целые числа для каждого элемента. Однако существует класс соединений, называемых нестехиометрическими соединениями , которые не могут быть представлены малыми целыми числами. Такая формула может быть записана с использованием десятичных дробей , как в Fe 0,95 O , или может включать переменную часть, представленную буквой, как в Fe 1− x O , где x обычно намного меньше 1.
Химическая формула, используемая для ряда соединений, которые отличаются друг от друга постоянной единицей, называется общей формулой . Она порождает гомологический ряд химических формул. Например, спирты могут быть представлены формулой C n H 2 n + 1 OH ( n ≥ 1), что дает гомологи метанол , этанол , пропанол для 1 ≤ n ≤ 3.
Система Хилла (или нотация Хилла) — это система записи эмпирических химических формул, молекулярных химических формул и компонентов сжатой формулы, в которой сначала указывается число атомов углерода в молекуле , затем число атомов водорода , а затем число всех остальных химических элементов в алфавитном порядке химических символов . Если формула не содержит углерода, все элементы, включая водород, перечисляются в алфавитном порядке.
Сортируя формулы по числу атомов каждого элемента, присутствующего в формуле, согласно этим правилам, при этом различия в более ранних элементах или числах рассматриваются как более существенные, чем различия в любом более позднем элементе или числе (подобно сортировке текстовых строк в лексикографическом порядке ), можно сопоставить химические формулы в так называемом порядке системы Хилла.
Система Хилла была впервые опубликована Эдвином А. Хиллом из Бюро по патентам и товарным знакам США в 1900 году. [4] Это наиболее часто используемая система в химических базах данных и печатных индексах для сортировки списков соединений. [5]
Список формул в системе Хилла организован в алфавитном порядке, как указано выше, причем однобуквенные элементы располагаются перед двухбуквенными символами, если символы начинаются с одной и той же буквы (например, «B» предшествует «Be», которая предшествует «Br»). [5]
Следующие примеры формул записаны с использованием системы Хилла и перечислены в порядке Хилла: