stringtranslate.com

Кембриджская структурная база данных

Кембриджская структурная база данных ( CSD ) является как репозиторием, так и проверенным и курируемым ресурсом для трехмерных структурных данных молекул , обычно содержащих по крайней мере углерод и водород , включая широкий спектр органических , металлоорганических и металлоорганических молекул. Конкретные записи дополняют другие кристаллографические базы данных , такие как Protein Data Bank (PDB), Inorganic Crystal Structure Database и International Centre for Diffraction Data . Данные, обычно полученные с помощью рентгеновской кристаллографии и реже с помощью электронной дифракции или нейтронной дифракции , и представленные кристаллографами и химиками со всего мира, находятся в свободном доступе (в том виде, в котором они были размещены авторами) в Интернете через веб-сайт головной организации CSD (CCDC, Repository [1] ). CSD контролируется некоммерческой зарегистрированной компанией под названием Cambridge Crystallographic Data Centre , CCDC.

Интерьер штаб-квартиры CCDC в Кембридже, Великобритания

CSD является широко используемым репозиторием для малых молекулярных органических и металлоорганических кристаллических структур для ученых. Структуры, депонированные в Кембриджском центре кристаллографических данных (CCDC), доступны для скачивания в момент публикации или с согласия депонента. Они также научно обогащены и включены в базу данных, используемую программным обеспечением, предлагаемым центром. Целевые подмножества CSD также доступны бесплатно для поддержки обучения и других видов деятельности. [2]

История

CCDC выросла из деятельности группы кристаллографии под руководством Ольги Кеннард OBE FRS на кафедре органической, неорганической и теоретической химии Кембриджского университета . С 1965 года группа начала собирать опубликованные библиографические, химические и данные о кристаллической структуре для всех малых молекул, изученных с помощью рентгеновской или нейтронной дифракции . С быстрым развитием вычислительной техники , происходящим в это время, эта коллекция была закодирована в электронной форме и стала известна как Кембриджская структурная база данных (CSD).

CSD была одной из первых числовых научных баз данных, которая начала работать где-либо в мире, и получила академические гранты от Управления научной и технической информации Великобритании, а затем от Совета по научным и инженерным исследованиям Великобритании . Эти средства, вместе с субсидиями от Национальных аффилированных центров, позволили разработать CSD и связанное с ней программное обеспечение в 1970-х и 1980-х годах. Первые выпуски системы CSD в США, Италии и Японии произошли в начале 1970-х годов. К началу 1980-х годов система CSD была распространена более чем в 30 странах. По состоянию на 2014 год система CSD была распространена среди ученых в 70 странах.

В 1980-х годах интерес к системе CSD со стороны фармацевтических и агрохимических компаний значительно возрос. Это привело к созданию в 1987 году Кембриджского центра кристаллографических данных (CCDC) как независимой компании с юридическим статусом некоммерческой благотворительной организации, а ее деятельность контролировалась международным советом управляющих. В 1992 году CCDC переехал в специально построенное здание на месте химического факультета университета.

Кеннард ушел с поста директора в 1997 году, и его сменили Дэвид Хартли (1997-2002) и Фрэнк Аллен (2002-2008). Колин Грум был назначен исполнительным директором с 1 октября 2008 года [3] по сентябрь 2017 года. [4] И совсем недавно, в июне 2018 года, Юрген Хартер был назначен генеральным директором. [5]

Программные продукты CCDC диверсифицированы для использования кристаллографических данных в приложениях в области естественных наук и кристаллографии. Большая часть разработки и маркетинга этого программного обеспечения осуществляется CCDC Software Limited (основана в 1998 году), дочерней компанией, полностью принадлежащей компании, которая передает всю свою прибыль обратно в CCDC.

Хотя CCDC является самоуправляемой организацией, она сохраняет тесные связи с Кембриджским университетом и является партнерским учреждением университета, имеющим право готовить аспирантов для получения более высоких степеней (PhD, MPhil).

В октябре 2013 года CCDC начал работу в США по подаче заявок и поддержке операций, [6] [7] изначально в Ратгерском университете, Университете штата Нью-Джерси , где он размещался совместно с Банком данных белков RCSB.

Содержание

В CSD добавлена ​​миллионная структура
В CSD добавлена ​​миллионная структура, идентификатор CSD: XOPCAJ

CSD обновляется примерно 50 000 новых структур каждый год, [8] и улучшениями существующих записей. Записи (структуры) в репозитории публикуются для публичного доступа, как только соответствующая запись появляется в рецензируемой научной литературе. Между тем, данные также могут быть депонированы и опубликованы напрямую через CSD без сопроводительной научной статьи, как то, что известно как CSD Communication.

Периодически публикуются общие статистические данные о широте активов центральных депозитариев ценных бумаг, например, отчет за январь 2014 года. [9] По состоянию на январь 2019 года сводная статистика выглядит следующим образом: [10]

По состоянию на январь 2019 года 25 крупнейших научных журналов по объему публикации структур в репозитории CSD были: [11]

1. В журнале «Неорганическая химия» было описано 73 070 структур.
2. 62 072 структуры были описаны в Dalton & J. Chem. Soc., Dalton Trans.
3. В разделе «Органометаллы» было описано 54 160 структур.
4. В журнале J. Am. Chem. Soc. было опубликовано 48 967 структур.
5. В Acta Crystallogr. Sect. E было описано 42 422 структуры.
6. В Chem. Eur. J. было описано 32 610 структур.
7. В журнале J. Organomet. Chem. было опубликовано 29 790 структур.
8. 29 640 структур были описаны в Angew. Chem. Int. Ed.
9. 28 682 структуры были зарегистрированы в Inorg. Chim. Acta
10. 28 351 структура была описана в Chem. Commun. & J. Chem. Soc.
11. В CSD Communications было сообщено о 27 328 структурах
12. В Acta Crystallogr. Sect. C было описано 26 774 структур.
13. В Polyhedron было зарегистрировано 26 734 структур.
14. В Eur. J. Inorg. Chem. было опубликовано 24 045 структур.
15. В J. Org. Chem. было описано 23 483 структуры.
16. В Cryst. Growth Des было зарегистрировано 22 286 структур .
17. В CrystEngComm было зарегистрировано 22 011 структур.
18. В Organic Letters было зарегистрировано 15 985 структур.
19. В Z. Anorg. Allg. Chem. было описано 15 424 структур.
20. В Acta Crystallogr. Sect. B было описано 14 864 структур.
21. 13 909 структур были зарегистрированы в Тетраэдре. 8 597 структур были зарегистрированы в качестве частного сообщения в CSD.
22. В J. Mol. Struct. было описано 12 734 структуры.
23. В Tetrahedron Lett было описано 11 234 структур.
24. В Eur. J. Org. Chem. было описано 9150 структур.
25. В New Journal of Chemistry было опубликовано 8789 структур.

На эти 25 журналов приходится 704 541 из 996 193 или 70,7% структур в CSD.

Эти данные показывают, что большинство структур определяются методом рентгеновской дифракции, а менее 1% структур определяются методом нейтронной дифракции или порошковой дифракции . Количество безошибочных координат было взято как процент структур, для которых трехмерные координаты присутствуют в CSD.

Значимость файлов структурных факторов, упомянутых выше, заключается в том, что для структур CSD, определенных методом рентгеновской дифракции, имеющих структурный файл, кристаллограф может проверить интерпретацию наблюдаемых измерений.

Тенденция роста

Исторически число структур в CSD росло примерно экспоненциально, преодолев рубеж в 25 000 структур в 1977 году, рубеж в 50 000 структур в 1983 году, рубеж в 125 000 структур в 1992 году, рубеж в 250 000 структур в 2001 году, рубеж в 500 000 структур в 2009 году [12] [13] [14] и рубеж в 1 000 000 структур 8 июня 2019 года [15] Миллионная структура, добавленная в CSD, — это кристаллическая структура 1-(7,9-диацетил-11-метил-6H-азепино[1,2-a]индол-6-ил)пропан-2-она.

Тенденция роста структуры в центральном депозитарии ценных бумаг с 1965 по 2018 гг. [11]

Примечание: данные за 1923-1964 годы объединены в последней строке таблицы.

Формат файла

3D-печатная модель бензойной кислоты
3D-печатная модель бензойной кислоты, взятая из определения кристаллической структуры, созданной с использованием координат из Кембриджской структурной базы данных и через программу CCDC Mercury . Верхняя модель показывает одну молекулу бензойной кислоты. Нижняя модель показывает димер с водородными связями.

Основным форматом файла для структурного осаждения CSD, принятым около 1991 года, является формат «Файла кристаллографической информации» , CIF. [16]

Депонированные файлы CSD можно загрузить в формате CIF. Проверенные и проверенные файлы CSD можно экспортировать в широкий спектр форматов, включая CIF, MOL, Mol2, PDB, SHELX и XMol, используя инструменты в системе CSD.

CCDC использует два разных кода для различения депонированного набора данных и курируемой записи CSD. Например, одна конкретная « CSD Communication » органической молекулы была депонирована в CCDC и ей был присвоен номер депонирования «CCDC-991327». Это обеспечивает свободный публичный доступ к данным в том виде, в котором они были депонированы. Из депонированных данных извлекается выбранная информация для подготовки проверенной и курируемой записи CSD, которой был присвоен рефкод «MITGUT». В рамках процесса курирования CCDC также применяет алгоритм DeCIFer, чтобы помочь редакторам назначать химию структурам, когда эти представления (например, типы связей и назначения зарядов и т. д.) отсутствуют в исходных представленных файлах CIF. [8] Проверенная и курируемая запись включается в дистрибутивы CSD System и WebCSD, с доступностью, ограниченной для тех, кто вносит соответствующий вклад.

Просмотр данных

3D-печатная модель структуры 1-метил-2,3,4,5-тетракис((триметилсилил)этинил)-1H-пиррола. Идентификатор CSD: XURZAN

Каждый набор данных в CSD можно открыто просматривать и извлекать с помощью бесплатной службы Access Structure. С помощью этой службы на основе веб-браузера пользователи могут просматривать набор данных в 2D и 3D, получать некоторую базовую информацию о структуре и загружать депонированный набор данных. Более продвинутые функции поиска и курируемая информация доступны через систему CSD на основе подписки.

Помимо использования системы CSD, файлы структуры можно просматривать с помощью одной из нескольких программ с открытым исходным кодом, таких как Jmol . Некоторые другие бесплатные, но не с открытым исходным кодом программы включают MDL Chime , Pymol , UCSF Chimera , Rasmol , WINGX, [17] CCDC предоставляет бесплатную версию своей программы визуализации Mercury.

Начиная с 2015 года Mercury от CCDC также предоставляет функционал для создания готовых к 3D-печати файлов из структур в CSD. [18]

Смотрите также

Ссылки

  1. ^ "Форма запроса депозитария CCDC CIF". Кембриджский центр кристаллографических данных . Получено 16 сентября 2014 г.
  2. ^ "CCDC Homepage". Кембриджский центр кристаллографических данных . Получено 2014-09-16 .
  3. ^ Groom C, Allen F (июль 2009 г.). «CCDC well grown: интервью с Колином Грумом, исполнительным директором Кембриджского центра кристаллографических данных, и Фрэнком Алленом, почетным членом». Журнал компьютерного молекулярного дизайна . 23 (7): 391–4. Bibcode : 2009JCAMD..23..391W. doi : 10.1007/s10822-009-9272-5. PMID  19421719.
  4. ^ «Объявление председателя от имени попечителей». Кембриджский центр кристаллографических данных . 11 сентября 2017 г. Получено 15 мая 2019 г.
  5. ^ "CCDC приветствует Юргена Хартера на посту генерального директора". Кембриджский центр кристаллографических данных (CCDC) . 11 июня 2018 г. Получено 15 мая 2019 г.
  6. ^ "CCDC открывает операции в США". Кембриджский центр кристаллографических данных (CCDC) . 30 октября 2013 г. Получено 15 мая 2019 г.
  7. ^ «Кембриджский центр кристаллографических данных устанавливает операции в США в новом партнерстве с Центром интегративных исследований протеомики Ратгерса». Офис исследований и экономического развития Ратгерса . Получено 15 мая 2019 г.
  8. ^ ab Bruno IJ, Groom CR (октябрь 2014 г.). «Кристаллографическая перспектива обмена данными и знаниями». Журнал компьютерного молекулярного дизайна . 28 (10): 1015–22. Bibcode :2014JCAMD..28.1015B. doi :10.1007/s10822-014-9780-9. PMC 4196029 . PMID  25091065. 
  9. ^ "CSD Entries: Summary Statistics" (PDF) . Кембриджский центр кристаллографических данных. Архивировано из оригинала (PDF) 2014-06-11 . Получено 2014-09-16 .
  10. ^ "CSD Entries: Summary Statistics" (PDF) . Cambridge Structural Database . 1 января 2019 г. . Получено 15 мая 2019 г. .
  11. ^ ab "CSD Journal Statistics" (PDF) . Cambridge Structural Database . 1 января 2019 г. . Получено 16 мая 2019 г. .
  12. ^ Groom CR, Allen FH (январь 2014 г.). «Кембриджская структурная база данных в ретроспективе и перспективе». Angewandte Chemie . 53 (3): 662–71. doi : 10.1002/anie.201306438 . PMID  24382699.
  13. ^ "Рост Кембриджской структурной базы данных (CSD) с 1970 года". CCDC . Получено 2014-09-16 .
  14. ^ "CSD Statistics". Кембриджский центр кристаллографических данных (CCDC) . Получено 17.05.2019 .
  15. ^ Робинсон, Филип; Уизерс, Нил; Пинк, Крис; Валслер, Бен. «Кембриджская структурная база данных достигла миллиона структур». Chemistry World . Получено 07.06.2019 .
  16. ^ Холл SR, Аллен FH, Браун ID (1991). «Файл кристаллографической информации (CIF): новый стандартный архивный файл для кристаллографии». Acta Crystallographica . A47 (6): 655–685. doi : 10.1107/S010876739101067X .
  17. ^ Farrugia LJ (1 августа 1999 г.). «Комплект WinGX для кристаллографии малых молекул». Журнал прикладной кристаллографии . 32 (4): 837–838. doi :10.1107/S0021889899006020.
  18. ^ "3D-печать: просто как 1, 2, 3!". Кембриджский центр кристаллографических данных (CCDC) . 19 августа 2015 г. Получено 18 мая 2019 г.

Внешние ссылки