晶体结构数据库概况
目前国际上已经建立的晶体学数据库主要五种,下面分别进行介绍。
1.金属数据库(CRYSTMET)
金属数据库是由加拿大科学技术情报研究所(Canada Institute for Science and Technical Information)建立的,里面收集了1913年以来金属单质、金属化合物和固溶体的晶体数据,包括金属元素与硼、硫、硅、锗等元素的化合物。目前在该库中约有60000多个条目,每一条目存储一种晶体的信息。其中大约80%以上的条目存有原子坐标,其余的条目只包含晶胞参数和空间格子类型的信息。
2.剑桥结构数据库(CSD)
剑桥结构数据库建立在英国剑桥晶体学数据中心(Cambridge Crystallographic Centre),该库系统收集了自1935年以来的二十九万种有机金属化合物的结构信息,包括了普通有机化合物,有机金属化合物和金属配位化合物等三大类别。其中三维空间原子坐标信息的约有260000种。据统计,有80%以上的是1980年以后发表的最新测定的结果。
中国科学院和北京大学等单位于1987年初从英国引进了剑桥结构数据库系统磁带。结构数据库及其软件系统具有丰富的检索、绘图和结构信息加工功能,这些功能大致可分为四类,下面分别进行介绍。
(1)本文信息检索功能。用户可根据化合物名称、分子式元素、原始文献、作者、年代等项目进行检索。下面举出几个简单的例子。
例1:检索全部甾族化合物。
例2:检索出同时含有锰、砷两种元素的有机化合物。
例3:检索全部含镧元素的化合物。
例4:检索全部含碱金属(或碱土金属、锕系金属、过渡金属)的有机化合物。
例5:检索Glusker在1983-1986年间发表的全部文献。
例6:检索Karle在J.Amer.Chem.Soc.上发表的1976-1980年间的全部文献。
(2)化学联结关系检索功能。用户可给某分子或分子片断中的原子之间化学联结关系进行检索。
例1:检索全部7配位化合物。
例2:检索含有S-C-N=C基团的全部化合物。
(3)三维分子几何计算和统计。用户应用上述检索功能,可能得到数十套乃至几千套数据,然后对感兴趣的问题进行计算、筛选和统计。例如,通过检索功能查出含有S-C-N=C基团的全部化合物之后,用户可要求列出这些化合物中N=C键的键长,计算键长平均值和标准偏差等。这种计算和统计方法对药物分子设计、反应途径分析和结构规律系统研究等领域都是很有意义的。
(4)绘图功能。结构数据库系统既可实现在绘图仪上绘制结构图形,又可在绘图终端的屏幕上观察一系列分子结构图形,随时可选择其中感兴趣者进行屏幕拷贝。
3.无机晶体结构数据库(ICSD)
德国无机化合物晶体数据库(Fachinformations Zentrum Energie, Physik, Mathematik GmbH)收录自1913年以来合成的无机化合物晶体结构(含原子坐标), 主要是金属与金属间化合物, 目前存有约76480个条目。平均每年更新2次, 每次增加约2000个条目, 所收集的化合物是剑桥结构数据库和金属数据库中没有的。
更详尽的信息可查阅它的网站:http://icsdweb.fiz-karlsruhe.de
4.蛋白质数据库(PDB)
美国蛋白质数据库(Protein Data Bank)收集了约26000种生物大分子的结构数据,其中22300种为X射线衍射或其它方法测定的晶体结构, 3800种为NMR测定的结构数据。它们中间13216种有原子坐标结构参数。1964种有NMR文件。这些数据不是从文献中收集来的而是由作者直接提供的。该数据库为分子生物学、生物化学和生物工程学等学科的研究提供了结构依据。
5.粉晶数据库
据最近统计,JCPDS-国际衍射数据中心的粉晶数据库(JCPDS-International Center for Diffraction Data)汇集了世界各国发表的约113000种单相物质的粉晶衍射资料。在该库中,每一种单相物质都有一套资料,包括晶体名称、化学成分、参考文献、收集衍射数据时的实验条件、各条粉晶衍射的d-I/I1 值等。这些资料除了在卡片上可提供检索外,还记录在磁带和磁盘上,便于用电子计算机进行自动检索。
|