|
第二种方法在由PDB衍生而来的分子建模数据库(MMDB)的数据库记录中得到应用。MMDB运用标准的“残基词典”,其中记录了氨基酸、核酸残基这样以聚合体形式存在,具有末端多样性的分子中所有原子、化学键信息。在结构科学家解决分子结构而使用的专用软件中,这类数据词典是很普遍的。读入MMDB数据的软件能利用词典所提供的键信息将原子连为一体,而无须力图满足化学准则的要求。最终,用软件获得准确的三维坐标数据。这种方法使软件开发简单化,因为连键规则中的例外情况在数据库文件中已被记录,而无须附加逻辑控制代码即可将之读入。
一些不熟悉结构数据的科学家常常希望在公共数据库中的结构信息表达类同于教科书。他们会对结构中某部分的数据丢失感到惊讶。相应于某一特定分子的三维数据库记录的适用性并不意味着完整性。结构的完整性定义如下:化学图像中任一原子至少有一维坐标值确定。
在结构数据库中,完整的记录是不多见的。大多数由X射线衍射获得的结构缺少氢原子坐标,因为氢原子的空间位置不能用实验手段决定。但一些建模软件可用于估计氢原子位置,并用其重建结构记录。在结构数据库中识别由模型构造的分子是容易的。它们常常有过于复杂的坐标数据和所有用实验手段无法确认的氢原子可能表达形式。
【PDB:Brookhaven国家实验室蛋白质数据库】
计算机在生物学中的运用起源于生物物理方法的应用,如X射线结晶衍射。于是最初的“生物信息学”数据库被用于存储复杂的三维数据不足为怪。现代的蛋白质数据库以收集的蛋白质三维结构公共数据为核心,附带核酸、糖类三维结构和各类由X射线衍射结晶学家、核磁共振谱分析学家通过实验测定的合成物。本部分集中详细介绍由蛋白质数据库PDB提供的生物信息学数据库服务。
Brookhaven国家实验室(详见本章末列表)蛋白质数据库的WWW站点为三维结构数据的提交、检索提供了大量的服务。
对于那些希望向PDB提交三维结构信息的人们而言,可以经由AutoDep服务机构按照一定的基于网页的程序步骤实现其愿望。因为提交程序是随编写时间而不断变化的,所以在PDB的网络站点上应该能找到最新信息。核酸结构数据保存在核酸数据库NDB中。Biotech Validation Suite站点是镜像站点,提供在提交结构数据前屏蔽立体化学构象与几何学构象不一致的PDB文件的服务。
PDB明文规定拒收依靠计算机三维建模而非实验手段获得的结构数据。而关于已被宣布为例外结构的最新细节数据的提交需与PDB商议。容纳结构模型的单独的数据库是现成的,可以在本书的网络站点上查询有关信息。
PDB中登记入册的结构记录拥有一个唯一的包含字母与数字的被称为PDB-ID或PDB编码的四位字符串,可由数字0~9和大写字母A~Z组合而成。因此可能的组合方案超过了130万种,没有按某特定顺序分配PDB-ID。但蛋白质数据库PDB的索引编撰者尽量设计好的记忆方法,使结构名称易于记忆,如早先如图3.1所示的胰岛素记录3INS。
PDB和它的一些镜像站点提供由每个PDB记录的所有文本信息索引的文本搜索引擎,可按一些专门的查询项目(如提交数据、作者姓名、结构表达)检索。PDB最新的搜索引擎,3DB Atlas,可用于PDB记录检索,如图3.2示。3DB Atlas也是链接有PDB结构数据第三方注解的基本数据库,支持大量的到基于因特网三维结构服务的其它网点的链接。其中包括了一些二维、三维浏览器,如Kinemage(Richardson,Richardson,1992)、Resmol(Sayle,Milner�White,1995)。图3.2b显示了蛋白质1BNR的到3DB记录Barnase的一些链接。创建的图像有助于调整三维结构方向,以获得观察结合位点这类确定特征的最好视角。3DB Atlas也与专门设计的数据库相连,这些数据库由对诸如结构进化(FSSP:Holm,Sandar,1993)、结构相似性(DALI:Holm,Sander,1996)和蛋白质运动(Gerstein等,1994)等相关课题有兴趣的研究者维护。3DB可相应链接NCBI的MMDB服务(Hogue等,1996),提供了一条到Entrez(Schuler等,1996)系统(包括序列、分类、PubMed/MEDICINE服务和VAST结构相似性比较)的通路。
上一篇:性连锁的发现 下一篇:应用GCG进行序列分析 共12页: 上一页 [1] 2 [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] 下一页 |