|
第二种实现方法是在环球网上,称为WWW Entrez或者Web Entrez。可以利用各种可用的网页浏览器,例如Internet explorer或Netscape,它们把搜索结果传回桌面上。使用网络浏览器的用户不必再确认是否安装了最新的Entrez版本-只要浏览器是较新的版本,查询的结果总是通过最新的Entrez版本得到的。Web版还有另外一项用处,上述所有的相近性关系和硬连接关系都可以用超文本表示,用户可以通过点击记录上的特定的词来浏览。
用网页实现比网络版进步的地方在于网页可以有连接到外部数据源的能力。如由某个杂志或出版社维护的论文的全文版本,或某些本来不是Entrez组成部分的专门的数据库。网络版的速度上的优势同时导致了这方面的限制,直接连接到NCBI发送者意味着用户一旦连接到NCBI就不能再转移到别的任何地方。这两种方法的另一个主要区别在于表达方式上,网络版用一套窗口而网页版用一系列的网页,服从标准的网页规范。选择哪一种是用户的爱好问题,两种方法在Entrez的搜索空间中得到的一样的结果。
Entrez的查询方法:举例
##
图5.3 从MEDLINE开始作entrez查询,使用网页版的Entrez版本(http://www.ncbi.nlm.nih.gov/entrez)。详细说明参见正文。
为了解释前面的Entrez系统的集成特性并且把相近性联系的特性讲透彻,最好的方法是考虑一个生物学的实例。此处使用Web版的Entrez界面。从NCBI网址上的Entrez主页开始,用户可以选择组成Entrez系统的五个数据库之一作为查询的起点。此处查询从MEDLINE开始。PubMed的查询主页显示于图5.3,此页上的表格要求进行两项选择然后提交查询。首先用户必须选择查询域,把搜索范围限制在数据库入口的一个特定的域上(例如,生物学分类或标题)。其次,用户必须选择一种查询模式,指定客户和服务器的交互方法。如果是Automatic模式,服务器会自动的查看搜索框中输入的词条,在数据库中查找符合得最好的词条。显然Automatic模式和List Terms模式常常返回同样的结果,但由于在开始查询的时候记录的可能的索引方式用户可能还不太清楚,建议使用List Terms模式。
假设用户要检索关于hiv 1的摘要。使用Entrez查询窗口,在查询框中输入hiv 1,选定Text Words为检索域(即在标题和摘要中查找HIV 1的出现),选择List Terms为查询模式。(当然也可以用Organism作为检索域;使用两种不同的方法进行检索并观察输出的不同对用户来说是一个很好的练习。)检索命中后会打开一个新的网页(图5.4)。这一页包含一个词条选择窗口,用户可以浏览与原来的词条(HIV 1)最接近的词条。注意选择窗口在HIV 1后面还显示了很多略有区别的其它条目。如果用户选择的是Automatic模式,就会忽略这些额外的条目,这样可能忽略了重要的信息。采用List Terms模式,就可以使用户看到原来的检索词的各种变种。
##图5.4 在MEDLINE数据库上进行Entrez检索查的所有条目。详细说明参见正文。
到这一步还没有实际检索到记录。要检索记录用户要先在词条选择框中点击需要的词条(此处为hiv 1)然后点击Select按钮。随后打开的网页的上部显示了现在检索的状态和查到的记录数(图5.5)。执行上面所述的查询返回了17,943条记录,数量太大了,任何人都无法完全过滤一遍。因此有必要进行修正以减少返回的摘要的数量。如果用户对HIV 1的杂二聚体??的折叠感兴趣,可以用heterodimers和folding作为附加的检索词,重复上面的步骤。虽然每个单独的词都能检索到成千上万条记录,它们的组合只查到6条记录(图5.6)。在Entrez系统中,缺省的逻辑算符是AND,在检索词下方的修正窗口中可以看到。
为了看到实际的检索结果,用户应点击标记为Retrieve 6 Documents的那个按钮;随后会打开新的窗口(图5.7)。窗口中每一条记录有下面几个部分:检查框,第一作者的名字,出版年份,标题,引用信息。选中窗口底部的Jacoco-Molina 1993年的记录;点击作者名字打开另一个窗口,这个窗口包括引用信息,论文名称,所有作者列表,来源及摘要,以标准的引用格式书写。
图5.7所示的页面上,在Display按钮后面的下拉菜单中可以选择一些别的格式。切换到Absttract格式将得到起来非常相似的记录。差别在于在摘要后面显示了一些分类信息如MeSH条目以及与这条记录有关的编有索引的材料。使用MEDLINE格式将打开MEDLINE/MEDLIARS页面,记录的左边有每个域都对应的两个字母的代码(如作者域的代码为AU)。这种格式的记录可以存储而且能容易的输入到第三方的目录管理程序,例如EndNote和Reference Manager。
在图5.8的上端是一排连接按钮。这是用户可以进一步查看刚才讲过的相近性和硬连接关系的入口点。如果用户点击Related Articles按钮,Entrez会显示出有133条与Jacobo-Molina这条记录相关的记录-即有133条具有相似的主题的记录。-这些论文的前20篇显示在图5.9的一个新的列表中。第一篇是原来的那篇关于HIV 1反转录酶的晶体结构的论文。这一篇称为原记录,它显示在列表的上端,相近的记录列在后。这些相近记录的排列是按照相似程度降序排列的。因此最靠近原记录的被认为是与原记录最接近的。浏览一下标题用户就可以很容易的找到与HIV 1的蛋白质有关的结构和功能研究的有关信息,可以很快的得到相关索引的目录。当用户在写论文的时候这种功能尤为有用而且节省时间。因为用户在到图书馆的书架中去寻找之前就可以浏览摘要并选定真正感兴趣的论文。
上一篇:应用GCG进行序列分析 下一篇:NCBI 数据模型
共7页: 上一页 [1] [2] [3] 4 [5] [6] [7] 下一页 |