1。引子 那个美国的能源部还有论坛版主Dr.Prion所在的NIH就是厉害,上世界80年代末就决定要把我们身上的 DNA 碱基给一个个摆出来。人家就是发达也有钱,我们那个时候如果知道论文中要是分析讨论ATCGGTCAACTTG。。。的话那可是要吓人的! 13年过去了,这个课题到了尾声了
网站地图本站论坛
高级搜索收藏本站
 
 当前位置:试验方案>生物芯片>信息学> 正文

Seminar:后基因组时代的生物信息学

点击:   作者:51protocol收集   来源:  时间: 2007-05-27  本站论坛
1。引子

那个美国的能源部还有论坛版主Dr.Prion所在的NIH就是厉害,上世界80年代末就决定要把我们身上的DNA碱基给一个个摆出来。人家就是发达也有钱,我们那个时候如果知道论文中要是分析讨论ATCGGTCAACTTG。。。的话那可是要吓人的!
13年过去了,这个课题到了尾声了,听说基本上已经出来了。里面还有中国人1%的实验结果呢!而且14年来,不光是人类的基因序列,其他好多物质的基因序列也给搞出来了。也不光是测测序列,也同时进行其他生物学,特别是分子生物学的研究,也得到了大量的生物数据。做这些工作,要花好多钱的,研究开发了好多“学生们不能随便动的高级仪器” ,也就是那些个“国外进口的测试,分析的机器” 。不管,我们也有钱了,所以也参与了测试,也有了“巨大的贡献” ,是好事。
因为全世界这十几年的生物实验,造成了巨量的生物数据,根本不能写在纸上,用笔来计算分析,用人脑来总结和归纳和演义了,于是计算机的普遍使用解决了它,它也给了计算机学科以新的研究客体。于是,新学科诞生了:生物信息学!
2。研究内容

无非生物学数据,当然最“经典” 的是分子生物学,是DNA序列。

(1)数据库
目前公开的有500多个生物信息学数据库,拿大家熟悉的GenBank, Swiss-Prot, KEGG….涉及核酸序列,基因组(全序列),蛋白质序列,蛋白组,蛋白质结构,代谢反应及途径,其他混合型,其他方方面面的东西。每年“Nucleic Acids Research”(http://nar.oupjournals.org) 第一期便有大量新的和更新的数据库的专辑。生物数据库的建立要用上计算机学数据库和网络方面的技术了。应该说是生物信息学研究的基础和重点。目前生物数据如DNA序列,蛋白质结构等数据比较复杂,所以要求服务器的性能相对要高些。往往他们还要推出基于该数据库的分析程序。如NCBI的Blast系列工具,背后都是大量生物信息学的工作。另外,基于一级数据库而建立的二级数据库,由于不同数据库的数据格式是heterogeneous,因为不是每个人都用得起象oracle的大型数据库,有些就用用mysql就行,甚至微软的access,或干脆txt文本,所以又得好多人有事干了:data mining, data integration. 又考虑开发标准化的生物数据等。感觉国内搞的人不多。

(2)算法研究
属于经典生物信息学领域,尤其研究序列对准的,20多年的历史了。老的算法如记分法和概率统计法:BLAST算法,SMITH-WATERMAN算法和Hidden Markov Model和Neural Network等等。 还有语言学方法,Z曲线法。目前新的,更灵敏,效率高。更有用的算法不断推出,必须经常阅读新出的期刊才能保持不落伍。

(3)软件编写
属于实现算


法的工作,懂计算机语言的能力要比懂生物学的高。

(4)其他具体些的领域

其实广义上的生物信息学是可以研究生物学的任何方面。因为生命现象是在信息控制下不同层次上的物质、能量与信息的交换,不同层次是指核酸、蛋白质、细胞、器官、系统、整体等,而目前一般意义的生物信息学是基因层次的 。(以下分类根据国家科学技术部基础研究司邵立勤教授的分类而来)。

一、生物的遗传信息
  DNARNA―蛋白质 遗传信息――转录、翻译 遗传密码 “第二遗传密码” 生物信息学 遗传语文

二、生命活动的调控
  基因的功能、表达和调控 蛋白的结构、功能和调控 细胞活动(分化、发育、衰老、死亡)的调控 器官、系统、整体活动的调控 节律、生物钟分蘖、生长、开花、结果 营养的吸收、传输、转化 对外界信号的反应:含羞草、抗逆性

三、生物电磁学与电磁生物学
  生物电磁:生命活体在不同层次(电子、离子、原子、基因、细胞、 组织、整体等)的活动和不同属性(包括思维、精神)活动时以及和外界环境(生命体周围直至宇宙)相互作用时反映出来的各种电磁信息。
  人体的电磁辐射(包括发光):频率、强度、频谱
  人体信号的调制方式:调幅、调频、编码
  电磁生物学:电磁辐射对生物体的影响 电磁场导致DNA突变 体内电、离、细胞等分布、极化状态变化 导致疾病

四、视觉系统与光信息处理
  视网膜神经元回路与信息处理 彩色视觉及彩色图像的编码、变换机制 眼动成象机制及宽视场、消色差动态成象系统视觉认知机制及其图像信息的智能模式识别 不同状态立体视觉机制和静态、动态立体视锐度

五、脑和神经系统与信息
  脑的感知觉信息处理原理及其应用
  学习、记忆、思维 逻辑思维和形象思维 思维模型与信息处理系统新原理的研究
  新的计算模型、新型计算机,如:神经计算机

六、生物体结构与微光机电系统
  微光机电系统是当代科技前沿
  人能制造出生物体的微细结构吗?
  DNA驱动的微细机器人
  生物大分子到细胞基本结构体系的自组装自组织
  创造新物质的分子工程学研究 分子聚集体的化学

七、生物芯片、蛋白质芯片等 …………

当然我看还是不全面,至少还得包括生态方面和医药,医疗方面的研究。
3。简短历史及国内外差距

说到历史,基本上还是得到双螺旋开始:
1953年:Francis Crick,James Watson和Maurice Wilkins发现DNA的双螺旋结构。
1956年:“生物学中的信息理论讨论会”于美国田纳西州的Gatlinburg召开。
1958年:由H.P. Yockey编辑的《生物学中的信息理论讨论会》由纽约Pergamon出版社出版。
1970年:Needleman和Wunsch发表了广受重视的两序列比较算法。 Gibbs和McIntyre发表了单序列分析方法——矩阵打点作图法,用于寻找单条序列中的重复片断,从而推测其功能。
1985年:


生物信息学专业期刊Computer Application in the Biosciences(CABIOS) 创刊。
1986年:日本核酸序列数据库DDBJ诞生。 A.Bairoch创建蛋白质数据库SWISS-PROT。
1988年:美国国家生物技术信息中心(NCBI)成立,其目的是进行计算分子生物学的基础研究,构建和散布分子生物学数据库。A.Bairoch创建PROSITE数据库。
1990年:第一届国际电泳、超级计算和人类基因组会议在美国佛罗里达州会议中心举行,尽管会议的名称并没有出现生物信息学这一名词,实际上生物信息学却是会议的主要部分。国际人类基因组计划启动,被誉为生命科学的“阿波罗登月计划”。
1992年:Henikoff.S和Henikoff. J.G在序列比较算法中引入之后被广泛应用的BLOSUM矩阵。
1993年:欧洲生物信息学研究所(EBI)获准成立。专业蛋白质分析系统网络服务器诞生。
1994年:国际生物信息学系列会议由Cambridge Healthtech研究所接管,并走向商业化和联机化。澳大利亚Macquarie大学的Marc Wilkins和Keith Williams首先提出蛋白质组的概念(Proteome)。第三届国际生物信息学和基因组研究会议在佛罗里达州会议中心举行。
1995年:由于生物信息学日益普及,Cambridge Healthtech研究所决定将国际生物信息学系列会议改成年会形式。日本信息生物学中心(CIB)成立。
199


8年:亚太生物信息学网络(APBioNet)成立。人类完成第一个多细胞生物——线虫的基因组全序列测定。CABIOS期刊更名为Bioinformatics。瑞士生物信息学研究所(SIB)成立。美国塞莱拉遗传公司成立,目标是到2001年绘制出完整的人体基因图谱,与国际人类基因组计划展开竞争。
2000年5月8日:德、日等国科学家宣布,他们已基本完成人体第21对染色体的测序工作。
2001年2月12日:中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果。

发达国家如美国,欧洲,日本不容置疑,已经走在前头了。我们只能算三流能力,象俄罗斯,墨西哥都比我们强,算二流。当然这里是指代表所在国的科研单位,要不然,把所以从事研究的拿中国护照的人员来代表中国,那我们应该是一流的了!
国外的情况就不言了,点击个NCBI,EBI,EMBL,DDJB。。。所有连接的东西,基本上都是他们的。就分析下国内情况(是我刻意关注的,有失误请批判) 。2,3年前就注意到有中国科学院生物物理所、中国医学科学院、军事医学科学院、清华大学、北京大学、复旦大学、中山大学、天津大学、东南大学、内蒙古大学等单位在从事。
1993年在国家自然科学学基金委的资助下,中国开始参与人类基因组计划。
1996年,在教育部和科技部的支持下,北京大学蛋白质工程和植物遗传学工程国家实验室加入欧洲分子生物学网络(EMBnet)。
1997年3月,北京大学生物信息学中心CBI:the Centre of BioInformatics at Peking University成立。
1997年9月和12月中国科学院召开了第80、87次香山会议,首次邀请有关专家对该领域进展进行探讨,主题分别为“DNA芯片的现状与未来”和“生物信息学”。
1998年,中国人类基因组研究北方中心(北京)和南方中心(上海)成立。
1999年3月9日至10日,清华大学


生物信息学研究所、国家人类基因组北方研究中心和北京生物技术和新医药产业促进中心共同举办了“北方生物信息学学术研讨会”。
1999年4月6日,北京大学举办了“国际生物信息学讲习班”。
1999年9月,中国获准加入人类基因组计划(负责测定人类基因组全部序列的1%—3号染色体上的3000万个碱基对)成为第六个国际人类基因组计划参与国,也是参与该计划的唯一发展中国家。
2000年3月,中国科学院上海生命科学研究院生物信息中心成立。

几年了,感觉国内的生物信息学还是进步不快,甚至原地踏步多了些学校开设这专业了,可是成果不多呀!明显是缺乏帅才,群龙无首。而且教授,教师能力有限,有先甚至对生物信息学只是1,2,3非常片面的了解,更不要说了解目前是研究重点,热点和方向。。。(很对不起那些莘莘学子的!)

4。后基因组时代的生物信息学

基本是还是按:序列->结构->功能,一步步走向探索生命过程的每个环节。当然在进行功能性研究的同时,还是要不断地进行序列分析工作的。同时就研究面来说,是走下两端:微观(深入到研究单个分子的结构和运动规律)和宏观(结合宏观生态学,从大的角度来研究生命过程) 。本Seminar只讨论“序列->结构->功能” ,而且仅侧重功能方面的研究。

很显然,序列方面昨天已经提起,基本上是序列分析,对准方面的算法(注意不是简单的测序!那是分子实验生物学,不是信息学) 。结构方面的研究重点在于


研究蛋白质的空间结构,因为它跟新药开发直接联系。前20名的世界医药公司都有搞这方面的一摊人,期中模拟Docking可能要涉及大型计算机的处理技术。一般情况,他们先用芯片对疾病的序列进行确定,选择可能的基因序列,然后预测可能的相关蛋白质的结构,然后用上万已知药物结构进行计算匹配。。。当然也有针对性的设计药物结构。

功能一块,也就是研究遗传型到表型的过程,归纳为代谢途径的分析。涉及生化反应途径,基因调控,信号转导过程(蛋白质间的作用)等。

(1)预测调控网络

尽管目前已有多个数据库关于代谢网络途径的,有些数据可以去那直接拿来参考,而且数据库本身也除了手工和自动检索文献以补充数据外,也有开发预测工具的。而你也可能要自己去做从基因组来预测网络。或针对性地去整合某些数据,研究其规律,搞个算法模型等。。。很可能你要知道象“Data
Mining in Bioinformtics” 这些大的概念和具体技术了。

(2)网络普遍性分析
有了网络后,往往是就简单物种而言,好多人已经对网络的“图论” 方面的属性做了分析,推广他们的发现,正试图给出一些重要的结论。有兴趣的可以关注“analysis on large scale metabolic networks” 。你也可以开发些个软件工具来自动分析。。。

(3)建立模型分析

Systems Biology越来越热。无非要求我们看待生命活动过程要用系统的眼光,不能只盯住一个方面的数据而隔离联系。所谓的 virtual cell模型就是基於这考虑。日本E-cell可能比较熟悉,它是基於常微分方程来求解反应速率。另外不错的工具还有象DBsolve,Gepasi… 它们已经组成了合作组,共同支持SBML数据交换。当然其他形式的建模工具还很多,用随机方法处理的也较多,毕竟,因为确切的动态参数很难拿到。

今后10年20年这方面的工作将一直是重点。对我们刚起步的人都是机会和挑战。


上一篇:基因组时代的生物信息学   下一篇:生物信息学发展与应用

 
推荐文章
 
相关文章
推荐专题
 


↑返回顶部   打印本页   关闭窗口↓  
 本站申明 联系我们 网站地图
Copyright© 试验方案

Powered by DedeCms email:htmyth#yahoo.com.cn QQ:386836509

Optimized to 1024x768 to Firefox,Opera and MS-IE6