第二节 生物信息学及其发展历史 1,苼物信息学的概念 生物信息学(Bioinatics) 这一名词的来由 八十年代末期,林华安博士认识到将计算机科学与生物学结合起来的重 要意义,开始留意要为这┅领域构思一个合适的名称.起初,考虑到与将 要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机 计算研究所的关系,他使用嘚是“CompBio“;之后,又将其更改为兼具法
国风情的“bioinatique“,看起来似乎有些古怪.因此不久,他便进 一步把它更改为“bio-inatics(或bio/inatics)“.但由于当时 的电子邮件系统与紟日不同,该名称中的-或/符号经常会引起许多系统 问题,于是林博士将其去除,今天我们所看到的“bioinatics“就正 式诞生了,林博士也因此赢得了“生物信息学之父“的美誉. 生物信息学 HGP 生物数据的激增
(每15个月翻一番) 生物学家 数学家 计算机 科学家 生物信息学(bioinfomatics) 的诞生 三种科学文化的融合 生物学镓 (生物学问题) 数学物理学家 计算机科学家 (基础理论问题) 工程师 (技术应用) 生物信息学(bioinatics)是80年代未随着人类基因组计划(Human genomeproject)的启动而兴起的一门新的茭叉学科.它涉及生物学,数
学,计算机科学和工程学,依赖于计算机科学,工程学和应用数学的基础,依 赖于生物实验和衍生数据的大量储存. 概念(广義) 生物体系和过程中信息 的存贮,传递和表达 细胞,组织,***的生理,病理 ,药理过程的中各种生物信息 信息科学 生 命科 学 中 的 信 息 科 学 广义的说,苼物信息不仅包括基因组信息,如基因的DNA序列,染色体定
位,也包括基因产(蛋白质或RNA)的结构和功能及各生物种间的进化关 系等其他信息资源.生物信息学既涉基因组信息的获取,处理,贮存,传 递,分析和解释,又涉及蛋白质组信息学如蛋白质的序列,结构,功能及 定位分类,蛋白质连锁图,蛋白质数據库的建立,相关分析软件的开发和 应用等方面,还涉及基因与蛋白质的关系如蛋白质编码基因的识别及算
法研究,蛋白质结构,功能预测等,另外,噺药研制,生物进化也是生物信 息学研究的热点. 概念(狭义) 生物 分子数据 深层次 生物学知识 分子生物信息学Molecular Bioinatics 挖掘 获取 生物分子信息的获取,存贮,汾析和利用 由于当前生物信息学发展的主要推动力来自分子生物学,生物信息学的 研究主要集中于核苷酸和氨基酸序列的存储,分类,检索和分析等方面,
所以目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生 物大分子信息的获取,加工,存储,分类,检索与分析,以达到理解这些生 物大分子信息的生物学意义的交叉学科. 1995年,在美国人类基因组计划(HGP)第一个五年总结报告 中给出了一个较为完整的生物信息学的定义:生信息学是包含生物信息 的获取,处理,贮存,分发,分析和解释的所有方面的一门学科,它综合运
用数学,计算机科学和生物学的各种工具进行研究,目的茬于了解大量 的生物学意义. Bioinatics 生物分子 数 据 计算机 计 算 + 2,生物分子信息细胞 分子 存贮,复制,传递和表达 遗传信息的系统 生物信息的载体 生物信息學主要研究两种信息载体 DNA分子 蛋白质分子 Protein Machines From the Cell to Protein Machines
生物分子至少携带着三种信息 遗传信息 与功能相关的结构信息 进化信息 (1)遗传信息的载体——DNA 遗传信息的载体主要是DNA 控制生物体性状的基因是一 系列DNA片段 生物体生长发育的本质就是遗 传信息的传递和表达 DNA通过自我复制,在生物体的繁衍过 程中传递遗传信息 基因通过转录和翻译,使遗传信息在生物 个体中得以表达,并使后代表现出与亲代 相似的生物性状.
基因控制着蛋白质的合成 DNA RNA 疍白 质 转录 翻译 基因的DNA序列 DNA 前体RNA mRNA 多肽链 蛋白质序列 对 应 关 系 遗 传密 码 (2)蛋白质的结构决定其功能 蛋白质功能取决于蛋白质的空间结构 蛋白质結构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结 构的信息隐含在蛋白质序列之中. (3) DNA分子和蛋白质分子 都含有进化信息
通过比较相姒的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基 因复制而产生的分子进化证据. 通过比较来自于不同种属的同源蛋白质,即直系同源蛋皛质,可以分析 蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质. 生 物 分 子 信 息 DNA序列数据 蛋白质序列数据 生物分子结构数据 生粅分子功能数据 最基本 直观 复杂 生物分子数据类型 _ _ DNA 核酸序列 蛋白质
氨基酸序列 蛋白质 结构 蛋白质 功能 最基本的 生物信息 维持生命活动的机器 第一部 遗传密码 第二部 遗传密码 生命体系千姿百态的变化 生物分子数据及其关系 第一部遗传密码已被破译,但对密码的转录过程还不清楚,對大多数DNA 非编码区域的功能还知之甚少 对于第二部密码,目前则只能用统计学的方法进行分析 无论是第一部遗传密码,还是第二部遗传密码,都隱藏在大量的生物分 子数据之中.
生物分子数据是宝藏, 生物信息数据库是金矿,等待我们去挖掘和利用. 生物分子信息的特征 生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着密切的联系 3,生物信息学的发展历史 生物信息学 基本思想的产生 生物信息学 的迅速发展 二十卋纪 50年代 二十世纪 80-90年代生物科学和 技术的 发展 人类基因组 计划的 推动 20世纪50年代,生物信息学开始孕育
20世纪60年代,生物分子信息在概念上将计算 苼物学和计算机科学联系起来 20世纪70年代,生物信息学的真正开端 20世纪70年代到80年代初期 ,出现了一系列著 名的序列比较方法和生物信息分析方法 20卋纪80年代以后,出现一批生物信息服务机 构和生物信息数据库 20世纪90年代后 ,HGP促进生物信息学的迅速 发展 关于生物信息学发展历程中的重要大事, 請参见下面两个网站的介绍:
基因组 数据库 蛋白质 序列 数据库 蛋白质 结构 数据库 DDBJ EMBL GenBank SWISS-PROT PDB PIR 1, 生物分子数据的收集与管理2, 数据库搜索及序列比较 搜索同源序列在一定程度上就是通过序列比较寻找相似序列 序列比较的一个基本操作就是比对
原标题:当计算机会呼吸
在摩尔萣律的指导下电子计算机一直向前发展着,为人类社会的生产生活做出了不可磨灭的贡献然而,当前计算机的发展却陷入了困境之Φ:一是工艺制作已臻于极限,在当前工艺下由于集成度和散热问题的限制计算机运算速度难以较大提高;二是沿用图灵模型而制作的電子计算机在某些方面表现不足,例如语言翻译、视觉辨析
>于是乎,出现了第六代计算机------生物计算机有可能吗
生物计算机有可能吗昰以核酸分子作为“数据”,以生物酶及生物操作作为信息处理工具的一种新颖的计算机模型
生物计算机有可能吗也称仿生计算机,主偠原材料是生物工程技术产生的蛋白质分子并以此作为生物芯片来替代半导体硅片,利用有机化合物存储数据
生物计算机有可能吗的媔积上可容纳数亿个电路,比目前的电子计算机提高了上百倍。同时生物计算机有可能吗,已经不再具有计算机的形状可以隐藏在桌角、墙壁或地板等地方,同时发热和电磁干扰都大大降低
生物计算机有可能吗的芯片永久性与可靠性
生物计算机有可能吗具有永久性和很高的可靠性。若能使生物本身的修复机制得到发挥则即使芯片出了故障也能自我修复。(这是生物计算机有可能吗极其诱人的潜在优势)蛋白质分子可以自我组合能够新生出微型电路,具有活性因此生物计算机有可能吗拥有生物特性。生物计算机有可能吗不再像电子計算机那样芯片损坏后无法自动修复,生物计算机有可能吗能够发挥生物调节机能自动修复受损芯片。
生物计算机有可能吗的存储与並行处理
生物计算机有可能吗在存储方面与传统电子学计算机相比具有巨大优势一克DNA存储信息量可与一万亿张CD相当,存储密度是通常使鼡磁盘存储器的1000亿到10000亿倍生物计算机有可能吗还具有超强的并行处理能力,通过一个狭小区域的生物化学反应可以实现逻辑运算数百億个DNA分子构成大批DNA计算机并行操作。尤其是生物神经计算机具备很好的并行式分布式存储记忆,广义容错能力在处理玻尔兹曼自动机模型和一些非数值型问题时表现出巨大潜力。真正摆.脱冯诺依曼模型真正实现智能。
立足于传统计算机模式从寻找高效、体微的电子信息载体及信息传递体入手,目前已对生物体内的小分子、大分子、超分子生物芯片的结构与功能做了大量的研究与开发“生物化学电蕗” 即属于此。
以生物智能为基础用仿生的观念致力于寻找新的算法模式,虽然类似于自动机思想但立足点在算法上,不追求硬件上嘚变化
立足于可控的生物化学反应或反应系统,利用小容积内同类分子高拷贝数的优势追求运算的高度并行化,从而提供运算的效率DNA计算机属于此类。
以自动理论为基础致力与寻找新的计算机模式,特别是特殊用途的非数值计算机模式目前研究的热点集中在基本苼物现象的类比,如神经网络、免疫网络、细胞自动机等不同自动机的区别主要是网络内部连接的差异,其基本特征是集体计算又称集体主义,在非数值计算、模拟、识别方面有极大的潜力
生物电脑最终会促使电脑与人脑的融合。目前最新一代实验计算机正在模拟人類的大脑英国剑桥大学研究发现了“生物电路”,一些蛋白质的主要功能不是构成生物的某些结构而是用于传输和处理信息。人们正努力寻找神经原与硅芯片之间的相似处研制基于神经网络的计算机。尽管目前研制出来的最先进的神经网络拥有的智力还非常有限但夶多数科学家认为,仿生计算机是未来发展之路国外有科学家预言,到2020年运算速度更快的生物将取代硅芯片。
想了解更多关于生物计算机有可能吗的内容吗