• / 4
  • 下载费用:10 金币  

生物信息学数据库综述.doc

关 键 词:
生物信息学数据库综述.doc
资源描述:
生物信息学数据库综述摘 要 本文对生物信息学常见的数据库进行了汇总。常见数据库分为三类:核酸序列数据库、蛋白质序列数据库、三维分子结构数据库。并分别对其中常见数据库进行了介绍。对于生物信息学数据库的现存问题也进行了论述。关键词 数据库;核酸序列数据库;蛋白质序列数据库;三维分子结构数据库;随着生物信息的发展,生物信息学数据库的数量在不断的递增,内部结构也不断的复杂化,功能也越来越细化。根据数据的类型可以将数据库分为核酸序列数据库、蛋白质序列数据库三维分子结构数据库。本文将比较常见的数据进行了汇总。1 核酸序列数据库常用的核酸序列数据库有 GenBank 核酸序列数据库、 EMBL 核酸数据库、DDBJ 数据库、 GDBD 等。1.1GenBankGenbank 库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(N CBI)建立和维护的。Genbank 每天都会与欧洲分子生物学实验室(EM BL)的数据库,和日本的DNA 数据库(DDBJ)交换数据,使这三个数据库的数据同步。Genbank 的数据可以从 N CBI 的 FrP 服务器上免费下载完整的库,或下载积累的新数据。N CBI还提供广泛的数据查询、序列相似性搜索以及其它分析服务,用户可以从 N CBI 的主页上找到这些服务。Gel~ bank 库里的所有数据记录被划分在若干个文件里 ,如细菌类、病毒类、灵长类、啮齿类,以及 EST 数据、基因组测序数据、大规模基因组序列数据等 16 类,其中 EST 数据等又被各自分成若干个文件 1.2 EM BL 核酸序列数据库EM BL 核酸序列数据库由欧洲生物信息学研究 所(EBI)维护的核酸序列数据构成,由于与 Genbank 和 DDBJ 的数据合作交换,它也是一个全面的核酸序列数据库。该数据库由 Oracal 数据库系统管理维护,查询检索可以通过因特网上的序列提取系统(SRS)N 务完成 l 6J。向 E M BL 核酸序列数据库提交序列可以通过基于 W eb 的 WEBI N 工具,也可以用 Sequi n 软件来完成。 1.3 DD BJ 数据库 D D BJ 数据库创建于 1984 年,由日本国立遗传学研究所遗传信息中心维护。它首先反映日本所产生的 DNA 数据,同时与 Genbank、EMBL 合作互通有无,同步更新,每年四版。日本 DNA 数据仓库(DDBJ)也是一个全面的核酸序列数据库。可以使用其主页上提供的 SAS 工具进行数据检索和分析。可以用Sequin 软件向该数据库提交序列。 1 .4 G D B 人类基因组数据库(GD B)是人类基因图谱和疾病的数据库。GDB 的目标是构建关于人类基因组图谱和测序。目前 GDB 中有:人类基因组区域(包括基因、克隆、amplimersPCR 标记、断点 breakpoint 细胞遗传标记 cytogenetic markers、易碎位点 f r agile、 EST 序列、综合区域 syndromic regions、contigs 和重复序列);人类基因组图谱( 包括细胞遗传图谱、连接图谱、放射性杂交图谱、content conting 图谱和综合图谱等);人类基因组内的变异 (包括突变和多态性,加上登位基因频率数据)。GDB 数据库以对象模型来保存数据,提供基于 Web的数据对象检索服务,用户可以搜索各种类型的对象,并以图形方式看基因组图谱 。 2 蛋白质序列数据库 随着 HGP 计划的不断深入以及测序技术的不进步,蛋白质序列信息也成指数级增长,蛋白质序列数据库就是主要以这些序列也就是蛋白质的一级结构作为数据源,并辅以序列来源序列发布时间、序列参考文献、序列特征等内容加以注释,最终形成数据文件,存放于数据库。目前规模较大的综合型蛋白质序列数据库有:PIR 、SW ISS —PR OT/TrEMBL 、PROSITE 等。 2 .1 PIR 和 PSD PI R 是蛋白质信息资源(Protein Information Re—source)的缩写。这是一个国际蛋白质序列数据库,它包含所有序列已知的自然界中野生型蛋白质的信息。此库的主要目的是提供按同源性和分类学组织的综合的、非冗余的数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列以按蛋白质家族分类。PIR 国际蛋白质序列数据库(PSD) 是由美国华盛顿的全国生物医学研究基金会(NBRF)所支持的 PIR、慕尼黑蛋白质序列信息中心(MIPS)和 13 本国际蛋白质序列数据库(JI PI D )共同维护的国际上最大的公共蛋白质序列数据库。PSD 的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条
展开阅读全文
  微传网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:生物信息学数据库综述.doc
链接地址:https://www.weizhuannet.com/p-10039010.html
微传网是一个办公文档、学习资料下载的在线文档分享平台!

微传网博客

网站资源均来自网络,如有侵权,请联系客服删除!

 网站客服QQ:80879498  会员QQ群:727456886

copyright@ 2018-2028 微传网络工作室版权所有

     经营许可证编号:冀ICP备18006529号-1 ,公安局备案号:13028102000124

收起
展开