• / 69
  • 下载费用:10 金币  

(第一堂课)生物信息学.ppt

关 键 词:
(第一堂课)生物信息学.ppt
资源描述:
2018/3/2,生物信息学,袁细国西安电子科技大学E_mail:xiguoyuan@mail.xidian.edu.cn,2018/3/2,参考书,王翼飞,史定华. 生物信息学——智能化算法及其应用,北京 : 化学工业出版社,2006孙萧,陆祖宏,谢建明. 生物信息学基础,北京:清华大学出版社,2005孙萧,陆祖宏,谢建明. 生物信息学概论(译),北京:清华大学出版社,2004张阳德. 生物信息学,北京:科学出版社,2009,2018/3/2,考核方式,平时成绩 20% 期末考核 80%期末考核基本概念、基本方法的理解智能化算法或统计学中的理论和技术在生物分子数据分析中的应用,2018/3/2,章节及课时安排,2018/3/2,第一部分 基础内容,2018/3/2,第一章 生物信息学简介,2018/3/2,什么是生物信息学,bioinformatics= bio + informatics 生物 信息学相关学科计算生物学(computational biology)系统生物学(systems biology),2018/3/2,生物体系和过程中信息的存贮、传递和表达,细胞、组织、器官的生理、病理、药理过程的中各种生物信息,信息科学,生命科学中的信息科 学,广义:生物信息学是指对生物信息的获取、加工、存储、分配、分析和解读,并综合应用数学、计算机和生物学工具,以更好理解数据中的生物学含义。,2018/3/2,生物分子数据,深层次生物学知识,,分子生物信息学Molecular Bioinformatics,狭义:是以基因组DNA序列信息分析作为基础,找到基因组序列中代表蛋白质和RNA基因的编码区,阐明非编码区的信息实质,破译隐藏在DNA序列中的遗传规律;同时,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识生物代谢、发育、分化、进化规律。,2018/3/2,生命的物质基础、能量转换、代谢过程;生命信息的组织、传递、表达过程,物理,化学,分子生物学,遗传学,信息技术,,,,,,,2018/3/2,生物分子信息,DNA序列数据,蛋白质序列数据,生物分子结构数据,生物分子功能数据,最基本,直观,复杂,生物分子数据类型,2018/3/2,生物分子至少携带着三种信息:遗传信息与功能相关的结构信息进化信息,2018/3/2,生物信息学主要研究两种信息载体 DNA分子 蛋白质分子,2018/3/2,2018/3/2,DNA通过自我复制,在生物体的繁衍过程中传递遗传信息。,,基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状。,DNA序列控制着蛋白质的合成,DNA,RNA,蛋白质,,,转录,翻译,遗传信息的载体——DNA,2018/3/2,基因的DNA序列,,蛋白质序列,,,,遗传密码,2018/3/2,生物分子信息,第一部遗传密码,第二部遗传密码,DNA核酸序列,蛋白质氨基酸序列,,,蛋白质结构,蛋白质功能,,,,最基本的生物信息,,生命体系千姿百态的变化,,维持生命活动的机器,,生物分子数据及其关系,2018/3/2,生物分子信息特征 1)生物分子信息数据量大,如DNA序列以千兆碱基(giga base, Gb)为单位;,2)生物分子信息复杂,既有生命本质信息,又有生命表 象信息; 3)生物分子信息之间存在着密切的联系。,2018/3/2,生物信息学的研究目标与任务,目标 揭示生物分子数据的内涵,加快人类了解自身的进程。,任务 (1)收集和管理生物分子数据; (2)进行数据处理和分析; (3)开发分析工具和使用软件。,2018/3/2,生物信息学的研究意义,理论意义:认识生物本质的必要途径,认识生物科学的本质问题;,从学科角度:改变传统生物学的研究方式;,医学角度:了解基因与疾病的关系,了解疾病产生机理。,2018/3/2,1960s已有建立数据库、序列分析、开发算法,当时叫分子进化如果考虑生物数学,19世纪已经流行首次提出Bioinformatics的说法荷兰理论生物学家1980年代初Ben Hesper和Paulien Hogeweg马来西亚生化物理学家林华安(Hwa A. Lim)于1987年最早提到该词的文献(PubMed)(1990)Genomics,6(2):389,生物信息学的发展历史,2018/3/2,生物信息学发展阶段(1),前基因组时代(pre-genomics era)建立生物数据库(1965, Margaret Dayhoff的Atlas of Protein Sequences; 1982,GenBank Release 3)对位算法(1970,Needleman-Wunsch; 1981,Smith-Waterman)1977,DNA测序和相应的软件分析(RA Staden),2018/3/2,发展阶段(2),基因组时代(genomics era)一批基因组被测序,1982 噬菌体λ,1995 细菌,1996 酵母,1998 线虫,1999 果蝇,2018/3/2,发展阶段(3),基因组时代(genomics era)数据库搜索算法(1983, Wilbur-Lipman)快速序列相似性查找(1985, FASTN; 1990, BLAST)机构建立1988, NCBI1988, EMBnet1993, Sanger1991,EST技术,2018/3/2,发展阶段(4),后基因组时代(post-genomics era)HGP (1990-2003)1995,蛋白质组学(Proteomics)高通量(high-throughput)实验手段,2018/3/2,发展阶段(5),后基因组时代(post-genomics era)比较基因组学(comparative genomics)结构基因组学(Strutural genomics, 2001)功能基因组学(Functional genomics)系统生物学系统树重建(phylogenic reconstruction),2018/3/2,生物信息学基本方法(1),建立生物数据库如GenBank, EMBL, DDBJ搜索数据库如BLAST序列分析如比对(alignment)、注释(annotation)、寻找外显子统计分析如隐马尔科夫模型(HMM)、贝叶斯分析(Bayesian analysis),2018/3/2,基本方法(2),算法如遗传算法(genetic algorithm, GA)、人工神经网络(artificial neural network, ANN)数学模型如确定性模型(deterministic model)、随机性模型(stochastic model)多学科方法,2018/3/2,应用,基因组层次分析如序列功能、蛋白质、进化研究基因芯片如DNA芯片(DNA chip),蛋白质芯片的动态数据分析药物开发如寻找药靶、药物分子结构、系统药物开发经济价值“bioventure” – 生物风险公司药物、生物制品、相关试剂、器材,2018/3/2,发展现状——学术,2018/3/2,我国的发展现状(1) – 总括,国家高技术研究发展计划(863)生物信息的获取、加工和利用,建立数据库结构基因组和蛋白质组学研究高通量药物筛选、药物设计生物芯片曙光系列生物信息学服务器基因组完成1%人类基因组计划(中国卷;3号染色体短臂“端粒至D3S3610”)(1994-2001.8)2001.10独立完成水稻基因组“工作框架图”绘制和数据库建设;完成国际水稻基因组计划的20%其他: 家猪、血吸虫、家鸡、家蚕、大豆,2018/3/2,我国的发展现状(2),生物信息学企业如华大、中科院等建立了一些中国生物信息学大会首届,2001.4.11-13,北京,军事医学科学院第二届, 2002.6.28,北京大学第三届, 2008.10.6-9,武汉华中科技大学国际生物信息学大会首届,2003第四届,2006.6.10,中南大学,2018/3/2,我国的发展现状(3) – 主要研究中心,北京华大基因研究中心(中科院基因组研究所) 杨焕明 http://www.genomics.org.cn/国家人类基因组南方研究中心(上海) 陈竺、赵国屏 http://www.chgc.sh.cn/国家人类基因组北方研究中心(北京) 强伯勤 http://www.chgb.org.cn/清华大学生物系生物信息研究室 孙之荣 http://www.bioinfo.tsinghua.edu.cn/北京大学生物信息学中心 罗静初 http://www.cbi.pku.edu.cn/chinese/复旦大学理论生物中心 钟扬 http://tlife.fudan.edu.cn/,2018/3/2,我国的发展现状(4) – 研究中心,中科院国家基因研究中心 http://www.ncgr.ac.cn/ 中科院理论物理所统计物理和理论生命科学 陈晓松、郝柏林 http://www.itp.ac.cn/JiGouSheZhi/YJTD-6.php中科院生物物理所系统生物学研究中心 陈润生、蒋太交 http://www.ibp.ac.cn/c/02/01/05/index.html中科院上海生命科学研究院生物信息中心 李亦学 http://www.biosino.org.cn/中科院上海生化所 http://dna.sibc.ac.cn/bio 中科院计算所生物信息实验室 http://www.bioinfo.org.cn/ 中科院遗传所分子系统生物学中心 韩敬东 http://www.genetics.ac.cn/IGDB/Research/shengwuxinxi/index.htm军事医学科学院生物工程所生物信息学中心 http://bioinf.bmi.ac.cn/ 中科院微生物所 http://www.im.ac.cn,2018/3/2,我国的发展现状(5) – 研究中心,天津大学生物信息中心 张春霆 http://tubic.tju.edu.cn/中山大学生物信息中心 徐安龙 http://genome.zsu.edu.cn 中山医科大学 http://www.gzsums.edu.cn 东南大学(江苏省生物信息学专业委员会) 孙啸 http://www.lmbe.seu.edu.cn/jslmbe/西北大学西安交通大学上海交通大学上海系统生物医学研究中心 陈竺哈尔滨医科大学生物信息学系 李霞http://www.biocc.net/index_main.htm,2018/3/2,我国的发展现状(5) – 研究中心,天津大学生物信息中心 张春霆 http://tubic.tju.edu.cn/中山大学生物信息中心 徐安龙 http://genome.zsu.edu.cn 中山医科大学 http://www.gzsums.edu.cn 东南大学(江苏省生物信息学专业委员会) 孙啸 http://www.lmbe.seu.edu.cn/jslmbe/西北大学西安交通大学上海交通大学上海系统生物医学研究中心 陈竺哈尔滨医科大学生物信息学系 李霞http://www.biocc.net/index_main.htm,2018/3/2,人类基因组计划(1) – 人类三大计划,曼哈顿原子弹计划(1942-46),阿波罗登月计划(1961-69),人类基因组计划(1990-2003),2018/3/2,人类基因组计划(2),http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml人类基因组计划(Human Genome Project, HGP)由美国能源部(Department of Energy, DOE)和美国国立卫生研究院(National Institutes of Health, NIH)组织完成1990年10月开始,2003年4月完成(1953双螺旋)参与国:美、英、日、法、德、中,2018/3/2,人类基因组计划(3) – 任务,遗传图谱物理图谱 序列图谱转录图谱,建立四张图谱,2018/3/2,,,,,2018/3/2,遗传图谱(genetic map): 又称连锁图谱(linkage map),是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。,遗传图谱,2018/3/2,物理图谱,物理图谱(physical map):是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。有两种方法用于确定各遗传标志之间的物理距离,一种是以定位的DNA序列即序列标记位点(Sequencing Tagged Site,STS)作为路标,以DNA实际长度为图距的基因组图谱,另一种是由酵母人工染色体(YAC)和/或细菌人工染色体(BAC)连续克隆重叠群组成的物理图谱。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。,2018/3/2,序列图谱,序列图谱:即分子水平的物理图谱。 DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。,2018/3/2,大规模基因组测序,Megabace 测序仪,3700 测序仪,2018/3/2,运用计算机软件进行序列拼接,2018/3/2,转录图谱,转录图谱(Transcriptional Map),又称表达图谱(Expression Map),是以部分5`端和3`端cDNA顺序即表达序列标志(Expressed Sequence Tags,EST)为位标,根据转录顺序的位置和距离绘制的图谱。是有关基因序列、位置及表达模式等信息的图谱。,2018/3/2,通过定位克隆技术寻找疾病基因的过程,2018/3/2,人类基因组计划在医学方面的研究,对致病基因的克隆。致病相关基因的抑制或调控,即可达到治疗某一疾病的效果。如果掌握了与某种疾病相关的基因及突变,则可以对该疾病进行预测、诊断,甚至治疗。,2018/3/2,基因变异与疾病,2018/3/2,基因组多态性,2018/3/2,人类基因组计划(4) – 超额完成目标,2018/3/2,目前生物信息学具体研究内容,1、生物分子数据的收集与管理2、数据库搜索及序列比较 3、基因组序列分析 4、基因表达数据的分析与处理 5、蛋白质结构预测6、研究药物作用机制和开发新药,2018/3/2,基因组数据库,蛋白质序列数据库,蛋白质结构数据库,,DDBJ,,EMBL,GenBank,SWISS-PROT,PDB,,PIR,1、 生物分子数据的收集与管理,2018/3/2,2、数据库搜索及序列比较,搜索同源序列,通过序列比较寻找相似序列。 序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述。多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。,2018/3/2,3、基因组序列分析,遗传语言分析——天书 基因组结构分析基因识别基因功能注释基因调控信息分析基因组比较,2018/3/2,4、基因表达数据的分析与处理,基因表达数据分析是目前生物信息学研究的热点和重点。研究方法:基因芯片,蛋白质谱技术和蛋白质组研究。 目前对基因表达数据的处理主要是进行聚类分析,将表达模式相似的基因聚为一类,在此基础上寻找相关基因,分析基因的功能。,2018/3/2,基因芯片,2018/3/2,2018/3/2,5、蛋白质结构预测,蛋白质的生物功能由蛋白质的结构所决定,蛋白质结构预测成为了解蛋白质功能的重要途径。蛋白质结构预测分为:二级结构预测:模式识别问题。 空间结构预测:同源模型法。,2018/3/2,生物信息学最新研究热点内容,1.大规模基因组测序中的信息分析2.新基因和新SNP的发现与鉴定3.非编码区信息结构分析4.遗传密码的起源和生物进化5.完整基因组的比较研究6.大规模基因功能表达谱的分析7.生物大分子的结构模拟与药物设计8.生物信息学分析方法的研究9.建立国家生物医学数据库与服务系统10.应用与发展研究,2018/3/2,基因组数据库的介绍(1),HapMap (http://hapmap.ncbi.nlm.nih.gov/),2018/3/2,基因组数据库的介绍(2),TCGA (https://tcga-data.nci.nih.gov/tcga/),2018/3/2,基因组数据库的介绍(3),GeneCard (http://www.genecards.org/),2018/3/2,基因组数据库的介绍(4),UCSC (http://genome.ucsc.edu/),2018/3/2,2018/3/2,2018/3/2,实例——基因图谱,2018/3/2,2018/3/2,生物信息学的挑战,数据规模超大,如单个样本位点数据高达180多万,数据结构复杂,如基因变异形式的多样性、复杂性,群体的异质性,不同人群基因结构有较大差异,
展开阅读全文
  微传网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:(第一堂课)生物信息学.ppt
链接地址:https://www.weizhuannet.com/p-2527.html
微传网是一个办公文档、学习资料下载的在线文档分享平台!

网站资源均来自网络,如有侵权,请联系客服删除!

 网站客服QQ:80879498  会员QQ群:727456886

copyright@ 2018-2028 微传网络工作室版权所有

     经营许可证编号:冀ICP备18006529号-1 ,公安局备案号:13028102000124

收起
展开