2-11系统发育树的构建
系统进化树简介系统发育进化树/系统树(Phylogenetic tree):描述各种生物类群之间亲缘关系的一种类似树状分支的图形。系统进化树主要构成结点(node):每个结点表示一个分类单元OTU(属、种群)(基因家族)。进化分枝(Clade):两种以上生物(DNA序列)及其祖先组成的树枝。根:所有分类的共同祖先。进化分支长度:用数值表示的进化枝的变化程度(遗传距离)
外类群:一个同源物种与其它分析序列相关且具有适当(较远)的亲缘关系自展支持率:进化树评估的方法,描述了进化树进化分支的支持比例(稳健性)。进化树评估:自展分析法(BOOTstrap)一般Bootstrap的值>70,则认为构建的进化树较为可靠。如果Bootstrap的值太低,则有可能进化树的拓扑结构有错误,进化树是不可靠的。
系统树的类型有根树、无根树有根树:有一个叫根的特殊节点,用来表示共同的祖先,由该点通过唯一路径产生其他节点,反映了树上物种或基因的时间顺序。无根树:只是指明了种属的相互关系,没有确认共同祖先或进化途径。即反映分类单元之间的距离而不涉及谁是谁的祖先问题。
系统发育树的构建流程找到建树目的基因(基 ...
2-10生物建模和仿真的基础知识
建模和仿真在系统生物学中的地位系统生物学定义(胡德)系统(基因、mRNA、蛋白质等)构成和相互关系→建立数学模型→定量描述和预测生物功能、表型和行为理想:得到一个尽可能接近真正生物系统的理论模型
什么是生物数学建模和仿真
数学模型及建模的概念数学模型:用数学语言描述系统或现象的抽象模型数学模型与系统一一对应
数学建模的一般方法
机理分析法
测试分析法
二者结合
数学建模一般过程表述 根据建模目的和信息将实际问题“翻译”成数学(方程)求解 选择适当的数学方法求得数学模型的解答(参数)解释 将数学语言表述的解答“翻译”回实际对象验证 用现实对象的信息检验得到的解答
系统仿真系统仿真 System Simulation广义上讲,在建立系统的模型上进行实验或定量分析,以获得正确决策所需的各种信息。这一过程就称为系统仿真。
2-7相互作用组学
相互作用组学相互作用组学系统地研究各种分子相互作用,包括蛋白质-蛋白质、蛋白质-核酸、蛋白质-代谢物等的相互作用和这些作用形成的分子机制、途径和网络
生物网络基础生物网络定义网络(图形)定义:通常可以用图形G=(V, E)表示网络V 是网络的节点集合,每个节点代表一个生物分子,或者一个环境刺激;E 是边的集合,每条边代表节点之间的相互关系G-garaphics V-vertex E-edge
有向网络和无向网络边是否有方向性或者连接一条边的两个节点是否存在顺序(控制关系),分有向和无向网络。
加权网络和无权网络边在网络中具有不同意义或在某个属性上有不同的价值是网络中普遍存在的一种现象。如果网络中的每条边(关系)都赋予相应的数字,这个网络就称为加权网络,赋予的数字称为边的权重。如果网络中各边之间没有区别,可以认为各边的权重相等,称为等权网络或无权网络
权重不等-加权网络;权重相等- 无权网络/等权网络权重可以用来描述节点间的距离、相关程度、稳定程度等等各种信息,具体所代表的意义依赖于网络和边本身所代表的属性或意义。
二分网络如果网络中的节点可分为两个互不相交的集合,而所有的边都建立在来 ...
2-9序列比对和数据库搜索
基因组学CNGB 中国国家基因库生命大数据平台NCBINCBI开发有Genbank(基因序列)等公共数据库,提供Pubmed(生物医学文献检索)、BLAST(序列对比分析工具)、Entrez、OMIM、Taxonomy、Structure等工具,。
GENE检索序列比对BLASTBLAST子程序说明(类型)
程序名
查询序列
数据库类型
方法或用途
Blastp
蛋白质
蛋白质
以蛋白质序列搜索蛋白质序列数据库
Blastn
核酸
核酸
以核酸序列搜索核酸序列数据库
Blastx
核酸
蛋白质
将核酸序列按6条链翻译成蛋白质序列后搜索蛋白质序列数据库
tblastn
蛋白质
核酸
以蛋白质序列搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库
tblastx
核酸
核酸
将核酸序列按6条链翻译成蛋白质序列后搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库
blastn结果分析:Expect(E值)、Identities(一致性)、Gaps(缺失或插入)三项是评价blast结果的标准。E值接近零或者为零时,具体上就是完全匹配了;一致性:匹 ...
6代谢组学
代谢组学概述代谢物:生物大分子不包括在内代谢组Metabolome:指一个细胞、组织或器官中,所有代谢产物的集合,一般指分子量小于1500 D的内源性小分子物质代谢组学(Metabolomics 代谢物组学):研究生物体内源性代谢物质的整体组成及变化规律的科学代谢组学研究目的:定量分析一个生物系统内所有代谢物的含量
代谢组学与其它组学关系
基因组学和转录组学告诉你可能发生什么(天书)
蛋白质组学告诉你如何发生什么(功能-执行)
代谢组学告诉你发生了什么(结果)
代谢组学分类(基于质谱的)代谢组学研究分类:
(1)非靶向代谢组学定义: 又称之为非目标代谢组学或发现代谢组学,无偏向性地对所有小分子代谢物同时进行检测分析的代谢组学。内容:将对照组和实验组的代谢组进行比对,以找出其代谢物的差异。应用:疾病诊断、机理研究等领域,用于标志物发现。(相对定量)
(2)靶向代谢组学定义:目标性代谢组学或定量代谢组学,仅对感兴趣的目标性代谢物进行同时定量分析的代谢组学。应用:目标小分子的定量。(绝对定量)实例
代谢组学基本流程生物样品收集和预处理;数据采集(定性、定量);原始数据、数据分析、生物解释
5糖组学
概述糖组 (Glycome): 是一个生物体或一个细胞中全部碳水化合物的总称,以多糖、寡糖和糖缀合物中的糖链为其主要组成成分。糖组学(Glycomics): 是从分析和破解一个生物或一个细胞全部糖链所含信息的角度入手,研究糖链的分子结构、表达调控、功能多样性、以及与疾病关系的科学。
糖组学研究意义1、所有的生命体都是由细胞组成,细胞表面的聚糖帮助我们识别细胞的类型和状态(疾病)。2、糖基化是所有真核蛋白质翻译后加工的一种形式。有利于对生命活动机制的研究。3、细胞表面的聚糖(糖蛋白、糖脂)与蛋白质间的相互作用能介导细胞间相互反应的基本过程,如细胞增值、吸附、识别和免疫等功能,也可以避免各种微生物对寄主细胞的侵害。
糖组学研究遵循的基本策略(1) 提取单一个体中的全部聚糖,即糖组;(2) 锁定要研究的糖肽,并将糖组中的各种糖肽组分与基因组数据库相联系,最大限度地利用基因组的已有成果。否则,如果将聚糖与糖蛋白脱离系,也就无法获得基因组的信息;(3) 研究包括糖肽注释、分子量和凝集素解离常数在内的特定糖肽的特征性质。
糖组学研究内容(1) 什么基因编码糖蛋白,即基因信息;(2) 即糖基化位点信 ...
4蛋白质组学
蛋白质组学概述概念蛋白质组:一个基因组、一种生物或一种细胞/组织所表达的全套蛋白质蛋白质组学是研究蛋白质组或应用大规模蛋白质分离和识别技术研究蛋白质组的一门学科,是对基因组所表达的整套蛋白质的分析。蛋白质组与基因组区别多样性-同一性;无限性-有限性;动态-静态;空间性-周期性;相互作用-孤立行为;多种技术-单一手段
研究目的和内容研究目的了解某种特定的细胞、组织或器官制造的所有蛋白质种类、丰度、功能;明确各种蛋白质分子是如何形成类似于电路的网络的(相互作用相互关系);描绘蛋白质的精确三维结构,揭示其结构上的关键部位,如与药物结合并且决定其活性的部位。
研究内容蛋白质组研究:蛋白质组表达模式;功能模式
蛋白质组研究技术与路线蛋白质组研究的宗旨--将组织或细胞所有蛋白质(至少是大部分)分离与鉴定• 蛋白质分离技术凝胶双向电泳、HPLC(非凝胶电泳);• 蛋白质鉴定技术Edman测序、生物质谱技术(当前主流);• 图像分析与生物信息技术图像分析软件,数据库;• 相互作用研究技术酵母双杂交技术、免疫共沉淀、蛋白质芯片等。
蛋白质分离技术蛋白质组学研究流程:蛋白质分离、鉴定蛋白质组凝胶电泳分离技 ...
1系统生物学引论
系统生物学引言贝塔朗菲:“系统是相互联系相互作用的诸元素的综合体”。强调元素间的相互作用以及系统对元素的整合作用。分子生物学:仅仅关心个别的基因和蛋白质(研究对象)基因序列-结构-功能系统生物学:着眼于研究生物系统组成之间的相互关系、(细胞信号传导和基因调控)网络和系统功能的涌现相互作用-网络-功能
涌现性,通常是指多个要素组成系统后,出现了系统组成前单个要素所不具有的性质
系统生物学目标:模拟和发现系统产生的涌现性,并最终建立一个模型预测系统行为
系统生物学由来还原论事物整体一定等于部分之和,不多也不少,包括生命体。
还原论生命科学的四大特征简单化(系统组成),如细胞单位线性化(相互关系),如信号通路定性化(系统行为),如免疫力好实验化(研究方法),如蛋白质结构测定
获得了单个分子的详细信息,但在脱离了整个系统的相互作用和联系后难以理解系统的整体行为。
整体论和系统论贝塔朗菲提出整体论的基本原理“整体大于部分之和”人类基因组计划;蛋白质组学系统论是还原论和整体论的辩证统一
经典生命科学与系统生物学之比较经典生命科学 系统生物学
简单化 (系统组成 ...
3转录组学
转录组学概述转录组定义广义上指某一生理条件下,细胞内所有转录产物的集合;狭义上指所有 mRNA 的集合。
转录组学定义转录组学指一门在整体水平上研究细胞中基因转录的情况及转录调控规律的学科。转录组学是从RNA水平研究基因表达的情况。
转录组学技术流程cDNA合成过程cDNA指互补DNA,由RNA经一种称为逆转录酶的DNA聚合酶催化产生的。具体过程包括:首先,以mRNA为模板,在逆转录酶的作用下合成单链cDNA;然后,以单链cDNA为模板,由依赖DNA的DNA多聚酶合成双链cDNA。
转录组学样品合格性判定OD260是核酸吸收峰,OD280是蛋白吸收峰。OD260/280≥1.8,在2.0左右。OD230是污染物,某些有机试剂和多糖的吸收峰,OD260/230≥1.8,说明核酸较纯,若这个值很低,说明有有机试剂或多糖污染。下表中Level A满足芯片实验要求。
qRT-PCRRT-PCRRT: Reverse Transcription ,逆转录源自于病毒,反转录酶,依赖 RNA的DNA 聚合酶
RT-PCR(Reverse Transcription-Polymerase Chain ...
分子生物学5-RNA干扰(siRNA 和 miRNA)
短干扰RNA(Short interfering RNA, siRNA)发现
20 世纪90年代初,Jorgensen 和 Mol 两位科学家想通过添加过量色素基因拷贝来增加植物花的着色,结果事与愿违,不但花未着色,反而部分花变为白色。当时称共抑制。
共表达抑制
正义链(Sense RNA)和反义链(antisense RNA )都能导致内源靶基因表达量降低
正义链+反义链有更强的效果
在线虫和果蝇中该现象被称为RNA干扰。
RNAi的重要特性是以双链RNA行使功能
Fire, Xu, Montgomery, Kostas, Driver, Mello (1998), Nature 391: 806-811
2000年,果蝇细胞提取物的体外RNAi系统,发现不论是否有靶mRNA存在,引入的外源dsRNA的正、反义链都会被切割成21-23nt的小片段,相对应的mRNA也会被降解为长度差为21-23nt的片段,说明这种降解很可能是由21-23nt小片段介导的,并且这种降解需要ATP提供能量。
短干扰RNA(short interfering RNA, siRNA)
19-nt ...



