- 学习目标
- 理解同源(包括直系和旁系同源)的含义;
- 阐释如PAM(可被接受的点突变)矩阵的生成方法;
- 比较PAM和BLOSUM打分矩阵的用途;
- 理解动态规划定义,并解释全局和局部序列比对算法是如何工作的;
- 在NCBI网页上进行蛋白质或DNA的双序列比对
- 3.1 引言
- 当完成对多个物种的基因组测序后,一个重要的工作室找到特定物种内和物种之间的蛋白质在进化上的相关性。
- 序列水平的相关表明两个蛋白质同源
- 具有相似或者相同的功能
- 蛋白质比对:通常比DNA比对包含更丰富的信息
- DNA序列的变化并不改变所编码的氨基酸
- 氨基酸之间具有类似的生物物理性质。
- 比对蛋白质可以发现同源序列,比对DNA无法做到
- 某些情况下比对核苷酸序列更合适
- 确定DNA序列与数据库序列的一致性
- 搜索多态性
- 分析克隆的cDNA片段的一致性
- 比较调控区域
- 基本定义:同源性、相似性、一致性
- 同源性:
- 具有共同进化祖先的两条序列称为同源序列
- 同源性无程度之分:只有同源和非同源
- 同源蛋白质
- 三维结构上有相似性
- 可能是直系同源或旁系同源
- 直系同源序列:在物种分化过程中,相同的祖先序列被保留到各个分化物种中的序列。
- 旁系同源序列:通过类似基因复制这样的机制产生的同源序列。
- 直系同源序列和旁系同源序列并不一定具有相同的功能
- 同源序列
- 在氨基酸或核苷酸序列有显著相似性
- 相似性与一致性:为数量推断,用于描述序列的相关性。
- 一致性:用以表示两条氨基酸序列发生变化的程度
- 通过NCBI BLASTP或者BLASTN进行双序列比对来评估蛋白质的相关性
- 双序列比对目的:
- 衡量两个分子的相似性程度和同源的可能性。
- 如果两条序列一致性足够大,那么这两条序列可能是同源的。
- 双序列比对步骤:
- 1.选择BLASTP来比对两个蛋白质勾选“Align tow or more sequences”
- 2. 输入序列或者它们的索引编号。
- 3. 根据需要设置可选参数
- 选择PAM或BLOSUM的打分矩阵
- 改变空位起始罚分和空位延伸罚分
- BLASTN搜索,可以改变奖分和罚分标准
- 改变其他参数,如序列字符数、期望值、过滤参数和释放参数
- 4. 点击“Align”,输出比对结果
- 双序列比对结果:
- 两条序列分别位于“query”和“subject”
- 中间一行会显示在比对中出现的相同的氨基酸
- Identities为一致性,Positives为相似性
- 保守性替换用“+”号显示
- 双序列比对特点:
- 可以进行局部双序列比对
- 相似的残基对可能具有相近的结构或功能
- 基本氨基酸
- 酸性氨基酸
- 羟基化氨基酸
- 疏水性氨基酸
- 相似百分比:
- 相同或相似残基所占的百分比之和
- 一般地,考虑两条蛋白质序列之间的一致性比相似性更有用,因为相似性的计算取决于不同氨基酸残基之间相似程度的定义方式
- 空位
- 常见的突变包括替换(substitutions)、插入(insertions)和缺失(deletions),其中,插入和缺失在序列比对中均被认为是空位。
- 空位可以出现在蛋白质的两端或中间
- 添加空位可以使得比对后的两条序列全长一致
- 双序列比对,同源性和生命进化
- 使用双序列比对对蛋白质(或DNA)序列的同源研究涉及到对蛋白质(或基因)的进化历史的探究。