tceic.com
简单学习网 让学习变简单
当前位置:首页 >> 政史地 >>

生物信息学课后题及答案


生物信息学课后习题及答案
(由 10 级生技一、二班课代表整理)

一、绪论
1.你认为,什么是生物信息学? 采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋 白质等)的收集、加工、储存、分析、解释的一门学科。 2.你认为生物信息学有什么用?对你的生活、研究有影响吗? (1)主要用于: 在基因组分析方面:生物序列

相似性比较及其数据库搜索、基因预测、基因组进化和分 子进化、蛋白质结构预测等 在医药方面:新药物设计、基因芯片疾病快速诊断、流行病学研究:SARS、人类基因 组计划、基因组计划:基因芯片。 (2)指导研究和实验方案,减少操作性实验的量;验证实验结果;为实验结果提供更多的 支持数据等材料。 3.人类基因组计划与生物信息学有什么关系? 人类基因组计划的实施, 促进了测序技术的迅猛发展, 从而使实验数据和可利用信息急剧 增加,信息的管理和分析成为基因组计划的一项重要的工作 。而这些数据信息的管理、分 析、解释和使用促使了生物信息学的产生和迅速发展。 4 简述人类基因组研究计划的历程。 通过国际合作,用 15 年时间(1990-2005)至少投入 30 亿美元,构建详细的人类基因 组遗传图和物理图,确定人类 DNA 的全部核苷酸序列,定位约 10 万基因,并对其他生 物进行类似研究。 1990,人类基因组计划正式启动。 1996,完成人类基因组计划的遗传作图,启动模式生物基因组计划。 1998 完成人类基因组计划的物理作图,开始人类基因组的大规模测序。Celera 公司加 入,与公共领域竞争启动水稻基因组计划。 1999,第五届国际公共领域人类基因组测序会议,加快测序速度。 2000, Celera 公司宣布完成果蝇基因组测序, 国际公共领域宣布完成第一个植物基因组 ——拟南芥全基因组的测序工作。 2001,人类基因组“中国卷”的绘制工作宣告完成。 2003,中、美、日、德、法、英等 6 国科学家宣布人类基因组序列图绘制成功,人类基 因组计划的.目标全部实现。 2004,人类基因组完成图公布。 2.我国自主知识产权的主要基因组测序计划有哪些? 水稻(2002) ,家鸡(2004) ,家蚕(2007) ,家猪(2012) ,大熊猫(2010)

二.第一章

1、生物信息指哪些? 主要有从DNA序列、蛋白质序列、蛋白质结构和功能研究中解读的:遗传信息、进化信息、 结构和功能信息。 2、基因组测序的基本策略有哪些? 逐个克隆法:小片段针对图谱的! ! 全基因组鸟枪法:大片段-测序-组装 3.什么叫 contig? Contig:重叠群,基因组测序中将许多序列片段经过比对找到重叠区,从而连接成的长 片段。 4、生物信息学中最重要的贡献是什么? 1970: Needleman 和 Wunsch 提出了著名的序列比对算法,是生物信息学发展中最重要的 贡献; 5、什么事件大大促进了生物信息学的发展? 20 世纪 90 年代后 HGP 促进生物信息学的迅速发展 6、生物信息学研究有什么意义? (1)认识生物本质,了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之 间的关系 (2)改变生物学的研究方式 (3)改变传统研究方式,引进现代信息学方法 (4)在医学上的重要意义 为疾病的诊断和治疗提供依据 为设计新药提供依据 三.第二章 1、简述三干六界学说。

2.TSS,外显子和内含子的概念。 TSS是转录起始位点(Transcription Start Site)的英文缩写,是指DNA上一段与RNA 聚合酶结合并起始转录的一段DNA序列。真核生物结构基因,由若干个编码区和非编码 区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成 的完整蛋白质,这些基因称为断裂基因。其中的编码区即为外显子,非编码区即为内含 子。 3. 如何判断起始密码子?内含子? AUG甲硫氨酸(met) 内含子(5’-GT??AG-3’ ) 4.蛋白质二级结构有哪些? (1)螺旋 (2)b折叠 – 平行折叠 反平行折叠 (3)b转角 – 连接作用”U”型结构(大多Phe, Gly组成) (4)无规卷曲-没有确定规律性的肽链构象,但仍是紧密有序的稳定结构 (5)无序结构 多肽链中有60%的区段为a螺旋和b折叠

5、HGP 选择作为研究人类的四大“模式生物“有哪些? 酵母、线虫、果蝇、小鼠。 6、背诵生物信息数据库中的核苷酸代码?

核苷酸 A(腺嘌呤) C(胞嘧啶) G(鸟嘌呤) T(胸腺嘧啶) 非A 非C 非G 非T

代码 A C G T B D H V

核苷酸 U(尿嘧啶) C或T(U) G或T(U) A或T(U) A或G A或C G或C A或C或G或T(U)

代码 U Y K W R M S N

四.第三章(1)
1、下列数据库分别是什么类型的数据库? 序列数据库中的核酸数据库(GenBank PIR DDBJ 结构数据库(PDB)

SWISS-PROT EMBL)

2、如何查找由 Rao Y 实验室于 2005 以后发表的,文章主题中与 brain 有关的文献,写出 检索语言。 Brain[ti] AND RaoY[au] AND 2005:2013[dp] 3、如:我要查找 RaoY 在 Nature 或 Science 上发表的论文,哪一个检索语言是正确的? 正确①Rao Y[au] AND (Nature[Journal] OR Science[Journal]) ②Rao Y[au] AND Nature OR Science[Journal] ③Rao Y[au] AND Nature[Journal] OR Science[Journal] ④Rao Y[au] AND (Nature OR Science)[Journal]

五.第三章(2)
1、简述 GenBank 数据库中 GBFF 格式的结构? GenBank flatfile(GBFF)是 GenBank 数据库的基本信息单位,也是最广泛地用以 表示生物序列的格式之一。GBFF 可以分成三个部分,头部包含关于整个记录的信息(描 述符) ;第二部分包含了注释这一记录的特性;第三部分是核苷酸序列自身。所有的核 苷酸数据库记录(DDBJ/ EMBL/ GenBank)都在最后一行以 // 结尾. 2、GBFF 格式的特性表格式包括哪三个部分? 特性表格式包含三个部分: 第一,特性关键词(Feature key); 第二,特性位置(Location); 第三,限定词(Qualifiers) 3、指出下列特殊标识符的格式? ①序列辨认号(GI) :一串阿拉伯数字 ②GenBank/EMBL/DDBJ 序列接受号: 1 个字母+5 个阿拉伯数字;1 个字母+6 个阿拉伯数字 ③RefSeq 序列接受号:带“-” mRNA 记录(NM*) ;完整的基因组或染色体(NC*) ④PDB 序列接受号:1 个阿拉伯数字+3 个字母 4、指出下列 GBFF 格式中特性表含义? (23.45)..600 指明序列特征起始碱基在 23 和 45 碱基之间,终止于 600 号碱基 145^177 指明 145 和 177 碱基之间的某个位点 Complement(join(2691..4571,4918..5163)) 纪录中的特性处于 2691 至 4571 碱基以及 4918 至 5163 碱基之间的序列相连构成的连续序列的互补链上

六.第四章
1、这两个序列的 cost 和 score 分别是多少? (A)cost 2 score 9 (B)cost 4 score 6

2、在序列比对运算时最终结果是上面哪种运算方式?(A)

3、给定一个 DNA 打分矩阵,假设空位罚分为 2,按照以下的打分矩阵,对于下列对齐方案 的 计 分 值 为 多 少 ?

A A T C G 1 -1 -1 -1

T -1 1 -1 -1

C -1 -1 1 -1

G -1 -1 -1 1

G T
0

C G A G ** **
0

A A **

C G

T C A C *** **

G G

4、判断题: (1)A 序列和 B 序列的相似性是 80% 对 (2)A 序列和 B 序列的一致性为 39.4% 对 (3)A 序列和 B 序列的同源性是 80% 错 (4)两序列间的相似性越高。它们的同源性就越高 错 5、名词解释: (1)同源性:两个基因或蛋白质序列具有共同祖先的结论; (2)直系同源: (Orthologous ) :指不同物种中具有相同功能和共同起源的基因 (3)旁系同源(Paralogous ) :指在同一物种内具有不同功能,但也有共同起源的基因。

(4)

空位罚分:在一条序列的残基间引入一个空位使得这条序列与第二条序列的相 似残基对齐,引入空位的一个数值罚分(分值)称为空位罚分。每个记分矩阵 都有默认的空位罚分值 (5) 空位开放罚分:(Gap opening penalty)对起始缺失进行罚分 (6) 空位延长罚分:(Gap extension penalty) :当加入一个空位至已存在的空位 时的罚分,使得大于一个残基不能对齐或者和空位对齐。 (7)PAM:代表可接受点突变,每一百个氨基酸中可接受的点突变。 ⑻PAM1(1 个 PAM 单位)被定义为每 100 个残基出现 1 个被接受的点突变(氨基酸的置换 不引起蛋白质功能上的显著变化) (9)PAM250 矩阵:这个矩阵是指平均 100 个残基上固定会发生 250 次突变。也就是很多残 基都发生过一次以上的突变。这种变化数量接近于检测遥远关系的极限。 (10)BLOSUM 矩阵:BLOSUM 矩阵:块替换矩阵,一种氨基酸替换矩阵,以序列片段为基础, 它是基于蛋白质模块(Block)数据库而建立起来的,BLOSUM 矩阵后面的数字表示构建此矩阵 所用的序列的相似程度,如 BLOSUM62 表示由相似度为 62%的序列构建。 6、简述 PAM 矩阵与 BLUSUM 矩阵的关系 (1)两者都在打分系统中使用对数比值; (2) PAM矩阵是基于近相关蛋白家族数据的, 并且假设高度相关蛋白的取代概率可以外推到 远相关蛋白的概率。BLOSUM矩阵是基于实际观测到的远相关蛋白比对。 (3) 高值BLOSUM矩阵和低值PAM矩阵最适合于研究高度保守的蛋白; 低值BLOSUM矩阵和高值 PAM矩阵最适合检测远相关蛋白。 (4)一般来说,在局部相似性搜索上, BLOSUM 矩阵较PAM要好。对于数据库搜索来说一般 选择BLOSUM62矩阵。PAM矩阵可用于寻找蛋白质的进化起源,BLOSUM矩阵用于发现蛋白质的 保守域。 7.如何选择合适的评分矩阵? 一般来说,在局部相似性搜索上, BLOSUM 矩阵较PAM要好 当比较距离相近的蛋白时,应选择低的PAM或高的BLOSUM矩阵;当比较距离较远的蛋白时, 应选择高的PAM或低的BLOSUM矩阵 对于数据库搜索来说一般选择BLOSUM62矩阵 PAM矩阵可用于寻找蛋白质的进化起源,BLOSUM矩阵用于发现蛋白质的保守域

8.掌握下列概念(英文对照) :相似性、一致性、同源性、直系同源、旁系同源、空位罚分、 空位开放罚分、空位延长罚分、PAM、PAM1、PAM250、 9.打分矩阵有哪些? (1)核酸打分矩阵: 等价矩阵、BLAST矩阵、转换-颠换矩阵 (2)蛋白质打分矩阵: 等价矩阵、氨基酸突变代价矩阵(遗传密码矩阵GCM) 、疏水矩阵、PAM矩阵、BLOSUM矩阵。

1、 序列比对分类有哪些? A、双序列比对:两条序列的比对 B、多序列比对:三条或以上序列的比对 2、简述序列比对两种类型。 (1)全局序列比:在全局范围内对两条序列进行比对打分的方法,适合于非常相似且长度 近似相等的序列 (2)局部序列比对:一种寻找匹配子序列的序列比对方法,适合于一些片段相似而另一些 片段相异的序列 3、双序列比对方法有哪些? ① 点阵序列比较(Dot Matrix Sequence Comparison) ② 动态规划算法(Dynamic Programming Algorithm) ③ 词或 K 串方法(Word or K-tuple Methods) ④ 贝叶斯统计方法(Bayesian Statistical Methods) 4、Basic BLAST 有哪些?它们的查询序列类型和数据库类型是怎样的?

5、什么是动态规划算法? 动态规划算法(Dynamic Programming Algorithm)是一种计算方法,它的主要思路是把一个 问题分成若干个小问题来解决, 在序列比对尤其是双序列比对中非常重要, 因为其提供了序 列间最优的对位排列。在生物学中应用的两种动态规划算法:Needleman-Wunsch 算法(全 局比对)和 Smith-Waterman 算法(局部比对) 。 6、如何处理 BLAST 后过少或过多的结果? 如何处理过多的结果:限定数据库:Refseq;限定生物体;利用序列的特定部分搜索;调整 打分矩阵;调整 E 值。处理过少的结果:去掉数据库限定,进行多个数据库搜索;提高 E

值;尝试更高的 PAM 矩阵和更低的 BLOSUM 矩阵;去掉物种限制;进行高级比对搜索。 7、如何进行 BLAST 结果显著性判断? 结果显著性判断:查看 E 值列表;查看比对情况。 (1.E 值是不是显著;2.两个蛋白质是不 是具有近似的大小; 3.两个蛋白质是否有共同的模体或信号序列; 4.两个蛋白质是不是一个 合理的多序列比对的一部分; 5.两个蛋白质是否有一个相似的生物学功能; 6.两个蛋白质是 否具有相似的 3 维结构。 7.如果一个 BLAST 搜索得到一个对另一个蛋白质的边缘匹配, 以这 个具有较远亲缘关系的蛋白质作为查询项再进行一次新的 BLAST 搜索。 ) 8、BLAST 应用有哪些? BLAST 应用:1.是序列分析的基础;2.评价实验结果;3.为实验提供新思路,并指导进一步 实验设计;4 是寻找和鉴定新基因的重要手段;5.是蛋白质结构预测和分子设计的基础;6. 是研究生物进化和种属分类的基本方法。

第五章
1.什么是系统发生、系统发生学、系统发生树? 答:系统发育(种系发生、系统发生):指生物形成或进化的历史; 系统发育学:研究物种之间的进化关系,基本思想是比较物种的特征,并认为特征相似的物 种在遗传学上接近。研究结果往往以系统发生树(系统发育树)表示,用它描述物种 之间的进化关系。 通过对生物学数据的建模提取特征,进而比较这些特征,研究生物形成或进化的历史。在分 子水平上进行系统发生分析具有许多优势,所得到的结果更加科学、可靠。系统发生树是一 种表现形式,是对一组实际对象(如基因,物种等)的世系关系的描述,是表明被认为具有 共同祖先的各物种相互间进化关系的树形图。 。统发生树系的性质:如果是一棵有根树,则 树根代表在进化历史上是最早的、 并且与其它所有分类单元都有联系的分类单元; 如果找不 到可以作为树根的单元, 则系统发生树是无根树; 从根节点出发到任何一个节点的路径指明 进化时间或者进化距离。 2.下列哪些位点是信息位点?(2和5)

位点
位点
1序列 1

简约信息位点:位点上至少有两种不同的核苷酸或氨基酸,且每种至少出现两次。

1 C

2 A

3 G G G G

4 G A C T

5 T C T C

6 A A A G

序列 1 C 位点 1 A 序列 2 序列 1C G 序列 3
序列 4 T G

3.系统发生树的构建方法有哪些? 答:系统发生树的构建方法分为两大类: 基于距离的构建方法: 非加权组平均法(UPGMA) 邻近归并法(NJ,邻接法) Fitch-Margoliash法(FM) 最小进化方法(ME) 基于离散特征的构建方法: 最大简约法 (MP) 最大似然法 (ML) 进化简约法 (EP) 相容性方法 (compatibility) 4.下列系统发生树建立的方法中,基于离散特征分析的是?(C/D) 基于距离的是?(A/B) A. neighbor-joining method B. UPGMA C.Maximum parismony D.Maximum likelihood


推荐相关:

生物信息学复习题及答案(陶士珩)

生物信息学复习题及答案(陶士珩)_工学_高等教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 生物信息学复习题及答案(陶士珩)_工学_高等教育_教育专区。生物...


生物信息学复习题及答案(陶士珩)

生物信息学复习题及答案(陶士珩)_理学_高等教育_教育专区。西农 生物信息 期末考试生物信息学复习题名词解释 1. Homology (同源):来源于共同祖先的序列相似的序列及...


生物信息学课后题及答案

生物信息学课后题及答案_政史地_高中教育_教育专区。生物信息学课后习题及答案(由 10 级生技一、二班课代表整理) 一、绪论 1.你认为,什么是生物信息学? 采用...


生物信息学复习题及答案(陶士珩)

生物信息学复习题 一、 名词解释 生物信息学, 二级数据库, FASTA 序列格式, genbank 序列格式, Entrez,BLAST, 查询序列(query) ,打分矩阵(scoring matrix) ,...


生物信息学复习题及答案 西农

生物信息学复习题及答案 西农_理学_高等教育_教育专区。西农 生物信息 期末考试 复习题 答案 生物信息学复习题及答案(陶士珩)名词解释 1. Homology (同源):来源...


生物信息学_复习题及答案(打印)

生物信息学_复习题及答案(打印)_农学_高等教育_教育专区。一、名词解释: 1.生物信息学: 研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,...


生物信息学_复习题及答案(打印)

生物信息学_复习题及答案(打印)_基础医学_医药卫生_专业资料。一、名词解释: 1.生物信息学: 研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介...


共享——农业大学生物信息学课后练习题及答案

共享——农业大学生物信息学课后练习题及答案_农学_高等教育_教育专区。农大考前复习 2014 级山东农业大学大二下学期期末生物信息学课后练 习题及答案第一章 绪论 ...


河大生科院生物信息学考试复习题答案完整版

河大生科院生物信息学考试复习题答案完整版_理学_高等教育_教育专区。生物信息学考试题目名词解释 1) 生物信息学: 生物信息学(Bioinformatics)是研究生物信息的采集,...


生物信息学及应用复习题

生物信息学及应用复习题_教育学_高等教育_教育专区。《生物信息学及应用》课程复习题 1、生物信息学的基本定义,阐述它主要研究目标、研究内容及研究方法。生物信息...

网站首页 | 网站地图
All rights reserved Powered by 简单学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com