首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
多序列比对是生物信息学的一个重要研究内容,比对结果强烈依赖目标函数的参数设置,包括空位罚分以及替换矩阵。基于比对和(SP)目标函数,提出确定各参数最优值的理论依据,给出替换矩阵判断公式和最佳空位罚分取值公式,结合待测序列信息得出与之相符的一组最优参数,从而得到更好的比对结果。通过与精度较高的多序列比对工具MAFFT默认参数的比较,结合BAli BASE2.0数据库进行实例验证,实验结果表明,根据本综述公式得出的参数可以得到比默认参数更优的比对结果。本综述公式优化了多序列比对结果,具有可行性和高效性。  相似文献   

2.
首先介绍序列比对的分子生物学基础,即核酸序列基本单元核苷酸和蛋白质序列基本单元氨基酸。文中以精心设计的图表列出四种核苷酸和二十种氨基酸的名称、性质和分类。第2节简述序列比对基础,包括相似性和同源性基本概念、整体比对和局部比对、点阵图方法、动态规划和启发式算法、计分矩阵和空位罚分,以及常用软件和分析平台。第3节介绍核酸序列比对中常用计分矩阵DNAfull,蛋白质序列比对中常用计分矩阵BLOSUM62和PAM250。第4-8节则以血红蛋白、多肽毒素、植物转录因子、癌胚抗原和唾液酸酶为例,介绍双序列比对的具体应用。通过这些实例,说明如何选择分析平台和比对程序、如何设置计分矩阵和空位罚分,如何分析比对结果及其生物学意义。文末进行简要总结。  相似文献   

3.
基本局部比对搜索工具(basic local alignment search tool,BLAST)是核酸或蛋白质序列相似性分析最常用的工具之一.因为程序涉及参数较多,一些学生和研究者有时不根据实际情况也不阅读说明书就直接选择默认参数,可能会得出错误结论.BLAST可以进行核酸、蛋白质序列及其相互间的比对,一些低年级...  相似文献   

4.
构建基于折叠核心的全α类蛋白取代矩阵   总被引:1,自引:0,他引:1  
氨基酸残基取代矩阵是影响多序列比对效果的重要因素,现有的取代矩阵对低相似序列的比对性能较低.在已有的 BLOSUM 取代矩阵算法基础上,定义了基于蛋白质折叠核心结构的序列 结构数据块;提出一种新的基于全α类蛋白质折叠核心结构的氨基酸残基取代矩阵——TOPSSUM25,用于提高低相似度序列的比对效果.将矩阵TOPSSUM25导入多序列比对程序,对相似性小于25%的一组四螺旋束序列 结构数据块的测试结果表明,基于 TOPSSUM25的多序列比对效果明显优于BLOSUM30矩阵;基于一个BAliBASE子集的比对检验也进一步表明, TOPSSUM25在全α类蛋白质的两两序列比对上优于BLOSUM30矩阵.研究结果可为进一步的阐明低同源蛋白质序列 结构 功能关系提供帮助.  相似文献   

5.
多序列比对程序的开发在生物信息学中是一个很活跃的研究领域.作为一种新诞生的多序列比对程序,BlastAlign利用blastn算法进行序列比对,并且采用空位替代比对结果中的高变区.目前,该程序主要用于多条基因序列的比对研究.本文则以获取膜翅目小蜂总科28S rDNA D2区基因片段为例,通过应用BlastAlign的序列比对过程,提供一种较为简便和有效的方法,实现从GenBank数据库中检索并筛选特定的同源基因序列,从而克服目前利用关键词或检索式进行检索所存在的局限性.  相似文献   

6.
Maxent模型复杂度对物种潜在分布区预测的影响   总被引:4,自引:0,他引:4  
朱耿平  乔慧捷 《生物多样性》2016,24(10):1189-267
生态位模型在入侵生物学和保护生物学中具有广泛的应用, 其中Maxent模型最为流行, 被越来越多地应用在预测物种的现实分布和潜在分布的研究中。在Maxent模型中, 多数研究者采用默认参数来构建模型, 这些默认参数源自早期对266个物种的测试, 以预测物种的现实分布为目的。近期研究发现, Maxent模型采用复杂机械学习算法, 对采样偏差敏感, 易产生过度拟合, 模型转移能力仅在低阈值情况下较好。基于默认参数的Maxent模型不仅预测结果不可靠, 而且有时很难解释。在本研究中, 作者以入侵害虫茶翅蝽(Halyomorpha halys)为例, 采用经典模型构建方案(即构建本土模型然后将其转移至入侵地来评估), 利用ENMeval数据包来调整本土Maxent模型调控倍频和特征组合参数, 分析各种参数条件下模型的复杂度, 然后选取最低复杂度的模型参数(即为最优模型), 综合比较默认参数和调整参数后Maxent模型的响应曲线和预测结果, 探讨Maxent模型复杂度对预测结果的影响及Maxent模型构建时所需注意事项, 以期对物种潜在分布进行合理的预测, 促进Maxent模型在我国的合理运用和发展。作者认为, 环境变量的选择至关重要, 需要综合分析其对所模拟物种分布的限制作用和环境变量之间的空间相关性。构建Maxent模型前需对物种分布采样偏差及模型的构建区域进行合理地判断, 模型构建时需要比较不同参数下模型的预测结果和响应曲线, 选取复杂度较低的模型参数来最终建模。在茶翅蝽的分析中, Maxent模型的默认参数和最优模型参数不同, 与Maxent模型默认参数相比, 采用调整参数后所构建的模型预测效果较好, 响应曲线较为平滑, 模型转移能力较高, 能够较为合理反映物种对环境因子的响应和准确地模拟该物种的潜在分布。  相似文献   

7.
一个新的核酸序列比对算法及其在序列全局比对中的应用   总被引:1,自引:0,他引:1  
目前在序列比对中所广泛使用的动态规划算法,虽然能达到最优比对结果,但却由于具有高计算复杂度O(N_2)而极大地降低了计算效率。将多阶段动态规划决策算法用于两两序列比对并用Visual BASIC编程实现,结果发现该新算法在将计算复杂度减小到O(N)的同时,也能够获得较为理想的计算精度,预期将在序列全局比对中起重要作用。  相似文献   

8.
在DNA序列相似性的研究中,通常采用的动态规划算法对空位罚分函数缺乏理论依据而带有主观性,从而取得不同的结果,本文提出了一种基于DTW(Dynamic Time Warping,动态时间弯曲)距离的DNA序列相似性度量方法可以解决这一问题.通过DNA序列的图形表示把DNA序列转化为时间序列,然后计算DTW距离来度量序列相似度以表征DNA序列属性,得到能够比较DNA序列相似性度量方法,并用这个方法比较分析了七种东亚钳蝎神经毒素(Buthusmartensi Karsch neurotoxin)基因序列的相似性,验证了该度量方法的有效性和准确性.  相似文献   

9.
紫稻(Oryza sativa L.)细胞质雄性不育系紫稻A是本实验室构建的新型细胞质雄性不育系。本研究使用PCR、RT-PCR、DNA测序等技术,得到了紫稻细胞质雄性不育水稻不育系(樱香A)及其保持系(樱香B)线粒体atp6基因转录本cDNA序列。通过与基因组序列比对发现:樱香Aatp6cDNA序列中,没有发生RNA编辑;而樱香Batp6 cDNA序列中有16个编辑位点,在樱香B cDNA序列16个编辑位点位于15个密码子中,所编码的氨基酸均发生改变:在1003位点由C替换为T,导致原来编码谷氨酰胺密码子(CAA)成为终止密码子(TAA),保证atp6 mRNA编码一个正常的ATP6多肽;而由于没有发生RNA编辑,樱香A mRNA就不能翻译成正常的多肽。研究表明,RNA编辑在合成正常的ATP6多肽的过程中具有至关重要的作用,同时也说明RNA编辑可能与细胞质雄性不育相关。  相似文献   

10.
白鱀豚MHC基因类DQB1座位第二外元的序列变异分析   总被引:2,自引:0,他引:2  
测定了 4 5个克隆的白豚 (Lipotesvexillifer)MHCⅡ类基因DQB座位第二外元 172bp的核苷酸序列 ,共获得 15种序列 ,发现了 2 2个变异位点。核苷酸的非同义替换明显多于同义替换 ,并造成了 15个氨基酸的改变。氨基酸的替换趋于集中在假定的与抗原的选择性识别相关的位点附近。白豚DQB基因的核苷酸和氨基酸序列与文献报道的白鲸 (Delphinapterusleucas)和一角鲸 (Monodonmonoceros)DQB1序列具有较高的同源性。氨基酸序列不具备人及其它一些灵长类动物DQB2基因所共有的基序 (Motif) ,而与牛DQB1基因的基序相近 ,说明本研究得到的白豚MHC序列应属于类DQB1基因。同一个体出现了多种序列的情况 ,提示白豚的DQB基因可能存在着座位重复。白豚的类DQB1座位的序列中存在多种基序的不同组合 ,推测是由于基因转换造成的.  相似文献   

11.
陶华  唐旭清 《生物信息学》2012,10(4):269-273,279
基于模糊邻近关系的粒度空间,对蛋白质序列进行聚类结构分析。利用MEGA软件计算选取的木聚糖酶序列间的比对距离,引入内积将其转化为模糊邻近关系(或矩阵),再应用算法求解其粒度空间,进行序列的聚类结构分析和最佳聚类确定研究。这些研究为蛋白质序列提供了定量分析的工具。  相似文献   

12.
在生物信息学研究中,生物序列比对问题占有重要的地位。多序列比对问题是一个NPC问题,由于时间和空间的限制不能够求出精确解。文中简要介绍了Feng和Doolittle提出的多序列比对算法的基本思想,并改进了该算法使之具有更好的比对精度。实验结果表明,新算法对解决一般的progressive多序列比对方法中遇到的局部最优问题有较好的效果。  相似文献   

13.
核苷酸序列比对在生物系统发育研究中的应用   总被引:2,自引:3,他引:2  
作为确定分子数据初级同源性(primary homology)的过程,比对的重要性在于后续算法的选择.本文对其在生物系统发育研究中的作用及其基本步骤与算法做了简要说明;从理论与实践相结合的角度介绍了使用最为广泛的软件,讨论了其中的空位(gap)问题、参数问题和比对结果校正等问题;并且对此领域中前沿的基因组比对研究进展做了概述.  相似文献   

14.
多序列比对是生物信息学中重要的基础研究内容,对各种RNA序列分析方法而言,这也是非常重要的一步。不像DNA和蛋白质,许多功能RNA分子的序列保守性要远差于其结构的保守性,因此,对RNA的分析研究要求其多序列比对不仅要考虑序列信息,而且要充分考虑到其结构信息。本文提出了一种考虑了结构信息的同源RNA多序列比对算法,它先利用热力学方法计算出每条序列的配对概率矩阵,得到结构信息,由此构造各条序列的结构信息矢量,结合传统序列比对方法,提出优化目标函数,采用动态规划算法和渐进比对得到最后的多序列比对。试验证实该方法的有效性。  相似文献   

15.
测定了45个克隆的白(既鱼)豚(Lipotes vexillifer)MHC Ⅱ类基因DQB座位第二外元172 bp的核苷酸序列,共获得15种序列,发现了22个变异位点.核苷酸的非同义替换明显多于同义替换,并造成了15个氨基酸的改变.氨基酸的替换趋于集中在假定的与抗原的选择性识别相关的位点附近.白(既鱼)豚DQB基因的核苷酸和氨基酸序列与文献报道的白鲸(Delphinapterus leucas)和一角鲸(Monodon monoceros)DQB1序列具有较高的同源性.氨基酸序列不具备人及其它一些灵长类动物DQB2基因所共有的基序(Motif),而与牛DQB1基因的基序相近,说明本研究得到的白(既鱼)豚MHC序列应属于类DQB1基因.同一个体出现了多种序列的情况,提示白(既鱼)豚的DQB基因可能存在着座位重复.白(既鱼)豚的类DQB1座位的序列中存在多种基序的不同组合,推测是由于基因转换造成的[动物学报 49(4):501~507,2003].  相似文献   

16.
扬子鳄MHCⅡ类B基因第二外元的克隆及序列分析   总被引:4,自引:0,他引:4  
3头扬子鳄血样取自宣城安徽省扬子鳄繁殖研究中心。利用一对简并引物对MHCⅡ类B基因第二外元的部分片段进行扩增;通过克隆、单链构象多态性分析、测序,并将测得序列与下载的8个物种MHC序列比对,确定序列差异和变异位点;利用MEGA软件构建NJ树,PAUP4.0构建MP树。结果得到10种不同的序列,片段长166bp。核苷酸序列中有38个变异位点,氨基酸序列中有23个变异位点;推定的抗原结合位点非同义替换(dN)明显高于同义替换(dS)。10种序列的NJ树和MP树极为相似,均为A、B两个分支,两个分支明显的特异性位点核苷酸序列中有9个。氨基酸序列中有7个。表明扬子鳄MHCⅡ类B基因第二外元有较高的多态性,有利于扬子鳄饲养种群的遗传保护。  相似文献   

17.
利用植物DNA条形码候选序列mat K、psb A-trn H、psb K-psb I和rbc L对蜘蛛抱蛋属(Aspidistra)植物的19种104批样品进行扩增和测序,并采用相似性搜索算法(BLAST)对各序列的鉴定效率进行评价,得出蜘蛛抱蛋属物种鉴定的最佳序列。结果显示,psb K-psb I的物种鉴定成功率为88.7%,在单一序列中成功率最高。通过多序列组合鉴定效率的比较,发现组合序列的鉴定成功率明显高于单一序列,其中mat K+(psb K-psb I)组合的鉴定成功率高达100%,基于该序列组合构建蜘蛛抱蛋属植物的系统发育树,结果显示同一物种的样品聚集度较好,多表现为单系。研究结果表明mat K+(psb K-psb I)序列组合可作为蜘蛛抱蛋植物种鉴定的最佳条形码序列。  相似文献   

18.
并系同源(paralog)和直系同源(ortholog)是物种进化过程中产生的两种基本的同源序列类型.目前判断ortholog的方法已经基本确立,而paralog的判断却还没有统一的标准.番茄全基因组测序正在进行中,利用GenBank中已有的番茄BAC序列进行一系列不同参数下的比对(blastn),根据比对结果确定了paralog预测的最佳参数,分别是E值为10-40,匹配序列长度为200 bp,序列一致率为80%.这些参数值的确定为以后在番茄BAC序列中进行paralog预测提供了适用的参数.  相似文献   

19.
从RNA-Seq高通量测序短序列进行比对及拼接获得较长转录本并确定基因表达量的方法随着转录组测序的广泛开展仍在不断改进,本文利用类Unix系统的文本处理命令组合对山茶花开花期叶片及花瓣的转录组序列进行比对、序列拼接及其表达量分析。首先对测序序列进行每1万条准随机排序,选取10万条序列分别与100万条序列进行比对,从每个查询序列随机选取9组20 mer比对100万条序列去重后获得该序列的转录数量。利用查询序列首尾20 mer从匹配的比对重叠群进行拼接,初次拼接最长为410 mer,超过两个及以上拼接序列的再次进行相互比对及再拼接,最长1 174 mer。用查询序列的比对匹配数表示其拼接前后的表达量,与用互补链进行比对得到的负链表达量相当。用拼接序列进行NCBI联网blast比对获得了其基因注释。本文得到的结果表明,利用类Unix系统文本比对可以有效用于高通量测序基因表达量及进行序列从头组装等分析。  相似文献   

20.
本研究以67例肝肿瘤患者为研究对象,采用64排螺旋CT平扫及多重扫描,并以原始数据进行多平面重建、最大密度投影和三维容积重建等后期处理,试图分析和探讨64排螺旋CT多重扫描技术及其后期图像处理技术在诊断肝肿瘤的临床应用中价值。研究结果显示CT多重扫描的检出率(95.52%)明显优于平扫检出率(71.64%);在多平面重建、最大密度投影和三维容积重建三种处理技术中,动脉解剖识别方面三维容积重建技术效果最优(p0.05),病灶血管显示方面多平面重建技术效果最优(p0.05),血管连续性显示方面最大密度投影技术效果最优(p0.05);而3种后期图像显示方式在血管形态方面效果均良好(p0.05))。本研究结果提示64排螺旋CT多重扫描技术可较准确的进行肝肿瘤诊断,结合不同后期图像处理重建技术可为肝肿瘤诊断定性,在临床诊断肝肿瘤具有重要价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号