首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
蛋白质编码区与非编码区的特征与识别   总被引:2,自引:0,他引:2  
在核苷酸序列分析中,一个重要的问题是如何识别一段未知序列中的编码区和非编码区.近年来提出了一些方法,但效果都不够理想.本文在对编码区与非编码区特征进行大量统计分析的基础上,提出一种加权距离判别法,并对该方法的精度进行了评价.  相似文献   

2.
编码区和非编码区SSR标记对水稻类群的比较研究   总被引:1,自引:0,他引:1  
设计14对水稻编码区SSR引物和选取已公布的非编码区SSR引物12对、编码区SSR引物3对,采用SSR技术,对29个标记在60个水稻材料中的多态性进行分析。结果表明,编码区SSR标记平均检测到3.59个多态性位点,多态信息量PIC(polymorphism information conten)在0.032~P0.853之间,平均值为0.447;非编码区SSR标记平均检测到3.92个多态性位点,PIC在0.063~P0.795之间,平均值为0.521。聚类分析显示,非编码区SSR标记能更加精确地区分来自不同地区的水稻类群,编码区SSR标记也具有良好的多态性,同样可以用于分析水稻的亲缘关系。  相似文献   

3.
真核生物DNA非编码区的组分分析   总被引:4,自引:0,他引:4  
在全基因组水平上,用直方图、混沌表示灰度图、距离差异度和信息熵差异度四种方法,研究了拟南芥、线虫、果蝇的DNA内含子、基因间隔区DNA、外显子三种区域的核苷酸短序列组分及组分复杂度.结果表明:a.不同基因组之间,不管基因数目多少,用4种方法得到的外显子部分其组分复杂度都比较接近,而非编码区部分的组分复杂度却很大.这一点定量地说明了物种之间的复杂程度,主要不体现在编码区部分,而体现在非编码区部分.b.同一基因组中,内含子的核苷酸短序列组分复杂度都是相似的,外显子和intergenic DNA部分的组分复杂度也是相似的.c.内含子和intergenic DNA在转录、剪切、二级结构等方面有很大的不同,但它们在核苷酸短序列组分上的差异却很小,说明内含子和intergenic DNA在转录、剪切、二级结构上的不同并不通过核苷酸短序列组分来进行限制.  相似文献   

4.
针对DNA序列编码区的识别问题,本研究提出一个特征向量和逻辑回归的组合模型。首先对DNA序列进行数值处理转化为特征向量,并结合k字符相对频率技术提取特征向量的元素特征,之后利用二分类逻辑回归算法,对编码区和非编码区进行准确区分。选取了HMR195和BG570两个基准数据集进行五折交叉验证,结果表明,平均AUC(Area Under Curve)值分别为0.981 3和0.987 4,明显优于传统的贝叶斯判别法和VOSSDFT等方法。此外,本文提出的特征向量的维度很低,提高了运算效率。因此,本文组合模型能够较为高效准确地识别蛋白质编码区。  相似文献   

5.
Yeast基因组编码区特征参数的研究   总被引:1,自引:0,他引:1  
以碱基成分偏移量D值为基本参数定义参数d,以d为Yeast编码区的特征参数,对Yeast的第1、2、3类ORF(open reading frame)进行了统计,得到d的特征参数区间,并且,以此区间为标准为Yeast的6类ORF,以及5′帽、3′尾、内含子、组分随机序列等非编码序列进行了检验。结果表明,d作编码区的特征参数是可行的,它可以很好地区分编码序列和非编码序列。别外,又讨论了参数d与基因表达水平(用CAI值来衡量)的关系。发现,参数d与基因表达水平成很好的正相关关系。发现密码子的第1位点和第2位点的某些碱基分布与基因表达水平有关。  相似文献   

6.
孙奕钢  高雷  张忠华  薛庆中 《遗传》2005,27(4):629-635
在分析DNA序列复杂度、预测基因编码区和非编码的DNA边界识别等问题中,以熵为基础构造的离散量度量提供了一种强有力的工具。为改进寻找水稻基因编码与非编码区边界的效率,本文提出了两个新的离散量度量(α-KL离散量与α-Jensen-Shannon 离散量),根据密码子的GC含量对氨基酸对应密码子构建了粗粒化向量。 比较了融合Jensen-Shannon 离散量、Jensen-Renyi 离散量、α-KL离散量和α-Jensen-Shannon 离散量等不同向量所获得的精度,结果表明,在对水稻基因编码区‘终止子’的识别效率上,构建的密码子粗粒化向量融合新引进的度量方法比Bernaola等人的方法(2000)提高了4~5倍。  相似文献   

7.
大肠杆菌编码区碱基片段的分析研究   总被引:5,自引:2,他引:3  
对大肠杆菌1231个编码开始区域和1307个编码终止区域内的6碱基片段、4碱基片段和3碱基片段进行了统计,发现绝大多数4碱基和3碱基模式出现在盯对频率小于2的范围之内;在这两个区域中,出现最多的碱基片段是多聚A;编码开始区域和编码终止区域的碱基构成模式有明显区别;编码开始区域里GGA类的稀有片段恰恰是SD区域最偏好的碱基片段;以TAG或CTA构造的3碱基模式为编码开始区和编码终止区的禁用模式。  相似文献   

8.
人Nmi mRNA编码区存在变异形式   总被引:1,自引:0,他引:1  
Nmi基因编码一种可与Myc相互作用的蛋白质.在人红白血病细胞系TF-1细胞去细胞因子GM-CSF后8h,发现NmiRNA表达水平升高.利用PCR方法从中扩增NmicDNA编码区,发现除正常大小的扩增片段外,还有一比公布核酸序列小约100~200bp的扩增片段.序列分析表明该片段为编码区第337~509位的碱基缺失,由GTTCCATTGCG11个碱基取代,形成一个开放读码框架,编码254个氨基酸,比野生型Nmi编码的307个氨基酸少53个氨基酸.  相似文献   

9.
以阴地蕨属(Botrychium)5种药用植物的matK基因为对象,分析matK基因编码区全序列和其编码产物MATK蛋白的氨基酸序列特征,并比较他们在用于阴地蕨属药用植物系统发育关系研究中的差异。结果显示,阴地蕨属5种植物matK基因全长为1500~1503 bp,共有153个变异位点,其编码产物均为不稳定的亲水性蛋白,无跨膜结构,二级结构以α-螺旋和无规则卷曲为主。系统发育分析结果表明,基于matK基因序列的系统发育分析更适合于阴地蕨属种间亲缘关系的鉴定,说明matK基因在阴地蕨属植物的鉴定中具有一定的应用价值。  相似文献   

10.
RD区编码蛋白在结核病免疫诊断中的研究进展   总被引:2,自引:0,他引:2  
结核病是由结核分枝杆菌引起的威胁人类的重大传染性疾病之一.目前常用诊断方法其灵敏度差和检测周期长难以满足早期诊断的需要,免疫诊断作为其防控的早期诊断技术之一,近年来得到更加广泛的关注.而结核分枝杆菌RD区编码蛋白的发现,促进了结核病免疫诊断的迅速发展.本文对目前RD区编码蛋白在结核病诊断中的研究进展进行了概述.  相似文献   

11.
周明  杨世湖  兰莹  晋玉宽  万建民 《遗传》2008,30(3):367-372
将包含Pib基因启动区及下游完整编码区的9.9 kb DNA片段克隆到双元载体pPZP2Ha3(+)中, 构建了35S驱动的正义表达载体pNAR701(20.3 kb); 同时将Pib基因编码区6 986~9 392 bp之间的DNA片段, 克隆到双元载体pPZP2Ha3(-)中, 构建了35S驱动的反义表达载体pNAR703(12.8 kb); 用农杆菌介导法转入中感稻瘟病水稻品种R109中。PCR、Southern blot鉴定以及转基因T0代种子的潮霉素抗性鉴定证明, 目的基因已经整合到R109基因组中, 并能在后代稳定遗传。Northern blot分析表明含有启动区及下游完整编码的Pib基因片段在35S驱动下能够在转基因后代中表达。对T1代苗期转基因植株和分蘖期离体叶片进行抗稻瘟病初步分析, 结果显示pNAR701转基因植株对稻瘟病生理小种ZD1和ZG1的抗性较对照增强, 而转反义片段的pNAR703转基因植株对稻瘟病的抗性较对照减弱。  相似文献   

12.
黄病毒科黄病毒属是由一组含单股正链RNA基因组的囊膜病毒组成,包括登革病毒、流行性乙型脑炎病毒、寨卡病毒、西尼罗病毒、黄热病病毒等,经由虫媒传播,可引起人类和动物的严重虫媒病毒病。黄病毒基因组由1个开放阅读框、5′非编码区和3′非编码区三部分组成。5′和3′非编码区含有病毒基因组复制所必需的启动元件;高度结构化的3′非编码区负责黄病毒亚基因组RNA的产生,从而有助于病毒逃避宿主免疫反应;此外3′非编码区还可作为疫苗研究的靶标。鉴于非编码区在黄病毒的蛋白翻译、基因组复制和免疫调节中发挥的重要作用,本文就黄病毒基因组非编码区的结构与功能最新研究进展作一简要综述。  相似文献   

13.
伪狂犬病病毒基因编码区碱基组成与密码子使用偏差   总被引:6,自引:0,他引:6  
由于伪狂犬病病毒(PRV)中G C含量高达74%,至今尚没有一个毒株完成全基因组测序。对已知的68个PRV基因编码区序列碱基组成及密码子使用现象进行了统计分析,结果发现PRV基因中存在非常强的密码子使用偏差。所有68个PRV基因编码区密码子第三位总的G C含量为96.24%,其中UL48基因高达99.52%。PRV基因偏向于使用富含GC的密码子,特别是以C或G结尾的密码子。此外,还发现PRV中G C含量变化较大的UL48、UL40、UL14和IE180等基因附近正好与已知的PRV基因组复制起始区相对应。根据基因功能将PRV基因分为6类进行分析发现,基因功能相同或相近的基因其密码子使用模式相似,其中调节基因的同义密码子相对使用度(RSCU)与其他基因有显著差异,在调节基因中以C结尾的密码子的RSCU值远大于其他同义密码子。最后,对PRV基因氨基酸组成差异进行多元分析,发现不同功能的PRV基因在对应分析图上分布不同,表明PRV基因密码子使用模式可能与基因功能相关。  相似文献   

14.
将两株1型犬腺病毒(Canine adenovirus type 1,CAdl)DNA片段(29 ̄40m.u.)和两株2型犬腺病毒(CAd2)DNA片段(28 ̄44m.u.),分别克隆到质粒pBluescript SK中。经核苷酸序列测定和计算机分析表明,在上述克隆片段内,两株CAdl(CLL和Glaxo)的序列相同,两株CAd2(Toronto和China)的序列也相同;CAd1与CAd2具有9  相似文献   

15.
在全基因组关联研究(genome-wide association studies,GWAS)中已鉴定到大量与疾病和复杂性状相关的突变位点,其中绝大部分位于基因组上的非编码区,通过多种方式参与到基因表达调控与表型产生的过程中。近年来,如何对这些突变进行系统地注释和鉴定研究是疾病基因组学研究领域的一大挑战。机器学习算法的快速发展为相关研究工作提供了新的契机。结合多组学的数据特征,机器学习方法能够对基因组上的非编码区突变进行大规模与高准确性注释和预测,对于揭示突变的具体致病机制以及指导下游实验验证具有重要的参考价值。本文主要针对机器学习算法在非编码区突变注释研究中的应用进展进行综述,并对当前研究的不足之处和未来的研究方向进行讨论,以期为相关的研究工作提供参考。  相似文献   

16.
通过3'RACE克隆策略获得绞股蓝(Gynostemma pentaphyllum)核糖体失活蛋白(ribosome-inactivating protein,RIP) Gynostemmin的5个cDNA序列gynostemminⅠ~Ⅴ及其下游非编码区(3' untranslated region, 3'UTR)。它们的编码区长度除gynostemminⅡ为825 bp外,其余均为831 bp。其下游非编码区的长度分别为279、174、170、161和171 bp。在3'UTR中,gynostemminⅠ比另外4个多了两个小的茎环结构和一富含AU的不稳定子元件,其mRNA的稳定性可能因此受到影响。  相似文献   

17.
通过3'RACE克隆策略获得绞股蓝(Gynostemma pentaphyllum)核糖体失活蛋白(ribosome-inactivating protein,RIP)Gynostemmin的5个cDNA序列gynostemmin Ⅰ~Ⅴ及其下游非编码区(3′untranslated region,3′UTR).它们的编码区长度除gynostemmin Ⅱ为825 bp外,其余均为831 bp.其下游非编码区的长度分别为279、174、170、161和171 bp.在3′UTR中,gynostemmin Ⅰ比另外4个多了两个小的茎环结构和一富含AU的不稳定子元件,其mRNA的稳定性可能因此受到影响.  相似文献   

18.
以小米(Setaria italica)为材料,克隆了含有叶绿体psbA基因的2.2kb EcoRⅠ片段,测定了该基因5'末端非编码区的核苷酸序列。序列分析显示psbA基因5'末端非编码区存在着与原核类似的启动子结构,其“-10”区的序列为TATACT,与原核生物“-10”共有基序(Consensus motif)仅相差一个核苷酸;其“-35”区的序列为TTGACA,与原核生物“-35”共有基序完全相同。另外,在“-10”区和“-35”区之间还存在着一个类似真核启动子结构的“TATATA”保守序列。这些结果表明小米psbA基因的启动子既具有原核的特征又具有真核的特征。小米psbA基因的mRNA前导序列长87bp,与高粱完全一致,而比水稻多出了“CTATTTT”7个核苷酸,比小麦、大麦和黑麦多出了“TTTT”4个核苷酸。因此推测在禾本科的C_3和C_4植物之间,psbA基因mRNA前导序列区的差异可能具有普遍性。计算机分析结果显示,以上6种植物的psbA基因mRNA前导序列区内均能形成小的茎环结构,而且这段“CTATTTT”额外序列恰好位于茎环结构中,造成了6种植物间茎环大小的差异。这一小的二级结构可能对psb…  相似文献   

19.
黄瑶  吴乃虎   《生物工程学报》1996,12(2):119-123
以小米(Setaria italica)为材料,克隆了含有叶绿体psbA基因的2.2kb EcoRⅠ片段,测定了该基因5'末端非编码区的核苷酸序列。序列分析显示psbA基因5'末端非编码区存在着与原核类似的启动子结构,其“-10”区的序列为TATACT,与原核生物“-10”共有基序(Consensus motif)仅相差一个核苷酸;其“-35”区的序列为TTGACA,与原核生物“-35”共有基序完全相同。另外,在“-10”区和“-35”区之间还存在着一个类似真核启动子结构的“TATATA”保守序列。这些结果表明小米psbA基因的启动子既具有原核的特征又具有真核的特征。小米psbA基因的mRNA前导序列长87bp,与高粱完全一致,而比水稻多出了“CTATTTT”7个核苷酸,比小麦、大麦和黑麦多出了“TTTT”4个核苷酸。因此推测在禾本科的C_3和C_4植物之间,psbA基因mRNA前导序列区的差异可能具有普遍性。计算机分析结果显示,以上6种植物的psbA基因mRNA前导序列区内均能形成小的茎环结构,而且这段“CTATTTT”额外序列恰好位于茎环结构中,造成了6种植物间茎环大小的差异。这一小的二级结构可能对psbA基因的表达调控有一定的影响。  相似文献   

20.
采用逆转录聚合酶链反应(RT-PCR)从广东省一例慢性丙型肝炎病人血清中获得丙型肝炎病毒(HCV)5'端非编码区(5'NCR)302bp的cDNA片段,经补齐和提纯后插入pUC19质粒,获得的重组体pUN进行序列测定。将pUN的目的基因亚克隆进体外转录载体pSPORTI多克隆位点的EooRI和PstI切点之间,所得重组体pSN线性化后由T_7RNA多聚酶及SP6RNA多聚酶引导体外转录反应,产物经凝胶电泳及特异引物RT-PCR,证实SP6引导的是正义RNA,T7合成的是反义RNA,其大小分别力429bp和362bp。并证实所得RNA力HCV5'NCRcDNA转录而来。获得的HCV5'NCRcDNA和RNA在常规逆转录和PCR步骤中用于设立有效的模板对照,对消除假用性及评估试剂有重要意义。同时,HCV5'NCR体外转录载体的构建可用于制各RNA探针和反义RNA,改进后还可作为定量PCR的竞争性模板。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号