首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
为了完善DNA序列对称理论,本文将12阶DNA群(D群)推广为24阶DNA全对称群(Dd群).DNA全对称群被定义为特殊的交换群(S4),其交换元素是DNA序列的4个碱基.DNA群与四面体群(T群)同构,DNA全对称群与正四面体全对称群(Td群)同构,D群是Dd群的一个子群.本文还推导出了Dd群12个新元素的矩阵表,Dd群的乘法表,得到了在Dd群操作下四碱基A,C,G和T的变换表等.  相似文献   

2.
在DNA全对称群基础上,首先给出了正四面体所有对称操作与碱基变换群元素之间的一一对应关系;然后,归纳出了判断水或亲水密码子的对称原则;最后,讨论了多义密码子序列的对称性。  相似文献   

3.
DNA序列高维空间数字编码的运算法则   总被引:1,自引:0,他引:1  
DNA序列的高维空间二进制数字编码,除可以对DNA序列的碱基结构、功能基团、碱基互补、氢键强弱等性质进行编码之外,还可以方便地进行 数学运算和逻辑运算。DNA序列高维空间数字编码的运算法则是:(1)根据DNA序列数码的奇偶性质,可以推导出其与末位碱基的对应关系。当DNA序列S的数值X(S)=4n,4n 1,4n 2,4n 3时,其末位碱基依次为C,T,A,G(n=0,1,2,…)。(2)提出DNA序列高维空间的表观维数Nv,数值维数Nx及差异维数Nd的概念。当Nd=0时,首位碱基为A或G,当Nd=2n或2n 1(n=1,2,…)时,首痊碱基为(C)^n或(C)^nT。(3)推导出DNA序列点突变(单核苷酸多态性SNP)的运算法则。(4)推导出DNA重复序列(Tandem repeat)的运算法则。(5)提出DNA子序列(subsequence)的概念并定义DNA子序列的定值部Xi(digital value)和定位部Qi(location value)及其计算公式。(6)推导出DNA序列的延长运算、删除运算、缺失运算、插入运算、转位运算、换位运算和置换运算等的运算法则。(7)通过按位加运算求得DNA序列的汉明距离dh,碱基距离dh‘,基团距离dh″和共轭距离dG以及这些距离的意义与联系。(8)分析结果表明DNA序列的数字编码比常规的字符编码在数学运算上具有明显的优越性。  相似文献   

4.
大肠杆菌、酵母和果蝇基因保守位点的信息熵分析   总被引:1,自引:0,他引:1  
对大量的大肠杆菌(Escherichia coli)、酵母(Yeast)和果蝇(Drosophila melanogaster)已知基因起始密码子和终止密码子上、下游各30个碱基序列,用重新定义单碱基信息冗余(记为D1(ι),ι是位点)和紧邻碱基的信息冗余(记为D2(ι),统计计算每个位点的D1(ι)和D2(ι)值。从结果看,双碱基比单碱基携带更多的信息;酵母和果蝇基因起始密码子上游-3位点D1(-3)和D2(-3)有一明显峰值;大肠杆菌基因起始密码子上游SD区域D1(ι)和D2(ι)有明显峰值,与他人结论相同。发现酵母基因起始密码子下游的+4位点与+5位点的紧邻碱基的D2(ι)有一峰值,其关联模式为TC(联合概率为0.211)。这说明用重新定义的信息冗余去确认DNA序列中存在的保守位点是完全可行的。  相似文献   

5.
迄今,已有60多个原核生物的基因组全序列被发表。我们因此有可能对它们基因组的构成有更深入的认识。绝大多数生物基因组DNA的G与C和A与T的含量相等^[1]。但是,在许多原核生物基因组的先导链和后随链内存在G与C或A与T分布的不对称(Gc shew或AT shew)、原核生物DNA链的非对称性表现在碱基、密码子和基因水平。  相似文献   

6.
拟南芥叶绿体DNA全序列微卫星分布规律的分析   总被引:5,自引:0,他引:5  
为进一步以拟南芥为模板,开发果树通用的叶绿体微卫星或称简单序列重复(chloroplast simple sequence repeat, cpSSR)引物,对拟南芥叶绿体DNA全序列cpSSR进行了统计分析.结果表明,拟南芥cpSSR以单碱基重复为主,占总数的78.6%,二碱基重复占总数的19%,三碱基重复占2.4%,三碱基以上重复为零.在单碱基重复中,又以A和T重复为主,占98.5%.二碱基重复全部为AT重复.单碱基重复中的纯粹重复41个,占总数的62.1%.间断重复数为23个,占总数的34.8%.复合重复数仅为2个.  相似文献   

7.
人乳铁蛋白cDNA的克隆及序列分析   总被引:1,自引:0,他引:1  
从北京正常人乳腺组织中提取总RNA,用RT-PCR的方法扩增人乳铁蛋白(hLF)的cDNA,将其克隆到pGEM-T载体上并进行DNA序列测定。结果表明,所克隆的hLF cDNA序列全长为2136bp,其DNA序列与GenBank中另外5个hLF cDNA序列相比,有2个碱基与这5个序列不同:1740位这5个序列是G,本文序列是C;1756位这5个序列是T,本文序列是C。其中1740位碱基的变化导致了第580位氨基酸由Glu变为Asp。  相似文献   

8.
目的:Aspergillus niger(CU-1)菌株α-葡萄糖苷酶基因(agdA)克隆并对其序列进行分析,构建该基因的真核表达载体。方法:设计合成的一对特异性引物,采用PCR以总DNA为模板,扩增得到DNA片段(D1);采用RT-PCR方法扩增得到DNA片段(D2)。将DNA片段D1和D2转入大肠杆菌中并进行了序列测定,序列进行BLAST比对分析。将α-葡萄糖苷酶基因的cDNA片段与表达载体pGAPZαA连接,构建重组表达载体。结果:基因agdA大小为3 127bp,含有3个外显子和4个内含子。该基因的cDNA序列大小为2 958bp,包含完整的编码框,编码985个氨基酸。agdA基因序列与已发表的α-葡萄糖苷基因序列同源性达99%,其中有6个位置的碱基发生了变化。已成功构建重组表达载体pGAPZαA-agdA。结论:Aspergillus niger(CU-1)菌株α-葡萄糖苷酶基因序列分析及重组表达载体pGAPZαA-agdA的构建为在毕赤酵母中表达Aspergillus niger(CU-1)菌株的α-葡萄糖苷酶奠定基础。  相似文献   

9.
[目的]蝇蛆病分布广泛,是一类主要由双翅目昆虫的幼虫引发的寄生虫病。蛾蚋幼虫是毛蠓科昆虫中可引发人体蝇蛆病的最常见物种之一。星斑蛾蚋Psychoda alternata线粒体基因组全序列对研究这类致病昆虫的系统地位具有重要的意义,也为预防和治疗蝇蛆病提供理论基础。[方法]本文利用DNA测序和克隆技术,对星斑蛾蚋的线粒体基因组进行了初步研究。[结果]研究表明:星斑蛾蚋线粒体基因组全长15 908bp,由蛋白质编码基因、tRNA基因、rRNA基因和非编码A+T富含区构成。两条链(J链和N链)共编码了37个基因。全序列碱基百分含量为39.6%A,40.3%T,11.8%C,8.3%G,全基因组序列的A+T含量为79.9%。[结论]星斑蛾蚋线粒体基因组组成和排序与典型的昆虫mtDNA一致。分布于J链的蛋白质基因有9种,而N链上有4种,其碱基含量在两条链上呈不对称现象不明显。基于线粒体13种蛋白质编码基因的26种双翅目昆虫系统发育分析表明毛蠓科与伪蚊科为姐妹群。  相似文献   

10.
目的测定云南猕猴线粒体DNA控制区全序列,对其进行鉴定及进化分析。方法利用PCR技术扩增猕猴线粒体DNA控制区全序列,结合GenBank中下载的猕猴参考序列(AY612638),采用多个生物学软件对序列碱基组成、同源性、转换/颠换比等遗传信息进行分析,并基于邻接法(NJ)和最小进化法(ME)构建系统进化树。结果云南猕猴线粒体DNA控制区全长为(1084-1089)bp,A、T、G和c四种碱基平均含量分别为29.9%、26.9%、12.3%和30.9%,A+T含量(56.8%)高于G+C含量(43.2%)。所分析序列间的同源性为91.5%-99.5%,平均核苷酸变异率为4.5%,变异类型包括转换、颠换、插入和缺失4种形式,转换/颠换比值平均为26.1。进化树显示云南猕猴存在两个平行进化的姐妹分支。结论本研究获得了云南猕猴mtDNA控制区全序列,为猕猴进化关系研究及mtDNA控制区功能研究奠定基础。  相似文献   

11.
中华雏蝗(Chorthippus chinensis Tarb)线粒体基因组分析   总被引:1,自引:0,他引:1  
采用Lon-PCR扩增线粒体全基因组和保守引物步移法结合克隆方法测定并拼接获得了中华雏蝗(Chorthippus chinensis Tarb)线粒体基因组全序列.序列的注释和分析结果表 明,中华雏蝗线粒体基因组序列全长15 599 bp,共有13个编码蛋白质基因、22个tRNA基因、2个rRNA基因和1个A+T富集区.基因顺序与非洲飞蝗(Locusta migratoria)相同,也发生了2个 tRNA Asp(D)和tRNALys(K)的倒置.13个编码蛋白质基因都使用了ATN作为起始密码子.除ND1以TAG和ND5的终止密码子为不完全的T外,其余11个编码蛋白质基因的终止密码子都为完整的TAA.6种直翅类昆虫13个蛋白质的氨基酸序列的联合数据集构建的系统树与形态分类系统一致,中华雏蝗与非洲飞蝗为姐妹群,并与东方蝼蛄构成一单系群.  相似文献   

12.
psbA基因是叶绿体基因组中一个重要的光调控基因,编码光和系统Ⅱ反应中心的D1蛋白。根据叶绿体基因组序列高度保守的特性,利用菜茵衣藻(Chlamydomonasreinhardtii)psbA基因的保守序列(基因登录号:HQ667991.1)设计引物,采用PCR步移的方法从亚心型扁藻(Platymonassubcordiformis)基因组DNA中克隆到psbA基因全长(基因登录号:KF528742)。序列分析表明,亚心型扁藻psbA基因全长1939bp,编码区长度为1062bp,推导编码353个氨基酸,包括4个赖氨酸残基。有效密码子数显示脚删基因具有明显的密码子偏好性,并且偏好使用以A/T结尾的密码子。相对同义密码子使用度表明25个密码子在编码使用时具有偏好性,其中20个密码子以A/T碱基结尾,占到80%。其终止密码子使用了TAG。  相似文献   

13.
【目的】利用核糖体DNA联合序列探讨天牛总科高阶元分子系统发育。【方法】本研究采用分子标记技术,分析测定了63种天牛核糖体28S rDNA D2和D3区以及18S rDNA V4和V7区的DNA序列,并采用邻接法、最大似然法和贝叶斯推论法分别构建了天牛总科2科6亚科63种的分子进化系统。【结果】序列联合比对分析,最终得到1 404 bp的联合数据组,其中可变位点446个(32.0%),保守位点958(68.0%),转换/颠换的平均值(R值)为1.73。28S rDNA和18S rDNA以及联合序列的饱和度分析显示碱基突变未达到饱和,说明这些序列适合于分子进化树的构建。利用不同系统发育重建方法得到进化树具有相似拓扑结构,结果支持沟胫天牛亚科、花天牛亚科和天牛亚科为单系群,这与形态学分类结果相似;狭胸天牛独立成为亚科得到了支持。【结论】利用28S rDNA D2和D3区以及18S rDNA V4和V7区联合序列成功构建出了天牛总科高阶元的系统发育树。研究表明联合序列分析是探讨天牛高阶元分类的有效的方法。  相似文献   

14.
基于混沌游走方法的Rh血型系统中RHD基因的分析   总被引:3,自引:0,他引:3  
高雷  齐斌  朱平 《生命科学研究》2009,13(5):408-412
利用基于经典HP模型的蛋白质序列混沌游走方法(chaos game representation,CGR),给出了RHD基因的蛋白质序列CGR图,可视作蛋白质序列二级结构的一个特征图谱描述.对临床上的血型鉴别有一定的参考价值.另外.还根据由Jeffrey在1990年提出的描绘DNA序列的CGR方法,给出了RHD基因的DNA序列的CGR图.并且根据RHD基因DNA序列的CGR图算出了尺日D基因相应的马尔可夫两步转移概率矩阵,从概率矩阵表可以看出RHD基因对编码氨基酸的三联子的第3个碱基的使用偏好性.  相似文献   

15.
中国明对虾基因组小卫星重复序列分析   总被引:4,自引:0,他引:4  
高焕  孔杰 《动物学报》2005,51(1):101-107
通过对中国明对虾基因组随机DNA片断的测序 ,我们获得了总长度约 6 4 10 0 0个碱基的基因组DNA序列 ,从中共找到 172 0个重复序列。其中 ,小卫星序列的数目为 398个 ,占重复序列总数目的 2 3 14 %。这些小卫星序列的重复单位长度为 7- 16 5个碱基 ,集中分布于 7- 2 1个碱基范围内 ,其中以重复单位长度为 12个碱基的重复序列数目最多 ,为 5 8个 ,占小卫星重复序列总数目的 14 5 7%。不同拷贝数目所对应的重复序列的数目情况为 :拷贝数目为 2的重复单位所组成的重复序列数目最多 ,为 137个 ;其次是拷贝数目为 3的重复序列 ,为12 2个 ,且随着拷贝数目的增加 ,由其所组成的重复序列的数目呈递减的趋势。其中一部分序列见GeneBank数据库 ,登录号为AY6 990 72 -AY6 990 76。 398个重复序列分别由 398种重复单位所组成 ,因而小卫星重复序列的类型很多 ,我们初步分成三类 :两种碱基组成类别、三种碱基组成类别和四种碱基组成类别 ,并进一步根据各个重复序列中所含有的碱基种类的数量从大到小排列这些碱基而分成若干小类。从这些分类中可以看出 ,中国明对虾基因组中的小卫星整体上是富含A T的重复序列 ,并具有一定的“等级制度” ,揭示了其与微卫星重复序列之间的关系 ,即一部分小卫星重复序列可能起源于微卫星  相似文献   

16.
通过PCR扩增并测序获得了三斑海马(Hippocampus trimaculatus)线粒体DNA(mt DNA)全序列。三斑海马线粒体基因组全序列长度为16 534 bp(Gen Bank登录号为KJ956892),编码37个基因,包括13个蛋白编码基因、22个t RNA基因和2个r RNA基因。非编码区域包括1个控制区(D-loop)及一个轻链复制起始区域。大部分基因由H-链编码,包括14个t RNA基因、2个r RNA基因、12个蛋白编码基因;只有ND6和8个t RNA基因是在L-链编码。预测的22个t RNA基因的二级结构均为典型的三叶草状。基因间隔一般1~14 bp不等。此外,还存在7处碱基重叠,其中,4处是鱼类和脊椎动物典型的基因重叠位点。总的碱基含量分别为,A 32.7%,C 23.4%,G 14.6%,T 29.3%,A+T含量为62.0%。其线粒体基因组序列的结构与脊椎动物的典型结构近似。邻接法和贝叶斯法构建的三斑海马系统进化树的拓扑结构相似,这与现有的三斑海马的系统演化地位一致。本研究为海马的进化研究以及保护工作提供了基础数据。  相似文献   

17.
WU多瘤病毒(WUPyV)是多瘤病毒科多瘤病毒属的新成员,近来发现与人呼吸道感染等有关。本研究对2株WUPyV进行全基因组序列测定和拼接,获得这2株病毒全基因组序列,并与已上传到GenBank的国内外几株WUPyV的全基因组序列和氨基酸序列进行比对和系统进化分析。这2株WUPyV是环状、双链DNA病毒,基因组全长5 228bp,比GenBank已知WUPyV全序列少1bp。缺失的一对碱基位于位点4 536处,属于大T抗原的非编码区。病毒全基因组编码5个蛋白,分别是3个衣壳蛋白VP2、VP3、VP1与大T抗原和小T抗原。系统进化分析显示相对中国福建福州的FZ18株,另一株FZTF株与参考株-澳大利亚的B0株关系较近。  相似文献   

18.
测定了果蝇nasuta亚群7个分类元和外群D.immigrans的核糖体基因转录间隔区(ITS,interanscribed spacer),包括5.8SrDNA和2SrDNA长约1.1kb的DNA片段序列。结果表明:D.pallidifrons、Taxon I、Taxon J享有共同的序列;D.albomicans则与D.s.neonasuta共享1个序列。序列之间存在少量的插入缺失和碱基替代。  相似文献   

19.
低能N+辐照拟南芥诱导基因组DNA碱基变异分析   总被引:6,自引:0,他引:6  
用低能N~+离子束注入拟南芥后获得的稳定突变体T80Ⅱ作为实验材料,对突变体植株进行了RAPD标记,并将T80Ⅱ和对照部分RAPD特异条带进行克隆测序和DNA序列分析。结果显示,在可分辨的总计397个RAPD条带中,T80Ⅱ株系中有52个条带表现出差异,包括条带的缺失和增加,条带变异率为13.1%;克隆的T80Ⅱ序列中,平均每16.8个碱基出现1个碱基变异位点,表现出较高频率的碱基突变。碱基突变类型包括碱基的颠换、转换、缺失、插入等。在检测到的275个碱基突变中,主要是单碱基置换(97.09%),碱基缺失或者插入的比例较小(2.91%)。在碱基置换中,转换的频率(66.55%)高于颠换的频率(30.55%)。此外,构成DNA的4种碱基均可以被离子束辐照诱发变异,而且每一种碱基都可以被其他3种碱基所替换,但是胸腺嘧啶(T)的辐射敏感性要高于其他3种碱基。通过分析突变碱基周边序列,对低能N~+离子注入拟南芥突变体引发的碱基突变热点进行了讨论。  相似文献   

20.
基于线粒体COⅠ基因的齿小蠹属昆虫DNA条形码研究   总被引:2,自引:0,他引:2  
齿小蠹属(鞘翅目: 小蠹科)昆虫是植物检疫中经常截获的类群, 为探讨线粒体细胞色素C氧化酶亚基Ⅰ(COⅠ)基因的特定区段作为DNA条形码快速准确鉴定齿小蠹种类的可行性, 以齿小蠹属昆虫为研究对象, 测定分析了线粒体COⅠ基因462 bp碱基序列。序列分析结果显示: 变异位点为259个, 保守位点203个, 简约信息位点181个, 自裔位点78个。所有位点中, A, G, C和T碱基平均含量分别为30.7%, 16.5%, 17.0%和35.8%。A+T含量较高, 为66.5%, 明显高于G+C含量, 表现明显的A+T碱基偏嗜, 且A与T含量相当, 符合昆虫线粒体基因碱基组成的基本特征。转换与颠换结果显示: 该段序列未达到饱和, 可以得到准确的进化分析。利用Kimura 2-parameter模型分析遗传距离得到, 同物种间的遗传距离介于0.002~0.007之间, 不同种间的遗传距离介于0.056~0.431间, 平均遗传距离为0.199, 说明该段序列能够区分不同物种。基于COⅠ基因序列构建的邻接法系统发育树(NJ树)显示, 同一物种聚为同一小支, 且分支自展值均为100%; 近缘种能聚集在一起, 且置信度很高(≥97%)。结果表明应用基于COⅠ基因片段的DNA条形码进行齿小蠹属昆虫分类鉴定具有可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号