首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
分别用PCR方法扩增了1.7kbp和1.6kbp的猪PSP-Ⅰ和PSP-Ⅱ基因的启动子,并进行TA克隆,测序鉴定,测序结果用DNAstar程序与Genebank中的相应序列进行对比分析,结果显示与已发表序列的同源性分别为99.8%和96.3%。利用生物信息学的方法对克隆的1.7kbp和1.6kbp的猪PSP-Ⅰ和PSP-Ⅱ基因的启动子区进行了预测分析。PSP-Ⅰ和PSP-Ⅱ基因序列对比(mVista)分析发现,启动子0→-1000bp的保守性较高,其中0→-200bp核心启动子部分的序列同源性达到了100%,而-1000bp上游序列的保守性则较低。启动子的位置预测(Promoter Scan)结果显示,转录起始点上游200bp的区域为两基因的核心启动子位置。启动子区转录因子结合位点预测(TFSEARCH)发现,转录起始位点上游的1000bp区域内含有大量的顺式调控元件,并且得到了一系列潜在的转录因子结合位点。  相似文献   

2.
启动子预测是研究基因转录调控的重要环节,但现有算法的预测正确率偏低.在深入分析启动子生物特征的基础上,提出了一种基于支持向量机的枯草杆菌启动子预测算法,在启动子序列的组成特征、信号特征和结构特征中选取9种典型特征作为预测的依据,对于信号特征,除了利用保守模式的一致序列,还考虑了间隔距离的分布信息.首先通过特征描述模型分别计算每种特征在启动子序列和非启动子序列中的得分,将特征得分组合成9维特征向量,再利用支持向量机在特征向量集上进行训练和判别.对实际数据集进行的刀切法测试验证了算法的有效性.对σ启动予的预测,平均正确率达到了90.7%;对几种其它σ因子启动子的预测,平均正确率也超过了80%.算法不但有广泛的适用性,还有良好的可扩展性,能够方便的容纳新特征,使识别性能不断提高.  相似文献   

3.
启动子是转录水平上一个重要的调控元件,其决定着基因的表达模式和表达强度。Ⅰ型启动子具有高转录活性和种属间特异性等特点。如将其应用于植物RNA病毒载体表达系统,有利于提高表达系统的表达效率和生物安全性。本氏烟(Nicotiana benthaminana)是一种被广泛地应用于植物生物反应器和植物病理学的模式生物,但是现有核酸数据库中尚没有其Ⅰ型启动子的相关信息。因此,克隆本氏烟Ⅰ型启动子并分析其转录起始位点就具有重要的应用价值。通过半巢式PCR获得了514 bp的本氏烟Ⅰ型启动子序列(KC352713);生物信息学分析初步预测其转录起始位点位于其核心序列TATA(G)TA(N)GGGGG中的第3位A处;通过植物RNA病毒表达载体和5'RACE技术在体内验证本氏烟Ⅰ型启动子转录起始位点与生物信息学预测结果一致。研究结果为深入研究Ⅰ型启动子和构建Ⅰ型启动子介导转录的植物RNA病毒载体表达系统奠定了基础。  相似文献   

4.
基于二次判别的果蝇启动子识别   总被引:3,自引:0,他引:3  
通过对果蝇polⅡ启动子和非启动子的序列特征分析,计算了序列每个位点单碱基保守性M1(l)值和六联体保守性M6(l)值。从而分别选取两个区域的六联体频数作为离散源参数,利用离散增量结合二次判别函数(IDQD)对启动子进行了预测。对于从编码区和内含子中选取的非启动子数据集,启动子的预测成功率分别达到93%和89%。比较结果显示IDQD模型能够有效地提高启动子预测成功率。  相似文献   

5.
杨科利  许强 《生物技术》2008,18(2):39-42
目的:改进真核生物启动子的理论预测方法。方法:基于启动子序列的信号特征和内容特征,构建6个标准离散源,计算每条序列相对于标准离散源的离散增量;构建信号特征的启动子位置权重矩阵,计算其对应位置的位置权重打分函数,将所得到的两类参数输入支持向量机对果蝇启动子进行预测。结果:利用self-consistency和cross-validation两种方法对此算法进行检验,均获得了较高的预测成功率,结果表明五种转录因子结合位点的预测成功率均超过91%。结论:结果显示结合了支持向量机的离散增量算法能够有效的提高预测成功率,是进行真核生物启动子预测的一种很有效的方法。  相似文献   

6.
统计了大肠杆菌sigma70启动子在不同基因间的分布。计算了683条大肠杆菌sigma70启动子的每个位点六联体的保守性M6(l)值及涨落限,以大于涨落限7.2的21个保守位点的六联体频数作为参数,利用离散增量理论对大肠杆菌全序列进行启动子搜索。结果显示683条启动子序列被全部正确预测且得到126条预测序列,利用启动子在不同基因间的分布和TSS到TIS的距离分布进行二次筛选,推测其中的84条序列是实验未测定的启动子序列。  相似文献   

7.
准噶尔雅罗鱼β-肌动蛋白基因启动子克隆及序列分析   总被引:1,自引:0,他引:1  
利用PCR方法克隆了准噶尔雅罗鱼(Leuciscus merzbacheri)的β-actin基因启动子片段SZ21,大小是2398bp。对克隆的启动子序列进行了转录调控元件的生物信息学预测分析,同时,基于启动子中包含的开放阅读框和内含子序列,探讨了准噶尔雅罗鱼与鲤鱼(Cyprinus carpio)、草鱼(Ctenopharyngodon idella)、青鱼(Mylopharyngodon piceus)、团头鲂(Megalobrama amblycephala)、泥鳅(Misgurnus mizolepis)间的系统进化关系。结果显示,该启动子序列的3个核心启动子转录元件:CAAT-box、CArGmotif和TATA-box分别在转录起始位点(+1)上游的-89、-59、-26处,序列中还含有MEF2、SATB、CHRF、INRE、MTEN、E-box、RU49、ZBPF、CREB、Enhance region、CEBP位点等多种转录调控元件。在剪接体内含子中,剪接位点遵循GT…AG法则。启动子SZ21序列含有3个内含子和155个氨基酸。内含子1、内含子2、内含子3的系统发育分析表明,团头鲂与草鱼和青鱼的亲缘关系要比与准噶尔雅罗鱼的更近一些,这与传统分类中的亲缘关系显示不一致,其原因尚需探讨。  相似文献   

8.
以玉米基因组DNA为模板,通过PCR技术扩增得到了腺苷二磷酸葡萄糖焦磷酸化酶AGPase基因编码区上游1912 bp的启动子(AGPasep)序列.该序列包含TATA-box,CAAT-box等一些高等植物特有的启动子基本核心序列,推断其为一种新的启动子.为了验证该序列是否具有启动子功能,构建了含有此序列的植物表达载体pCAM-AGPasep,通过农杆菌介导法转化玉米愈伤组织进行瞬时表达.GUS染色结果表明,该序列可以驱动GUS基因的表达,具有启动子功能.  相似文献   

9.
目的:预测转录因子结合位点。方法:本文从ABS数据库上下载了人类和啮齿类动物的直系同源的启动子序列,首先使用位置打分函数对这些启动子序列进行打分,找到候选的转录因子结合位点,并进一步利用进化足迹法对这些候选的转录因子结合位点进行筛选,只有结合位点同时出现在人类和啮齿类动物的启动子序列才认为是真正的结合位点。结果:在对人类和啮齿类动物进行转录因子结合位点预测时,与单独使用打分函数的结果相比,进化足迹法与打分函数结合的方法有效的提高了预测结果的性能,大幅度提供所得预测结果的特异性。结论:进化足迹法结合位置打分矩阵的方法能较为准确有效的预测转录因子结合位点。  相似文献   

10.
LRP16基因启动子克隆及特征分析   总被引:7,自引:3,他引:4  
克隆LRP16基因启动子分子,并对启动子特征进行分析,预测启动子区调控元件,为深入研究LRP16基因的表达调控机制奠定基础。在NCBI的人类基因组数据库中截取并下载LRP16基因转录起始位点5′侧翼区2.7kb的基因组序列,设计PCR引物,从健康外周血单个核细胞中扩增,利用Genomatix程序对5′侧翼区近1000bp进行启动子特征分析,获得了与GenBank序列一致,长度为2.7kb的LRP16基因启动子DNA序列,该序列具有典型的真核生物RNA聚合酶Ⅱ启动子特征及多个核受体结合位点,如α视黄酸受体及RAR相关孤生受体。  相似文献   

11.
目的:构建PD-1(programmed death receptor 1)全长启动子及不同截短体的报告基因,并对其转录活性进行检测。方法:通过PCR及双酶切方法,从人全血基因组DNA中获得PD-1基因编码序列,包含不同长度碱基的PD-1启动子序列,分别克隆到报告基因pGL3-Basic载体上,构建8个不同长度PD-1启动子的报告基因;用脂质体转染法将8个报告基因分别转染至Jurkat细胞系;采用双萤光素酶报告基因系统评估PD-1启动子的活性。结果:经PCR方法扩增出大小分别为1650、1450、1250、1128、874、674、474和274 bp的不同长度的PD-1启动子序列,测序正确(与GenBank报道一致),酶切鉴定正确;瞬时转染Jurkat细胞系后经报告基因检测,8个启动子均具有转录活性。结论:构建了PD-1启动子的报告基因,并证实均有转录活性,且以pGL3-1128活性最高,为PD-1的核心启动子,为进一步研究PD-1的转录调控奠定了实验基础。  相似文献   

12.
The draft sequences of whole genomes are being published at an ever-increasing pace, thus providing access to the human genomic sequence and, more recently, the mouse sequence. Genomes of the invertebrates are also becoming available. Now that the genomic DNA of mammalian species is available, an old problem can be tackled with renewed vigour mammalian promoter prediction. Gene promoters have proved elusive for more than a decade, despite their pivotal role in gene regulation. Recently, however, several new developments have made it possible to make meaningful large-scale predictions. This paper reviews the methods used for the prediction of mammalian, mostly human, promoters.  相似文献   

13.
潘志锋  张静 《生物信息学》2010,8(4):325-329
不同基因的转录效率一般会有差异,启动子序列的组织结构可能是造成差异的原因之一。本文分别基于出现频率、Markov模型以及加权Markov模型计算出所有6碱基片段(6-mer)在不同转录频率的酵母基因启动子序列中的分布,然后利用最大最小贴近度方法分析这些基因启动子序列结构的差异情况。结果表明,酵母基因的转录频率与启动子序列结构的确有关联,转录频率相差较大的基因,它们的启动子序列结构差异一般也较大。统计分析还表明,高阶(3阶和4阶)加权Markov模型可以更有效地反映基因启动子序列的结构特征。  相似文献   

14.
15.
16.
17.
Majority of the promoter elements of mycobacteria do not function well in other eubacterial systems and analysis of their sequences has established the presence of only single conserved sequence located at the -10 position. Additional sequences for the appropriate functioning of these promoters have been proposed but not characterized, probably due to the absence of sufficient number of strong mycobacterial promoters. In the current study, we have isolated functional promoter-like sequences of mycobacteria from the pool of random DNA sequences. Based on the promoter activity in Mycobacterium smegmatis and score assigned by neural network promoter prediction program, we selected one of these promoter sequences, namely A37 for characterization in order to understand the structure of housekeeping promoters of mycobacteria. A37-RNAP complexes were subjected to DNase I footprinting and subsequent mutagenesis. Our results demonstrate that in addition to -10 sequences, DNA sequence at -35 site can also influence the activity of mycobacterial promoters by modulating the promoter recognition by RNA polymerase and subsequent formation of open complex. We also provide evidence that despite exhibiting similarities in -10 and -35 sequences, promoter regions of mycobacteria and Escherichia coli differ from each other due to differences in their requirement of spacer sequences between the two positions.  相似文献   

18.
目的 基于位点特异性打分矩阵(position-specific scoring matrices,PSSM)的预测模型已经取得了良好的效果,基于PSSM的各种优化方法也在不断发展,但准确率相对较低,为了进一步提高预测准确率,本文基于卷积神经网络(convolutional neural networks,CNN)算法做了进一步研究。方法 采用PSSM将启动子序列处理成数值矩阵,通过CNN算法进行分类。大肠杆菌K-12(Escherichia coli K-12,E.coli K-12,下文简称大肠杆菌)的Sigma38、Sigma54和Sigma70 3种启动子序列被作为正集,编码(Coding)区和非编码(Non-coding)区的序列为负集。结果 在预测大肠杆菌启动子的二分类中,准确率达到99%,启动子预测的成功率接近100%;在对Sigma38、Sigma54、Sigma70 3种启动子的三分类中,预测准确率为98%,并且针对每一种序列的预测准确率均可以达到98%以上。最后,本文以Sigma38、Sigma54、Sigma70 3种启动子分别和Coding区或者Non-coding区序列做四分类,预测得到的准确性为0.98,对3种Sigma启动子均衡样本的十交叉检验预测精度均可以达到0.95以上,海明距离为0.016,Kappa系数为0.97。结论 相较于支持向量机(support vector machine,SVM)等其他分类算法,CNN分类算法更具优势,并且基于CNN的分类优势,编码方式亦可以得到简化。  相似文献   

19.

Background  

Eukaryotic promoter prediction using computational analysis techniques is one of the most difficult jobs in computational genomics that is essential for constructing and understanding genetic regulatory networks. The increased availability of sequence data for various eukaryotic organisms in recent years has necessitated for better tools and techniques for the prediction and analysis of promoters in eukaryotic sequences. Many promoter prediction methods and tools have been developed to date but they have yet to provide acceptable predictive performance. One obvious criteria to improve on current methods is to devise a better system for selecting appropriate features of promoters that distinguish them from non-promoters. Secondly improved performance can be achieved by enhancing the predictive ability of the machine learning algorithms used.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号