首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
蛋白质亚细胞定位的识别   总被引:3,自引:2,他引:3  
根据蛋白质的亚细胞定位,将蛋白质分为12类,用离散量的数学理论,以蛋白质中400个氨基酸二联体数目构成离散源,通过计算离散增量预测蛋白质的亚细胞定位,用Self-consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:Self-consistency方法预测成功率为84.5%,Jackknife方法预测成功率为81.1%。  相似文献   

2.
蛋白质亚细胞定位预测对蛋白质的功能、相互作用及调控机制的研究具有重要意义。本文基于物化性质和结构性质对氨基酸的约化,描述序列局部和全局信息的"组成"、"转换"和"分布"特征,并利用氨基酸亲疏水性的数值统计特征,提出了一种新的蛋白质特征表示方法(NSBH)。分别使用三种分类器KNN、SVM及BP神经网络进行蛋白质亚细胞定位预测,比较了几种方法和特征融合方法的预测结果,显示融合特征表示及结合SVM分类器时能够达到更好的预测准确率。同时,还详细讨论了不同参数对实验结果的影响,具体的实验及比较结果显示了该方法的有效性。  相似文献   

3.
蛋白质的亚细胞定位是进行蛋白质功能研究的重要信息.蛋白质合成后被转运到特定的细胞器中,只有转运到正确的部位才能参与细胞的各种生命活动,有效地发挥功能.尝试了将保守序列及蛋白质相互作用数据的编码信息结合传统的氨基酸组成编码,采用支持向量机进行蛋白质亚细胞定位预测,在真核生物中5轮交叉验证精度达到91.8%,得到了显著的提高.  相似文献   

4.
文中提出了一种简单有效的蛋白质亚细胞区间定位预测方法,为进一步了解蛋白质的功能和性质提供理论基础。运用稀疏编码,结合氨基酸组成信息提取蛋白质序列特征,基于不同字典大小对得到的特征进行多层次池化整合,并送入支持向量机进行分类。经Jackknife检验,在数据集ZD98、CH317和Gram1253上的预测成功率分别达到95.9%、93.4%和94.7%。实验证明基于多层次稀疏编码的分类预测算法能显著提高蛋白质亚细胞区间定位的预测精度。  相似文献   

5.
【目的】Rv3194c基因编码的是结核分枝杆菌的PDZ信号蛋白,本研究探讨该蛋白的亚细胞定位,为其细胞结合蛋白的筛选奠定基础。【方法】从H37Rv基因组中扩增出编码只含有PDZ结构域的tRv3194c (Rv3194c 1–234 aa)的基因片段,在3′端加T2A和EGFP序列,一并插入真核表达载体构建出pcDNA3.1-tRv3194c-T2A-EGFP。将构建好的质粒瞬时转染L929细胞,并共感染重组痘苗病毒vTF7-3,用间接免疫荧光、流式细胞分选以及Western blotting检测融合蛋白的表达以及亚细胞定位。【结果】成功构建出真核表达载体pcDNA3.1-tRv3194c-T2A-EGFP,瞬时转染L929细胞后融合蛋白tRv3194c定位于线粒体膜上,且重组痘苗病毒vTF7-3的感染有助于靶蛋白表达水平的提高。【结论】Rv3194蛋白的PDZ结构域与线粒体外膜相关蛋白结合,为了解该蛋白在细胞内的致病机制提供重要线索。  相似文献   

6.
用离散增量结合支持向量机方法预测蛋白质亚细胞定位   总被引:3,自引:0,他引:3  
赵禹  赵巨东  姚龙 《生物信息学》2010,8(3):237-239,244
对未知蛋白的功能注释是蛋白质组学的主要目标。一个关键的注释是蛋白质亚细胞定位的预测。本文应用离散增量结合支持向量机(ID_SVM)的方法,对阳性革兰氏细菌蛋白的5类亚细胞定位点进行预测。在独立检验下,其总体预测成功率为89.66%。结果发现ID_SVM算法对预测的成功率有很大改进。  相似文献   

7.
蛋白质的亚细胞定位与蛋白质的功能密切相关,其定位预测有助于人们了解蛋白质功能.文章提出一种分段伪氨基酸组成成分特征提取方法,采用支持向量机算法对Chou构建的两个蛋白质亚细胞定位数据集(C2129,CS2423)进行了分类研究,并采用总分类精度Q3、内容平衡精度指数Q9等参数评估预测分类系统性能.预测结果表明,基于分段伪氨基酸组成成分特征提取方法的预测性能,优于基于完整蛋白质序列的伪氨基酸组成成分特征提取方法.例如,基于分段矩描述子伪氨基酸组成成分特征提取方法,数据集C2129的Q3和Q9分别为84.7%和60.8%,比基于完整蛋白质序列的矩描述子伪氨基酸组成成分特征提取方法分别提高1.8和2.2个百分点,且Q3比现有Xiao等人的方法提高了9.1个百分点.基于分段伪氨基酸组成成分特征提取方法构成的特征向量不仅包含残基之间的位置信息,而且还包含蛋白质子序列之问的耦合信息,另外蛋白质分段子序列可能和蛋白质的功能域有一定的联系,从而使这一方法能够有效地预测蛋白质亚细胞定位.  相似文献   

8.
《生物技术世界》2008,(3):81-81
我们知道,对蛋白质在细胞中的特异定位,可以增进我们对该蛋白质以及与该蛋白互作的其他蛋白功能的了解,确定蛋白质位置的一个方法是。在其上加一特异抗体。即对其贴上标签,然后加入能同此抗体特异结合的探针,最后用显微镜确定此探针在细胞中的位置。  相似文献   

9.
张振慧  王勇献  王正华 《激光生物学报》2007,16(2):249-252,F0003
细胞凋亡蛋白对生物体的发育、维持内环境稳定及人们理解细胞凋亡机制非常重要。文中提出了一种新的蛋白质序列特征提取方法—三肽离散源方法。计算了蛋白质序列中紧邻三联体的出现个数,利用离散增量极小化对凋亡蛋白进行定位预测;同时推广了张春霆等提出的内容平衡精度指数,使其能评估任意类的分类问题。实验结果表明:在凋亡蛋白定位预测研究中,三肽离散源方法在提高总体预测精度的同时,能够较好的解决样本不均衡问题;而内容平衡精度指数能比传统的总体预测精度更准确的评估预测算法的预测能力,有效的反映预测算法对样本不均衡问题的相容能力。  相似文献   

10.
本文建立了一个最新的蛋白质亚线粒体定位数据集,包含4个亚线粒体定位的1 293条序列,结合基因本体(GO)信息和同源信息对线粒体蛋白质进行特征提取,利用支持向量机算法建立分类器,经Jackknife检验,对于4个亚线粒体位置的总体预测准确率为93.27%,其中3个亚线粒体位置的总体预测准确率为94.73%.  相似文献   

11.
DNA甲基化作为直接作用于DNA序列的一种表观遗传修饰,能够在不改变DNA分子一级结构的情况下影响基因表达,在生命活动中扮演着重要的角色.在哺乳动物中,DNA甲基化主要发生在C_pG二核苷酸的胞嘧啶上,并且在基因组中呈现不均匀分布.准确预测DNA甲基化位点有助于阐明DNA甲基化对基因表达的调控作用,并为肿瘤的早期诊断及治疗提供新的依据.本文应用离散增量结合二次判别分析的方法,对人类的C_pG二核苷酸甲基化状态进行了识别.5折交叉检验的整体准确率超过了80%,受试者操作特性曲线面积也达到了0.86.与现有方法相比,预测成功率显著提高.这说明离散增量结合二次判别分析方法适用于甲基化位点的预测;基因组序列中甲基化位点具有序列依赖性.  相似文献   

12.
用离散量的方法识别蛋白质的超二级结构   总被引:1,自引:0,他引:1  
用离散量的方法,对2208个分辨率在2.5I以上的高精度的蛋白质结构中四类超二级结构进行了识别。从蛋白质一级序列出发,以氨基酸(20种氨基酸加一个空位)和其紧邻关联共同为参数,当序列模式固定长取8个氨基酸残基时,对“822”序列模式3交叉检验的平均预测精度达到78.1%,jack-knife检验的平均预测精度达到76.7%;当序列模式固定长取10个氨基酸残基时,对“1041”序列模式3交叉检验的平均预测精度达到83.1%,jack-knife检验的平均预测精度达到79.8%。  相似文献   

13.
The conotoxin proteins are disulfide rich small peptides that target ion channels and G protein coupled receptors. And they provide promising application in treating some chronic pain, epilepsy, cardiovascular diseases, and so on. Conotoxins may be classified into 11 superfamilies: A, D, I1, I2, J, L, M, O, P, S, and T according to the disulfide connectivity, highly conserved N-terminal precursor sequence and similar mode of actions. Successful prediction mature conotoxin superfamily peptide has important signification for the biological and pharmacological functions of the toxins. In this study, a new algorithm of increment of diversity combined with modified Mahalanobis discriminant is presented to predict five superfamilies by using the pseudo amino acid composition. The results of jackknife cross-validation test show that the overall prediction sensitivity and specificity are 88% and 91%, respectively. The predictive algorithm is also used to predict three O-conotoxin families. The 72% sensitivity and 78% specificity are obtained. These results indicate that the conotoxin superfamily peptides correlate with their amino acid compositions.  相似文献   

14.
陈伟  罗辽复 《生物信息学》2009,7(2):159-162
应用多样性增量结合二次判别分析(Increment of Diversity with Quadratic Discriminant analysis, IDQD)方法,对酵母基因组中的核小体强/弱偏好序列进行了识别。10交叉检验的预测成功率超过了97%,受试者操作特性(receiver operating characteristic,ROC)曲线下面积达到了0.99,预测成功率高于现有SVM算法。最后利用构建好的分类器对酵母基因组中三类包含TATA盒基因的起始密码子ATC上游400nt下游100nt区域进行了分析。结果表明,IDQD算法有能力应用于基因组中核小体序列的识别。  相似文献   

15.
The outer membrane proteins (OMPs) are β-barrel membrane proteins that performed lots of biology functions. The discriminating OMPs from other non-OMPs is a very important task for understanding some biochemical process. In this study, a method that combines increment of diversity with modified Mahalanobis Discriminant, called IDQD, is presented to predict 208 OMPs, 206 transmembrane helical proteins (TMHPs) and 673 globular proteins (GPs) by using Chou's pseudo amino acid compositions as parameters. The overall accuracy of jackknife cross-validation is 93.2% and 96.1%, respectively, for three datasets (OMPs, TMHPs and GPs) and two datasets (OMPs and non-OMPs). These predicted results suggest that the method can be effectively applied to discriminate OMPs, TMHPs and GPs. And it also indicates that the pseudo amino acid composition can better reflect the core feature of membrane proteins than the classical amino acid composition.  相似文献   

16.
蛋白质亚细胞定位信息对深入研究蛋白质的细胞生物学功能十分重要.通过Helix Systems在线计算程序和Vor计算程序两种方法讨论了蛋白质的体积对其亚细胞定位的影响,发现定位于细胞外的蛋白质体积显著小于定位于细胞核、细胞膜和细胞质的蛋白体积,证实了体积参数对区分蛋白质的亚细胞定位是有效的.  相似文献   

17.
膜蛋白是生物膜功能的主要体现者,是细胞执行各种功能的物质基础,在细胞中发挥着至关重要的作用.分类预测未知类型的膜蛋白对于生物学相关研究具有指导性意义,是膜蛋白结构与功能研究领域的一项重要基础性工作.针对膜蛋白分类预测问题,利用k子串离散源的方法对膜蛋白序列进行特征提取,并融合最小离散增量方法和加权K近邻算法构建一种新型的膜蛋白分类预测模型,在自检验、Jackknife检验和独立测试集检验三种典型的检验方式下,预测准确率分别为99.95%、86.16%和98.36%.实验结果表明,k子串离散源方法能够有效提取膜蛋白序列的特征信息,与现有方法相比,该分类模型具有较高的分类预测成功率.  相似文献   

18.
统计了大肠杆菌sigma70启动子在不同基因间的分布。计算了683条大肠杆菌sigma70启动子的每个位点六联体的保守性M6(l)值及涨落限,以大于涨落限7.2的21个保守位点的六联体频数作为参数,利用离散增量理论对大肠杆菌全序列进行启动子搜索。结果显示683条启动子序列被全部正确预测且得到126条预测序列,利用启动子在不同基因间的分布和TSS到TIS的距离分布进行二次筛选,推测其中的84条序列是实验未测定的启动子序列。  相似文献   

19.
Apoptosis proteins are very important for understanding the mechanism of programmed cell death. The apoptosis protein localization can provide valuable information about its molecular function. The prediction of localization of an apoptosis protein is a challenging task. In our previous work we proposed an increment of diversity (ID) method using protein sequence information for this prediction task. In this work, based on the concept of Chou's pseudo-amino acid composition [Chou, K.C., 2001. Prediction of protein cellular attributes using pseudo-amino acid composition. Proteins: Struct. Funct. Genet. (Erratum: Chou, K.C., 2001, vol. 44, 60) 43, 246-255, Chou, K.C., 2005. Using amphiphilic pseudo-amino acid composition to predict enzyme subfamily classes. Bioinformatics 21, 10-19], a different pseudo-amino acid composition by using the hydropathy distribution information is introduced. A novel ID_SVM algorithm combined ID with support vector machine (SVM) is proposed. This method is applied to three data sets (317 apoptosis proteins, 225 apoptosis proteins and 98 apoptosis proteins). The higher predictive success rates than the previous algorithms are obtained by the jackknife tests.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号