首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
刘佳  蔡禄  邢永强 《生物信息学》2010,8(4):341-343,346
蛋白质是一切生命活动的物质基础,研究蛋白质的相互作用有助于理解生物过程的分子机制,阐明疾病的分子机理。本文依据蛋白质序列组分特征,应用基于多样性增量的二次判别分析方法,对人类的1 963对蛋白质相互作用进行了预测。自洽检验的各项预测指标均在79%以上,且交叉检验的总精度也大于60%,表明本算法可以用于蛋白质相互作用预测。  相似文献   

2.
基于相互作用的蛋白质功能预测   总被引:1,自引:0,他引:1  
蛋白质功能预测是后基因时代研究的热点问题。基于相互作用的蛋白质功能预测方法目前应用比较广泛,但是当"伙伴蛋白质"(interacting partners)数目k较小时,其预测准确率不高。从蛋白质相互作用网络入手,结合"小世界网络"特性,有效解决了k较小时预测准确率不高的问题。对酵母(Saccharomyces cerevisiae)蛋白质的相互作用网络进行预测,当k≤4时其预测准确率比相同条件下的GO(global optimization)方法有一定提高。实验结果表明:该方法能够有效的应用于伙伴蛋白质数目较小时的蛋白质功能预测。  相似文献   

3.
用离散量预测蛋白质的结构型   总被引:12,自引:2,他引:12  
基于蛋白质的结构类型决定了它的二级结构序列的概念,用二级结构序列参数Nα,Nβ,Nβaβ,N(βαβ)构成离散源,并计算离散量D(Xα),D(Xβ),D(Xα+β),利用离散增量预测蛋白质的结构类型,它是由这个蛋白质的离散量D(Xn)与四个标准离散D(Xα),D(Xβ),D(Xα/β),D(Xα+β)之间离散增量的最小值所决定的,预测结果表明,准确率分别达到84.8%(标准集)和83.3%(检验集)。  相似文献   

4.
为提高蛋白质-蛋白质相互作用(protein-protein interaction, PPI)预测的准确性,并深入探索细胞信号传导和疾病发生的生物学机制,本文提出一种简称为CBSG-PPI的预测算法。该算法首先利用3层前馈网络来处理蛋白质的k-mer特征,采用CT方法和Bert方法提取蛋白质的氨基酸序列以及使用卷积神经网络提取蛋白质的序列特征,再结合图神经网络和多层感知机来准确预测PPI。与现有的预测技术相比,CBSG-PPI在准确率、 F1分数、召回率和精确率等多个关键性能指标上展现了明显的优势,在公开数据集上分别达到了0.855、 0.853、 0.840和0.866的高分。此外,本算法采用了一种改进的参数调整方法,显著提高了计算效率,其预测速度比传统算法快了约140倍。这一显著的性能提升,不仅证实了CBSG-PPI在预测PPI方面的研究价值,也为未来蛋白质间相互作用网络的构建和分析提供了有用的计算工具。  相似文献   

5.
蛋白质功能注释是后基因组时代研究的核心内容之一,基于蛋白质相互作用网络的蛋白质功能预测方法越来越受到研究者们的关注.提出了一种基于贝叶斯网络和蛋白质相互作用可信度的蛋白质功能预测方法.该方法在功能预测过程中为待注释的蛋白质建立贝叶斯网络预测模型,并充分考虑了蛋白质相互作用的可信度问题.在构建的芽殖酵母数据集上的三重交叉验证测试表明,在功能预测过程中考虑蛋白质可信度能够有效地提高功能预测的性能.与现有一些算法相比,该方法能够给出令人满意的预测效果.  相似文献   

6.
预测蛋白质间相互作用的生物信息学方法   总被引:8,自引:0,他引:8  
后基因组时代的研究模式,已从原来的序列-结构-功能转向基因表达-系统动力学-生理功能。建立蛋白质间相互作用的完全网络,即蛋白质相互作用组(interactome),将有助于从系统角度加深对细胞结构和功能的认识,并为新药靶点的发现和药物设计提供理论基础。一系列系统分析蛋白质相互作用的实验方法已经建立,近年来,出现了多种预测蛋白质相互作用的生物信息学方法,这些方法不仅是对传统实验方法的有价值的补充,而且能够扩展实验方法的预测范围;同时,在开发这些方法的过程中建立了一些重要的分子进化和分子生物学慨念。本文综述了9种生物信息学方法的原理、方法评估、存在的问题.并分析了这个领域的发展前景。  相似文献   

7.
庞尔丽 《生物学通报》2012,47(11):11-14
蛋白质行使功能时,需要与其他蛋白质或者其他分子相互作用才能完成.在蛋白质相互作用水平上研究蛋白质对理解蛋白质功能、疾病与进化具有重要的意义.就蛋白质相互作用的预测、常用的蛋白质相互作用数据库以及蛋白质相互作用网络的研究进行了介绍.  相似文献   

8.
蛋白质相互作用的生物信息学研究进展   总被引:2,自引:0,他引:2  
生命过程的分子基础在于生物分子之间的相互作用,其中蛋白质分子之间的相互作用占有极其重要的地位。研究蛋白质相互作用对于理解生命的真谛、探讨致病微生物的致病机理,以及研究新药提高人们的健康水平具有重要的作用。用生物信息学的方法研究蛋白质的相互作用已经取得了许多重要的成果,但也有很多问题还需解决。本文从蛋白质相互作用的数据库、预测方法、可预测蛋白质相互作用的网上服务、蛋白质相互作用网络等几方面,对蛋白质相互作用的生物信息学研究成果及其存在的问题做了概述。  相似文献   

9.
DNA甲基化作为直接作用于DNA序列的一种表观遗传修饰,能够在不改变DNA分子一级结构的情况下影响基因表达,在生命活动中扮演着重要的角色.在哺乳动物中,DNA甲基化主要发生在C_pG二核苷酸的胞嘧啶上,并且在基因组中呈现不均匀分布.准确预测DNA甲基化位点有助于阐明DNA甲基化对基因表达的调控作用,并为肿瘤的早期诊断及治疗提供新的依据.本文应用离散增量结合二次判别分析的方法,对人类的C_pG二核苷酸甲基化状态进行了识别.5折交叉检验的整体准确率超过了80%,受试者操作特性曲线面积也达到了0.86.与现有方法相比,预测成功率显著提高.这说明离散增量结合二次判别分析方法适用于甲基化位点的预测;基因组序列中甲基化位点具有序列依赖性.  相似文献   

10.
随着“蛋白质组学”的蓬勃发展和人类对生物大分子功能机制的知识积累,涌现出海量的蛋白质相互作用数据。随之,研究者开发了300多个蛋白质相互作用数据库,用于存储、展示和数据的重利用。蛋白质相互作用数据库是系统生物学、分子生物学和临床药物研究的宝贵资源。本文将数据库分为3类:(1)综合蛋白质相互作用数据库;(2)特定物种的蛋白质相互作用数据库;(3)生物学通路数据库。重点介绍常用的蛋白质相互作用数据库,包括BioGRID、STRING、IntAct、MINT、DIP、IMEx、HPRD、Reactome和KEGG等。  相似文献   

11.
支持向量机(SVM)是广泛应用于各个领域的分类算法,包括生物信息学。本研究应用SVM作为蛋白质相互作用的分类算法,所用蛋白质相互作用数据下载于墨尼黑生物信息学中心的酿酒酵母数据集,包含有6736条蛋白质,其中相互作用的有4837对,不相互作用的有9674对。提取蛋白质主要结构的电荷和等电位点特征,并应用SVM分类算法对此进行了分类。结果显示,分类的正确率在60%左右,但是较系统发育谱法还是获得了较高的分类正确率。  相似文献   

12.
The conotoxin proteins are disulfide rich small peptides that target ion channels and G protein coupled receptors. And they provide promising application in treating some chronic pain, epilepsy, cardiovascular diseases, and so on. Conotoxins may be classified into 11 superfamilies: A, D, I1, I2, J, L, M, O, P, S, and T according to the disulfide connectivity, highly conserved N-terminal precursor sequence and similar mode of actions. Successful prediction mature conotoxin superfamily peptide has important signification for the biological and pharmacological functions of the toxins. In this study, a new algorithm of increment of diversity combined with modified Mahalanobis discriminant is presented to predict five superfamilies by using the pseudo amino acid composition. The results of jackknife cross-validation test show that the overall prediction sensitivity and specificity are 88% and 91%, respectively. The predictive algorithm is also used to predict three O-conotoxin families. The 72% sensitivity and 78% specificity are obtained. These results indicate that the conotoxin superfamily peptides correlate with their amino acid compositions.  相似文献   

13.
给出了一种基于信息理论的距离系数,这一新的信息系数是通过对信息论中的离散增量系数改进而得,并证明其满足距离系数的三个性质.将其应用于一组同源辅助蛋白的聚类分析,表明是可行的.与离散增量系数及经典的欧氏距离系数的聚类结果进行比较,应用相干系数对聚类结果进行评价,结果表明由新信息距离系数所确定的聚类结构与聚类数据问的拟合程度最好.  相似文献   

14.
基于氨基酸序列,用打分值、离散增量、自相关函数值和距离值来表示β-发夹模体信息,通过二次判别方法对上述信息进行融合,预测数据库ArchDB40和EVA中的β-发夹模体。文章使用的β-发夹模体包含的loop长为2~10个氨基酸,当序列模式长为17个氨基酸时,对两个数据库中β-发夹5交叉检验预测的总精度分别达到83.1%和80.7%,相关系数达到0.59和0.61,好于前人的预测结果。  相似文献   

15.
陈伟  罗辽复 《生物信息学》2009,7(2):159-162
应用多样性增量结合二次判别分析(Increment of Diversity with Quadratic Discriminant analysis, IDQD)方法,对酵母基因组中的核小体强/弱偏好序列进行了识别。10交叉检验的预测成功率超过了97%,受试者操作特性(receiver operating characteristic,ROC)曲线下面积达到了0.99,预测成功率高于现有SVM算法。最后利用构建好的分类器对酵母基因组中三类包含TATA盒基因的起始密码子ATC上游400nt下游100nt区域进行了分析。结果表明,IDQD算法有能力应用于基因组中核小体序列的识别。  相似文献   

16.
Network biology integrates different kinds of data, including physical or functional networks and disease gene sets, to interpret human disease. A clique (maximal complete subgraph) in a protein-protein interaction network is a topological module and possesses inherently biological significance. A disease-related clique possibly associates with complex diseases. Fully identifying disease components in a clique is conductive to uncovering disease mechanisms. This paper proposes an approach of predicting disease proteins based on cliques in a protein-protein interaction network. To tolerate false positive and negative interactions in protein networks, extending cliques and scoring predicted disease proteins with gene ontology terms are introduced to the clique-based method. Precisions of predicted disease proteins are verified by disease phenotypes and steadily keep to more than 95%. The predicted disease proteins associated with cliques can partly complement mapping between genotype and phenotype, and provide clues for understanding the pathogenesis of serious diseases.  相似文献   

17.
Since December 2001, we have been conducting a project to isolateand determine entire sequences of mouse KIAA cDNA clones, whichencode polypeptides corresponding to human KIAA proteins. Theultimate goal of this project has been elucidation of the functionsof KIAA proteins. To address this issue, we have been generating‘libraries’ of antibodies against mKIAA proteins.We have, to date, already generated >800 antibodies. Usingour ‘libraries’ of antibodies, we are now identifyingendogenous mKIAA protein–protein interactions. In thepresent study, novel interactions were identified by MS/MS analysisfollowing immunoprecipitation with anti-mKIAA antibodies. Theinteractions with biologically known molecules should enableus to predict the function of mKIAA/KIAA proteins, includinghypothetical proteins identified in our cDNA project. Theseinteractions are subsequently used for construction of an intracellularpathway related to the mKIAA protein, and the pathway is distributedthrough the InCeP (IntraCellular Pathway based on mKIAA protein–proteininteractions) database. Users can freely access the InCeP throughthe internet and download the graphical display as well as thecurated information.  相似文献   

18.
张颖  贾芸  吕军 《生物物理学报》2007,23(6):475-481
应用多样性增量结合二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法,对大肠杆菌σ^70启动子进行识别。使用受试者操作特性(receiver operating characteristic,ROC)曲线和精度召回率曲线(Precision Recall Curves,PRC)进行性能评估。10-fold交叉检验给出,在正负集之比为1:1时,ROC曲线下面积和PRC曲线下面积均为95%。结果表明,IDQD算法有能力应用于原核启动子的识别。识别精度高于现有算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号