首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
生物学通路被广泛应用于基因功能学研究, 但现有的生物学通路知识并不完善, 仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质-蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质-蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路, 然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database (HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质-蛋白质互作信息进行预测。结果表明, 在两套数据中, 随着互作邻居个数的增加, 预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中, 所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时, 预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID), 而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证, 至少有一个更新通路被预测正确的基因有50个, 其中43个基因的更新通路被完全正确预测, 相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。  相似文献   

2.
高磊  朱明珠  郭政  李霞 《生物信息学》2006,4(3):105-108
利用基因表达谱数据,通过计算互作蛋白质的表达相关系数,来筛选、优化蛋白质互作网络。结果显示,利用经过筛选的互作数据,根据邻居计数法和卡方法进行功能预测的预测效果明显提高,距离待测蛋白质较远的邻居也包含着与待测蛋白质功能一致的信息。  相似文献   

3.
细胞中的生理活动主要是通过蛋白质 - 蛋白质之间的相互作用来调控完成 . 详尽细致的蛋白质 - 蛋白质相互作用网络的解析对于理解细胞中复杂的调控、代谢和信号通路有重要的意义 . 近年来,关于新的蛋白质 - 蛋白质相互作用预测领域进展快速,这里,利用贝叶斯算法结合关联的 GO (Gene Ontology) ,来预测蛋白质的相互作用 . 利用非冗余的蛋白质相互作用数据来观察 GO 对的特性,得到 GO 关联的概率 . 通过阳性的和阴性的标准对照数据证实这个新方法可以很好地区别这两类不同的数据,显示出较好的灵敏度和非常低的假阳性预测率 . 通过与已知的高通量的实验数据比较,这个方法具有灵敏度高、速度快的优点 . 而且,运用这个新方法可以提供一些新的关于细胞内蛋白质之间相互作用的信息,为进一步的实验提供理论依据 .  相似文献   

4.
根据蛋白质互作网络预测乳腺癌相关蛋白质的细致功能   总被引:1,自引:0,他引:1  
王靖  李彦辉  郭政  朱晶  马文财  彭春方  刘庆 《遗传》2007,29(9):1061-1066
乳腺癌是最为常见的恶性肿瘤之一。已有的关于乳腺癌相关蛋白质的功能注释比较宽泛, 制约了乳腺癌的后续研究工作。对于已知部分功能的乳腺癌相关蛋白质, 提出了一种结合Gene Ontology功能先验知识和蛋白质互作的方法, 通过构建功能特异的局部相互作用网络来预测乳腺癌相关蛋白质的细致功能。结果显示该方法能够以很高的精确率为乳腺癌相关蛋白质预测更为精细的功能。预测的相关蛋白质的功能对于指导实验研究乳腺癌的分子机制具有重要的价值。  相似文献   

5.
挖掘高通量实验数据蕴含的生物学意义是蛋白质组学研究面临的一大挑战 . 基于等级化结构化的词汇表 GO (Gene Ontology) 和相关数据库中的蛋白质功能注释,发展了一种对蛋白质组学研究中得到的表达谱 (Expression profile) 进行功能分析的策略 . 在对蛋白质表达谱进行功能注释的基础上给出蛋白质表达谱中蛋白质功能的分布,同时给出感兴趣功能类别的统计信息 . 这有助于对表达谱蛋白质功能的整体理解和深入的生物信息学分析 . 该策略已经成功应用胎肝蛋白表达谱研究中,用户可以通过访问网址 http://www.hupo.org.cn/GOfact/ 使用或者下载我们的程序 .  相似文献   

6.
利用在多种应激条件下酵母的基因表达谱数据 ,分别计算互作蛋白质及复合物亚基编码基因的表达相关性。结果发现 ,相对于随机对照组 ,互作蛋白质的编码基因与蛋白质复合物的编码基因表达相关性均显著 (P <0 .0 1) ,即互作蛋白质及复合物亚基有共表达的倾向。通过比较 ,进一步发现蛋白质复合物亚基的基因表达相关性显著高于互作蛋白质的基因表达相关性 (P <0 .0 1) ,这与复合物亚基之间功能联系强于定义不甚确切的互作蛋白之间功能联系现象吻合。  相似文献   

7.
从大规模癌样本基因突变扫查数据中识别癌基因具有重要的意义. 一些重要功能的改变对于癌的发生发展是必需的, 因此将它们定义为癌功能类, 并从GO(Gene Ontology)中选择一组显著富集已知癌基因的细致功能类来代表它们. 为了评价以癌相关功能类作为特征识别癌基因的效果, 将已知的蛋白激酶癌基因定义为阳性金标准, 而将其他的蛋白激酶基因定义为阴性金标准. 结果表明, 与利用选择压力作为特征的方法比较, 利用癌相关功能类作为特征的方法可以更有效地识别癌基因. 进一步结合癌相关功能类与基因非同义突变个数可以产生更可靠的预测结果. 最后, 将46个注释到癌相关功能类并且其非同义突变个数至少为3的蛋白激酶基因预测为癌基因, 预测精确率达到0.42.  相似文献   

8.
对于功能部分已知的前列腺癌相关蛋白质,提出了一种基于Gent Ontology的功能特异的子网构建方法来细化其功能注释。结果显示该方法能够以很高的精确率为前列腺癌相关蛋白质预测更为精细的功能。预测的相关蛋白质的功能对于指导实验研究前列腺癌的分子机制具有重要的价值。  相似文献   

9.
结合基因功能分类体系Gene Ontology筛选聚类特征基因   总被引:3,自引:0,他引:3  
使用两套基因表达谱数据,按各基因的表达值方差,选择表达变异基因对样本聚类,发现一般使用方差较大的前10%的基因作为特征基因,就可以较好地对疾病样本聚类。对不同的疾病,包含聚类信息的特征基因有不同的分布特点。在此基础上,结合基因功能分类体系(Gene Ontology,GO),进一步筛选聚类的特征基因。通过检验在Gene Ontology中的每个功能类中的表达变异基因是否非随机地聚集,寻找疾病相关功能类,再根据相关功能类中的表达变异基因进行聚类分析。实验结果显示:结合基因功能体系进一步筛选表达变异基因作为聚类特征基因,可以保持或提高聚类准确性,并使得聚类结果具有明确的生物学意义。另外,发现了一些可能和淋巴瘤和白血病相关的基因。  相似文献   

10.
王敏  王靖  肖会  龚雪  郭政 《生物信息学》2009,7(3):223-226
口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)是人类最常见的恶性肿瘤之一。本文结合Gene Ontology,功能先验知识,通过构建功能特异的蛋白质互相作用子网来预测口腔癌相关蛋白质的功能。我们以很高的精确率为已知部分功能的口腔癌相关蛋白质预测了更为精细的功能,这对于指导实验研究口腔癌的分子机制具有重要的价值。  相似文献   

11.
蛋白质功能注释是后基因组时代研究的核心内容之一,基于蛋白质相互作用网络的蛋白质功能预测方法越来越受到研究者们的关注.提出了一种基于贝叶斯网络和蛋白质相互作用可信度的蛋白质功能预测方法.该方法在功能预测过程中为待注释的蛋白质建立贝叶斯网络预测模型,并充分考虑了蛋白质相互作用的可信度问题.在构建的芽殖酵母数据集上的三重交叉验证测试表明,在功能预测过程中考虑蛋白质可信度能够有效地提高功能预测的性能.与现有一些算法相比,该方法能够给出令人满意的预测效果.  相似文献   

12.
Gene Ontology广泛地应用于基于基因芯片数据的差异表达功能类分析。基因芯片技术存在检测缺失与检测误差等问题。本文探讨上述这二个因素对利用基因表达谱挖掘Gene Ontology中差异表达功能类的影响。结果显示,差异表达功能类对于检测缺失与检测误差干扰等有一定的稳健性。  相似文献   

13.
基于蛋白质网络功能模块的蛋白质功能预测   总被引:1,自引:0,他引:1  
在破译了基因序列的后基因组时代,随着系统生物学实验的快速发展,产生了大量的蛋白质相互作用数据,利用这些数据寻找功能模块及预测蛋白质功能在功能基因组研究中具有重要意义.打破了传统的基于蛋白质间相似度的聚类模式,直接从蛋白质功能团的角度出发,考虑功能团间的一阶和二阶相互作用,提出了模块化聚类方法(MCM),对实验数据进行聚类分析,来预测模块内未知蛋白质的功能.通过超几何分布P值法和增、删、改相互作用的方法对聚类结果进行预测能力分析和稳定性分析.结果表明,模块化聚类方法具有较高的预测准确度和覆盖率,有很好的容错性和稳定性.此外,模块化聚类分析得到了一些具有高预测准确度的未知蛋白质的预测结果,将会对生物实验有指导意义,其算法对其他具有相似结构的网络也具有普遍意义.  相似文献   

14.
高通量的蛋白质互作数据与结构域互作数据的出现,使得在蛋白质组学领域内研究人类蛋白质结构互作网络,进一步揭示蛋白质结构与功能间的潜在关系成为可能.蛋白质上广泛分布的结构域被认为是蛋白质结构、功能以及进化的基本功能单元.然而,结合蛋白质的结构信息(例如蛋白质结构域数目、长度和覆盖率等)来研究这些表象后的内部机制仍然面临着挑战.将蛋白质分为单结构域蛋白质与多结构域蛋白质,并进一步结合蛋白质互作信息与结构域互作信息构建了人类蛋白质结构互作网络;通过与人类蛋白质互作网络进行比较,研究了人类蛋白质结构互作网络的特殊结构特征;对于单结构域蛋白质与多结构域蛋白质,分别进行了功能富集分析、功能离散度分析以及功能一致性分析等.结果发现,将结构域互作信息综合考虑进来后,人类蛋白质结构互作网络可以提供更多的单纯的蛋白质互作网络无法提供的细节信息,揭示蛋白质互作网络的复杂性.  相似文献   

15.
GO功能类与基因差异表达的关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对基因功能分类体系Gene Ontology的层次结构特点,修改关联规则挖掘算法Apriori,开发“挖掘与基因差异表达关联的GO功能组合”软件(RuleGO).RuleGO以基因表达谱上的差异表达基因集合和不差异表达基因集合为输入,输出组合特征功能类与基因差异表达现象的关联规则,有助于解释基因差异表达现象的本质原因,如疾病发病机制、药物作用机理等.将RuleGO 和OntoExpress应用在结肠癌和腺癌表达谱数据集上,结果显示,RuleGO比OntoExpress能发现更多的与差异表达现象关联的特征功能类,更能看到在OntoExpress上不能发现的组合特征功能类.另外,结果显示,将规则的置信度和支持度要求设置较高时,一般只有组合功能类才能满足要求,这提示在基因表达谱分析中不宜采用单个角度的单个功能分类单元,考虑功能分类单元的组合可能更有意义.  相似文献   

16.
提出了一种蛋白质相互作用的相似性度量,将其与基因表达数据的相似性度量相结合,定义了一种融合的距离度量,并且将这种融合的距离度量用于改进现有的K—means聚类方法。经过实际数据的检验,改进后的K—means方法比常用的其它几种聚类方法具有更好的效果,说明结合蛋白质相互作用数据可以使得基因表达聚类的结果更有生物意义。  相似文献   

17.
脑缺血缺氧会引起长链非编码RNA (long non-coding RNA, lncRNA)表达变化。为了探究lncRNA BDNF-AS在氧糖剥夺/复氧复糖条件下的表达、定位及互作蛋白质,将SH-SY5Y细胞缺氧缺糖8 h、复氧复糖24 h,构建氧糖剥夺/复氧复糖细胞模型;采用CCK-8 (Cell Counting Kit-8)法检测细胞活力;采用qRT-PCR检测核质中lncRNA BDNF-AS表达水平;利用pull-down和质谱技术对lncRNA BDNF-AS互作蛋白质进行鉴定;利用基因本体论(Gene Ontology, GO)、京都基因和基因组数据库(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析互作蛋白质的功能及参与的通路;利用STRING数据库分析蛋白质-蛋白质相互作用网络。结果显示:氧糖剥夺/复氧复糖条件下, lncRNA BDNF-AS表达量显著升高,且胞质表达量显著高于胞核;氧糖剥夺/复氧复糖组有120种蛋白质可能与lncRNA BDNF-AS存在潜在的相互作用。进一步的生物信息学分析表明,lncRNA-BDN...  相似文献   

18.
GoPipe: 批量序列的Gene Ontology 注释和统计分析   总被引:7,自引:0,他引:7  
随着后基因组时代的到来,批量的测序,特别是 EST 的测序,逐渐成为普通实验室的日常工作 . 这些新的序列往往需要进行批量的 Gene Ontology (GO) 的注释及随后的统计分析 . 但是目前除了 Goblet 以外,并没有软件适合对未知序列进行批量的 GO 注释,而 GoBlet 因为具有上载量的限制,以及仅仅利用 BLAST 作为预测工具,所以仍有许多不足之处 . 开发了一个软件包 GoPipe ,通过整合 BLAST 和 InterProScan 的结果来进行序列注释,并提供了进一步作统计比较的工具 . 主程序接收任意个 BLAST 和 InterProScan 的结果文件,并依次进行文本分析、数据整合、去除冗余、统计分析和显示等工作 . 还提供了统计的工具来比较不同输入对 GO 的分布来挖掘生物学意义 . 另外,在交集工作模式下,程序取 InterProScan 和 BLAST 结果的交集, 在测试数据集中,其精确度达到 99.1% ,这大大超过了 InterProScan 本身对 GO 预测的精确度,而敏感度只是稍微下降 . 较高的精确度、较快的速度和较大的灵活性使它成为对未知序列进行批量 Gene Ontology 注释的理想的工具 . 上述软件包可以在网站 (http://gopipe.fishgenome.org/ ) 免费获得或者与作者联系获取 .  相似文献   

19.
从蛋白质序列出发,采用分组重量编码(Encoding Based on Grouped Weight,简记EBGW),并结合最近邻居算法对蛋白质功能进行预测。对酵母(Saccharomyces cerevisiae)蛋白质的1826条序列进行预测,整体预测准确率与其他基于序列信息的蛋白质功能预测方法相当。实验结果表明基于EBGW编码方案的新方法可有效地应用于蛋白质功能预测。  相似文献   

20.
蛋白质是生物体内最必需也是最通用的大分子,对它们功能的认识对于科学领域和农业领域的发展有着至关重要的作用。随着后基因组时代的发展,NCBI数据库中迅速涌现出大量不明结构与功能的蛋白质序列,这些蛋白质序列甚至一跃成了研究的热点。近几十年来蛋白质功能预测的方法不断被完善。由最初的仅基于蛋白质序列或3D结构信息的方法衍生出更多的基于序列相似性、基于结构基序、基于相互作用网络等新方法,这些新型方法采用新的算法、新的研究思路和技术手段,力求得到准确性与普遍性并存,能够被广泛应用的蛋白质功能预测方法。本文综述了近年来蛋白质功能预测的方法,并将这些研究方法分类归纳,各自阐明了每类方法的优缺点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号