首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
肺癌致病基因的发现及预测有助于认识肺癌的发生机理、诊断与防治,是人类基因组研究的重要目标。应用现有二元网络重启随机游走算法预测致病基因时,一般先在疾病表型网络、蛋白质作用网络及疾病-蛋白质二分图网络内随机游走一步,然后进行网络间跳转,这种策略不仅搜索效率较低,还可能遗漏蛋白质(或疾病)网络中的局部拓扑信息。鉴于此,作者提出一种二元网络异步重启游走(asynchronously random walk with restart,ARWRH)算法,构建疾病表型-蛋白质异构网络,深层次挖掘潜在肺癌风险致病基因。ARWRH算法首先在疾病表型网络、蛋白质作用网络及疾病表型-蛋白质二分图网络内随机游走不同步数,然后进行网络间跳转,迭代形成稳态概率向量,从而获得候选致病基因。仿真实验表明,ARWRH算法可有效预测肺癌潜在风险致病基因,多数预测结果获得了文献证据支持。  相似文献   

2.
基于扩展起始节点和加权融合策略预测肺癌风险致病基因   总被引:1,自引:0,他引:1  
肺癌风险致病基因预测有助于了解疾病发病机制、提高临床治疗效果.目前,以重启游走为框架的风险致病基因预测算法,普遍存在起始节点少、节点转移概率相同、信息源单一的问题.为此,本文提出一种基于扩展起始节点和加权融合策略的风险致病基因预测算法(命名为AFMFSC),并在肺癌中验证算法有效性.首先,基于增广模糊测量思想,计算疾病表型近似基因间的增广功能相似得分,从中选出重要基因与致病基因作为扩展起始节点;其次,采用节点拓扑相似度转移矩阵及基因表达差异相关性转移矩阵,分别在蛋白质网络中重启随机游走,并将两种结果加权融合排序;最后,通过富集分析排名靠前基因,得到有显著意义的风险致病基因.AFMFSC算法预测的73个肺癌风险致病基因,均与肺癌发生、发展有密切联系,生物学意义显著.与其他排序算法相比,AFMFSC算法的Top 1%、Top 5%和AUC值比较大,平均排名和受拓扑特性偏差影响程度小;融合策略排名性能优于单一转移矩阵或普通邻接矩阵游走排名.AFMFSC算法不仅能准确有效地预测肺癌风险致病基因,而且可推广预测其他疾病风险致病基因,为探索癌症致病机理提供新视角及依据.  相似文献   

3.
风险致病基因预测有助于揭示癌症等复杂疾病发生、发展机理,提高现有复杂疾病检测、预防及治疗水平,为药物设计提供靶标.全基因组关联分析(GWAS)和连锁分析等传统方法通常会产生数百种候选致病基因,采用生物实验方法进一步验证这些候选致病基因往往成本高、费时费力,而通过计算方法预测风险致病基因,并对其进行排序,可有效减少候选致病基因数量,帮助生物学家优化实验验证方案.鉴于目前随机游走算法在风险致病基因预测方面的卓越表现,本文从单元分子网络、多重分子网络和异构分子网络出发,对基于随机游走预测风险致病基因研究进展进行较全面的综述分析,讨论其所存在的计算问题,展望未来可能的研究方向.  相似文献   

4.
基于功能一致性利用蛋白质互作网络挖掘潜在的疾病致病基因,对于了解疾病致病机理和改进临床治疗至关重要.基于基因功能一致性和其在蛋白质互作网络中的拓扑属性将基因与疾病之间建立关联,对疾病风险位点内的基因进行了致病风险预测,并通过GO及KEGG功能富集分析方法进一步筛选,预测出新的致病基因.预测出了51个新的冠心病致病基因,分析发现大部分基因参与了冠心病的致病过程.为疾病基因的挖掘提出一个新的思路,从而有助于复杂疾病致病机理的研究.  相似文献   

5.
目的:基于整合网络和联合策略预测心肌梗死的新致病基因.方法:从系统生物学的角度,提出基于蛋白质亚细胞定位信息,构建区域化的蛋白质互作的整合网络;通过疾病风险基因与已知致病基因的功能一致性程度和互作相关性的强度联合筛选的新策略,预测心肌梗死的新致病基因.结果:预测出10个心肌梗死的新致病基因(CCL19、CCL25、COMP、CCL11、CCL7、F2、KLKB1、HTR6、ADRB1、BDKRB2),其中8个基因(CCL 19、CCL25、CCL11、CCL7、F2、KLKB1、ADRB1、BDKRB2)经文献证实与心肌梗死的发生发展有着密切的联系;另外2个基因(COMP、HTR6)尚需实验验证.结论:基于整合网络和联合策略预测出10个心肌梗死的新致病基因,此方法为探索复疾病的致病基因提供了新的思路,有助于阐明复杂疾病的致病机理.  相似文献   

6.
基于功能一致性预测冠心病致病基因   总被引:1,自引:0,他引:1  
目的:为了解疾病致病机理和改进临床治疗,基于功能一致性挖掘潜在的疾病致病基因.方法:本文基于功能一致性基因的共定位特性,结合蛋白质互作网络拓扑结构,获取疾病候选基因集,并通过GO及KEGG功能富集分析方法进一步筛选,预测出新的致病基因.结果:挖掘得到的59个冠心病致病基因通过文献证实绝大部分基因与疾病的发生发展存在着联系.结论:本方法具有可行性,研究者能够在此基础上很好地进行疾病致病机理的研究.  相似文献   

7.
目的:基于全基因组关联分析(Genomewideassociationstudy,GWAS)数据与生物信息学方法,识别冠心病潜在致病基因。方法:利用生物信息学方法和GWAS数据,对单核苷酸多态性(SingleNucleotidePolymorphisms,SNP)进行疾病风险打分,依据特定距离阈值内的SNP-SNP互作关系,筛选出疾病相关SNP显著风险模块,识别潜在致病基因。结果:设定阈值20kb,经筛选获得279个SNP显著风险模块,映射到79个基因,文献验证率为71.01%。结论:基于SNP互作识别的潜在致病基因,能更加准确的分析冠心病的发生发展过程。  相似文献   

8.
目的:人肌球蛋白7A(MYO7A)基因是遗传性耳聋分子筛查的候选基因之一。从已知的MYO7A非同义单核苷酸多态性(ns SNPs)位点数据库中筛选可能与致病表型相关的ns SNPs位点,以提高MYO7A基因耳聋分子诊断的有效性和准确率。方法:首先,从NCBI数据中心的db SNP数据库(db SNP)和Deafness Variation Database数据库获得MYO7A基因的SNPs数据和基因的相关信息;然后,通过SIFT、Poly Phen-2、PANTHER、Ph D-SNP、Mutation Taster、SNPGO和Mut Pred软件进行ns SNPs表型致病性分析,预测潜在致病位点;接着,应用Clustal X2和Gene Doc软件进行同源氨基酸序列比对,分析潜在致病的ns SNPs位点保守性;最后,应用Swiss Model平台选择性地对某些突变蛋白质的三维结构进行建模,并分析结构域的变化。结果:预测出MYO7A的104个高风险致病的ns SNPs位点,包括25个已报道的耳聋相关ns SNPs位点;高风险致病的ns SNPs位点中,有42个位于肌球蛋白马达(myosin motor)结构域,其中12个预测有致病风险的ns SNPs位点与MYO7A基因致聋的突变研究报道一致。肌球蛋白马达结构域中包含30个新预测的潜在致病性ns SNPs位点,其中仅L366P位点在7个预测软件中具有高度一致性。通过对L366P位点位点突变前后的三维模型构建,发现存在蛋白结构的改变,且同源性比对结果显示了该位点的高度保守性。结论:MYO7A的L366P为潜在高风险致病性ns SNP位点,推测该基因突变可能与耳聋表型相关。本研究所采用的分析筛选方法对MYO7A基因突变的临床筛查及其他致病基因的ns SNPs筛选具有重要的参考价值。  相似文献   

9.
癌相关基因在疾病发生与发展过程中的作用机理是非常重要的研究课题。现代数据分析方法,为从基因组数据中推断癌相关基因之间的关联,以及分析基因组的作用机理提供了有效的手段。本文根据基因表达谱数据分别建立了正常组织与神经胶质瘤和肾癌的患病组织的基因互信息网络。用以介数为基础的相继故障模型研究了基因网络结构与鲁棒性之间的关系。定义了网络相继故障节点百分比、平均相继故障规模和相继故障规模比例累积概率等衡量网络鲁棒性的结构参数。通过对照组与实验组之间的比对,我们发现实验组网络比对照组网络更加稳定,并将引起网络大规模相继故障的基因称为结构性关键基因。这些结构性关键基因中的一部分已经被证明与神经胶质瘤或肾癌的发生、发展有密切关系。大多数基因被预测在神经胶质瘤和肾癌的发生中起着激励或抑制作用,需要进一步的试验验证。预测信息为研究癌相关基因提供了新的方向。  相似文献   

10.
前列腺癌病因及发病机理研究有助于前列腺癌预防和治疗.目前,前列腺癌生化试验研究方法成本高、耗时,而基于网络计算方法容易受基因表达谱数据不完整、噪声高及实验样本数量少等约束.为此,本文提出一种基于节点-模块置信度及局部模块度的双重约束算法(命名为NMCOM),挖掘前列腺癌候选疾病模块.NMCOM算法不依赖基因表达谱数据,采用候选基因与致病表型之间一致性得分,候选基因与致病基因之间语义相似性得分融合排序策略,选取起始节点,并基于节点-模块置信度及局部模块度双重约束挖掘前列腺癌候选疾病模块.通过对挖掘出的模块进行富集分析,最终得到18个有显著意义的候选疾病基因模块.与单一打分排序方法及随机游走重开始方法相比,NMCOM融合排序策略的平均排名比小、AUC值大,且挖掘出结果明显优于其他模块挖掘算法,模块生物学意义显著.NMCOM算法不仅能准确有效地挖掘前列腺癌候选疾病模块,且可扩展挖掘其他疾病候选模块.  相似文献   

11.
近来,人们发现从疾病相关基因中寻找关键基因对疾病的诊断和治疗很重要。癌相关基因的网络是根据正常和患病的胶质瘤组织的基因表达谱建立。根据建立的基因网络和CIPHER方法,不同阈值下的正常和患病的胶质瘤表型网络被建立。根据已知的疾病和表型间的关联,另一组正常和患病的胶质瘤表型网络被建立。将两种方法建立的相应的表型网络进行比较,匹配度最大时对应的阈值及基因和表型网络被确定。在此基础上,通过打分方法得到了7个关键基因:DMBT1,ERBB2,NF2,PDGFB,AR,ARAF和TP53。文献查询发现其中5个基因与胶质瘤的形成和发展密切相关。剩下两个基因中的ARAF也间接地参与胶质瘤形成。因此,这两个基因可能在胶质瘤的形成中起重要作用。这一预测仍需要实验验证。  相似文献   

12.
全基因组基因-基因相互作用研究现状   总被引:2,自引:0,他引:2  
沈佳薇  胡晓菡  师咏勇 《遗传》2011,33(8):820-828
复杂疾病目前正在全球范围流行, 极大地影响人类的健康。研究发现, 复杂疾病的性状受到多个位点的相互作用影响。目前的全基因组关联分析(Genome-wide association study, GWAS)仅仅解析单个SNP位点对疾病易感性的贡献, 单纯依靠这一种策略并不能在寻找复杂疾病的病因上得到根本性的突破。基因-基因相互作用可能是复杂疾病致病的主要因素之一。针对这一点, 科学家已经提出了一些检验基因相互作用的算法, 包括惩罚logistic回归模型、多因子降维(Multifactor dimensional reduction)、集合关联法(Set-association approach)、贝叶斯网络(Bayesian networks)、随机森林法等。文章首先对目前这些方法做了综述, 并指出了其中的不足, 包括计算复杂度太高、假设驱动、数据会过度拟合、对低维数据不敏感等, 进而简述了一种由笔者所在实验室开发的基于GPU的研究基因相互作用的算法, 该算法复杂度低, 不需要任何假设, 没有边际效应, 有很好的稳定性, 速度快, 适用于进行全基因组范围内的基因-基因相互作用计算。  相似文献   

13.
复杂疾病的发生发展与机体内生物学通路的功能紊乱有密切联系,从高通量数据出发,利用计算机辅助方法来研究疾病与通路间的关系具有重要意义.本文提出了一个新的基于网络的全局性通路识别方法.该方法利用蛋白质互作信息和通路的基因集组成信息构建复杂的蛋白质-通路网.然后,基于表达谱数据,通过随机游走算法从全局层面优化疾病风险通路.最终,通过扰动方式识别统计学显著的风险通路.将该网络运用于结肠直肠癌风险通路识别,识别出15个与结肠直肠癌发生与发展过程显著相关的通路.通过与其他通路识别方法(超几何检验,SPIA)相比较,该方法能够更有效识别出疾病相关的风险通路.  相似文献   

14.
液相芯片是一种重要的高通量分子检测技术,能够快速对一个样本进行多重检测和分析。该文综述了近年来液相芯片检测人类和模式动物的致病基因的应用,发现该技术能够对遗传性疾病、心血管疾病等致病相关基因及其在组织中的表达进行了定量检测,为临床诊疗和致病机制的研究提供了有力的支撑;还能够筛查实验动物的相关致病基因,以期为深入研究疾病与致病基因之间的关系,以及疾病动物模型的构建提供参考。  相似文献   

15.
疾病关键基因可用于疾病诊断、预测和新药或新疗法有效性的评价,故识别与疾病紧密相关的关键基因十分重要。然而现在有些疾病样本数据较少,传统基于大样本的关键基因挖掘方法不适用于该类数据。本文针对含少量样本数据的疾病,首先利用单样本网络构建方法构建每个疾病样本的个体化基因网络,并通过建立基因间的层间联系构建多层基因网络。然后利用基于张量的多层网络中心性方法评估每层网络中基因间的相互作用以及层间影响,对基因进行重要性打分,识别疾病关键基因。最后将该方法应用到哮喘数据集上,并与经典算法进行比较,结果表明,利用该方法所识别的已获批准的药物靶标基因的排名较优;对所得到的新的潜在关键基因TP53、PUS10、MAP3K1等进行功能和通路富集分析,结果表明其与哮喘有紧密关联。  相似文献   

16.
随着第二代DNA测序技术的发展,研究人员积累了大量的肠道菌群数据,研究表明肠道菌群与宿主健康状况存在密切联系,因此如何对复杂、高维的肠道菌群数据进行建模分析,是当前生物信息学研究中的重要挑战。人工智能的兴起为处理肠道菌群数据,揭示肠道菌群与宿主表型之间的复杂关系提供了可能。综述了现阶段肠道菌群与宿主表型之间的相关研究,重点介绍了常用的5种机器学习算法(线性回归、支持向量机、K-近邻、随机森林、人工神经网络)的理论原理及在相关研究中的应用,对预测宿主表型的机器学习算法选择提出了建议,并对该领域的未来发展进行了展望,以期为利用机器学习对肠道菌群宿主表型预测提供参考依据。  相似文献   

17.
在生物系统中,遗传相互作用指的是两个基因同时突变的表型异于它们分别突变表型叠加效果的现象.近年来,随着高通量技术的发展,遗传相互作用的高通量筛选得以实现,产生了大量遗传相互作用数据.通路基因指的是一组在同一条生物通路上相互协作的基因,它们共同完成某一项生命过程.发掘遗传相互作用数据中的通路基因可以研究基因之间如何进行相互作用共同影响某种表型,是理解生物学通路的结构和功能,生物系统进化规律,和研究复杂疾病的重要途径.然而,由于基因多效性以及高维数据处理困难等问题,如何发现遗传相互作用数据中的通路基因面临着很大挑战.本文中,我们通过计算基因间的条件独立性,即删除掉通路中的已知基因的影响后,研究基因间的相关性.而这些通路中的已知基因将在模型中作为种子基因发掘通路中的其他基因.我们将讨论该算法在模拟数据和实际数据中的计算效果,证明该算法在遗传相互作用数据应用中的有效性.  相似文献   

18.
目的:建立挖掘恶性胶质瘤候选基因的方法并进行系统分析。方法:结合恶性胶质瘤已知通路内基因和发生点突变和拷贝数改变的基因构建扩展基因关系网络,计算并分别寻找在网络中度和中心性得分高,脆弱性为正数的节点(基因),将满足一种或多种测度并与已知恶性胶质瘤基因共功能的基因作为恶性胶质瘤候选基因。最后,通过文献验证方法评价多种测度预测恶性胶质瘤基因的效能。结果:融合基因功能后,利用基因在网络中的度和脆弱性可识别大部分恶性胶质瘤基因,但利用中心性预测的结果较差;当将三个测度融合后,效能并没比单独使用脆弱性高。结论:融合基因功能关系和网络脆弱性是预测恶性胶质瘤基因的最佳测度。  相似文献   

19.
目的:鉴定疾病蛋白对深入理解致心律失常性右心室心肌病(ARVC)致病机制至关重要。可以采用计算生物学的方法,在ARVC疾病相关网络中挖掘新的潜在的致病蛋白。方法:本文整合HPRD和BioGRID的蛋白质互作数据,获得了较为全面且真实可靠的蛋白质互作数据;通过结合文本挖掘和统计学检验筛选出ARVC种子蛋白,应用最近邻居扩增的方法,构建ARVC蛋白质互作网络(PPIN),并采用PRINCESS法则对网络中每对互作蛋白加权;最后,基于ARVC关联得分策略对网络中的每个蛋白质打分并排秩。结果:分析发现排秩前50的候选蛋白大都与ARVC关系密切,如PRKCA,CDH1,SMAD4,SMAD2,CDH5,CTNNA1,DSC1等在调节心肌收缩、细胞程序性死亡、心脏的发育过程及维持桥粒的完整性方面起重要作用。结论:我们提出的方法为鉴定与ARVC致病机制相关的新致病蛋白提供了有效的途径。  相似文献   

20.
家族性高胆固醇血症(FH)是一类异质性很强的单基因常染色体遗传性疾病。最近发现,除低密度脂蛋白受体和载脂蛋白B-100以外.前蛋白转化酶一枯草溶菌素9、衔接子蛋白、三磷酸腺苷结合盒转运蛋白G5和G8、胆固醇-7-α-羟化酶等多种基因的变异都能导致FH样表型。该文对利用基因剔除和过表达、RNA干扰、反义技术对单基因遗传性高胆固醇血症非低密度脂蛋白受体致病基因的功能和调控机制进行综述,有助于深入认识这些基因.从而为临床家族性高胆固醇血症的诊断和治疗提供新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号