排序方式: 共有13条查询结果,搜索用时 15 毫秒
1.
鼻咽癌和口腔鳞癌是两种在临床上高度相关的疾病,从分子层面系统性研究这两种疾病的相互关系却鲜见报道。本研究通过大规模的转录组数据分析识别鼻咽癌和口腔鳞癌的共享功能模块及其核心基因(一因多效模块和基因),以期阐明这两种疾病共享的分子机制。从GEO数据库获取这两种癌症的两套转录组数据,应用倍数法和经验贝叶斯方法筛选出鼻咽癌差异表达基因1279个,口腔鳞癌差异表达基因1293个,其中两者共享基因278个。以共享基因为种子,通过蛋白质-蛋白质互作知识引导构建基因网络,其中最大子网包含1290个基因和1766互作对。应用Newman算法提取了15个共享功能模块。对这些模块进行拓扑学分析,挖掘出58个核心基因,包括已知的与鼻咽癌或口腔鳞癌相关的基因(如PCNA、CDK1、STAT1、CCL5和MMP1等)和鲜有报道的基因(如MELK、NME1、RACGAP1、INHBA和NID1等)。通路富集分析发现鼻咽癌和口腔鳞癌的共享功能模块参与多个生物学通路,包括p53信号通路、ECM受体相互作用、黏着斑、细胞周期等。本研究表明鼻咽癌和口腔鳞癌具有相似的致癌机制,所挖掘的共享模块可能是这两种疾病演化的核心分子相互作用机制。 相似文献
2.
基因多效性是癌症遗传机制中的普遍现象, 但罕见系统性的分析。文章提出采用双聚类挖掘基因功能模块的新思路探索癌症的共享分子机制和不同癌症间的关系。获取20种癌症的基因表达数据, 应用改良t检验和倍数法筛选出至少在两种癌症中差异表达的基因, 得到10417×20的数据矩阵; 采用双聚类方法获得22个癌症共享的基因簇; 进一步富集分析得到17个基因功能模块(Bonferroni校正后P<0.05), 主要参与有丝分裂染色单体分离的调控、细胞分化、免疫和炎症反应、胶原纤维组织等生物过程; 主要执行ATP结合和微管活动、MHCⅡ类受体活性、肽链内切酶抑制活性等分子功能; 活动区域主要在细胞骨架、染色体、MHCⅡ蛋白质复合体、中间丝蛋白、胶原纤维等。基于模块构建癌症相关网络, 显示胃癌、卵巢腺癌、宫颈鳞癌和间皮瘤等之间相关程度较高, 而两种血液系统癌症(急性髓细胞性白血病与多发性骨髓瘤)分子机制与其他癌症存在较大差异。可见癌症共享的基因功能模块与多种生物机制有关, 癌症之间相似性可能与组织起源、共同的致癌机制等有关。文章提出的基因多效性分析方法有助于解释人类复杂性疾病的共享分子机制。 相似文献
3.
基因芯片技术为疾病异质性研究提供了有力的工具。当前基于传统聚类分析的方法一般利用芯片上大量基因作为特征来发现疾病的亚型, 因此它们没有考虑到特征中包含的大量无关基因会掩盖有意义的疾病样本的分割。为了避免这个缺点, 提出了基于耦合双向聚类的异质性分析方法(Heterogeneous Analysis Based on Coupled Two-Way Clustering, HCTWC)来搜索有意义的基因簇以便发现样本的内在分割。该方法被应用于弥漫性大B细胞淋巴瘤(diffuse large B-cell lymphoma DLBCL)芯片数据集, 通过识别的基因簇作为特征对DLBCL样本聚类发现生存期分别为55%和25%的两类DLBCL亚型(P<0.05), 因此, HCTWC方法在解决疾病异质性是有效的。 相似文献
4.
不宁腿综合征遗传学研究进展 总被引:2,自引:0,他引:2
不宁腿综合征(Restless legs syndrome, RLS)遗传学研究近年来获得了许多重要的进展, 极大地丰富了对于这种疾病分子机制的认识。RLS是一种常见的复杂疾病, 几个遗传流行病学和双生子研究对RLS遗传组分进行了剖析, 说明RLS是一个遗传性很强的性状, 其遗传力约为50%。采用基于模型的连锁分析方法或者是不依赖于模型的连锁分析方法目前已定位了5个重要的RLS疾病连锁位点: 12q13-23, 14q13-21, 9p24-22, 2q33和20p13, 为定位克隆RLS致病基因或者易感基因提供了连锁图谱。最新基于高通量的SNPs分型平台开展的全基因组分析确立3个与RLS显著关联的区域: 6p21.2, 2p14和15q23。文章结合作者近年来从事不宁腿综合征遗传学的研究工作, 对该领域的重要成果进行了汇总和评述。 相似文献
5.
复杂疾病驱使的融合SDA-SVM集成基因挖掘方法 总被引:1,自引:0,他引:1
提出了一种新颖的复杂疾病驱使的融合SDA-SVM(Stepwise Discriminant Analysis-Support Vector Machine,SDA-SVM)技术的集成基因挖掘方法。该集成方法融合逐步判别分析和支持向量机的优点,能够有效地进行复杂疾病相关基因的深度挖掘,使得挖掘出的基因能够较好地识别疾病类型和亚型。通过将该方法应用于一套弥散性大B细胞淋巴瘤DNA表达谱数据,并与其它基因挖掘方法对比,结果表明该方法挖掘出的基因具有较高的疾病相关性和较强的疾病类型识别能力。 相似文献
6.
基因表达调控网络的深入研究有利于分子药物靶标的发现以及推新药的研发,是未来生物医学研究的重要内容。针对基因表达调控的时间延迟问题,我们初步设计开发了一套基于基因表达谱数据识别基因表达时间延迟调控关系的软件ITdGR(Identification of Time-delayed Gene Regulations)。并已经成功地将该软件应用于酿酒酵母细胞周期的基因表达谱数据中,识别出的调控关系与已有的知识相符。该软件为基因调控网络重构以及基因表达动态研究提供了一个方便和快捷的工具。 相似文献
7.
生物学通路被广泛应用于基因功能学研究, 但现有的生物学通路知识并不完善, 仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质-蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质-蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路, 然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database (HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质-蛋白质互作信息进行预测。结果表明, 在两套数据中, 随着互作邻居个数的增加, 预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中, 所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时, 预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID), 而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证, 至少有一个更新通路被预测正确的基因有50个, 其中43个基因的更新通路被完全正确预测, 相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。 相似文献
8.
结合蛋白质互作与基因表达谱信息大范围预测蛋白质的精细功能 总被引:1,自引:0,他引:1
GESTs(gene expression similarity and taxonomy similarity)是结合基因表达相似性和基因功能分类体系Gene Ontology (GO)中的功能概念相似性测度进行功能预测的新方法. 将此预测算法推广应用于蛋白质互相作用数据, 并提出了几种在蛋白质互作网络中为功能待测蛋白质筛选邻居的方法. 与已有的其它蛋白质功能预测方法不同, 新方法在学习过程中自动地从功能分类体系中的各个功能类中选择最合适的尽可能具体细致的功能类, 利用注释于其相近功能类中的互作邻居蛋白质支持对此具体功能类的预测. 使用MIPS提供的酵母蛋白质互作信息与一套基因表达谱数据, 利用特别针对GO体系结构层次特点设计的3种测度, 评价对GO知识体系中的生物过程分支进行蛋白质功能预测的效果. 结果显示, 利用文中的方法, 可以大范围预测蛋白质的精细功能. 此外, 还利用此方法对2004年底Gene Ontology上未知功能的蛋白质进行预测, 其中部分预测结果在2006年4月发布的SGD注释数据中已经得到了证实. 相似文献
9.
基于单核苷酸多态性的关联分析已成为当前解析人类常见复杂疾病遗传机制的重要手段之一, 然而, 目前普遍使用的单位点分析策略仅能发现部分单独效应显著的易感SNP位点, 因此遗漏了重要的遗传力组分——基因上位效应或联合效应。识别全基因组多基因间复杂的互作关系已成为全面解析复杂疾病致病分子机制必不可少的一项任务。已有很多方法被应用于全基因组交互作用分析, 加深了人类对复杂疾病遗传机制的进一步认识。基于各类方法的理论基础及算法的异同, 文章对目前应用较为广泛的基于遗传互作模型的方法、不基于互作模型的方法和数据挖掘类算法3类方法进行了系统地评述, 着重介绍了这些方法的主要思想、实现过程及应用中的注意事项等, 并指出开展大规模全基因组范围互作检测面临的问题, 以期能为相关领域的研究者提供方法学参考。 相似文献
10.
应用DNA芯片数据挖掘复杂疾病相关基因的集成决策方法 总被引:11,自引:2,他引:9
DNA芯片技术的迅速发展, 可同时检测成千上万个基因的表达谱数据, 为生命科学家们从一个全新的角度阐明生命的本质提供了可能性. 目前, 基因表达谱分析的工作大多集中在对癌症等疾病分类、疾病亚型识别等方面, 而从这些基因表达谱信息中挖掘反映疾病本质特征的相关基因, 是一项在后基因组时代更具挑战意义的科学研究, 基因挖掘由于缺少理想的数据挖掘技术而被忽视. 我们提出了一种新颖的特征基因挖掘的集成决策方法, 目的在于解决三个重要的生物学问题: 生物学分类及疾病分型、复杂疾病相关基因深度挖掘和目标驱使的基因网络构建. 我们成功地将此集成决策方法应用于一套结肠癌DNA表达谱数据, 结果显示这一新颖的特征基因挖掘技术在应用DNA芯片数据分析、挖掘复杂疾病相关基因等方面具有很高的价值. 相似文献