首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 21 毫秒
1.
目的:研究混合效应模型(Mixed Effects Model)在肿瘤表达谱基因芯片数据分析中的检验效能,并探讨其分析效果。方法:采用混合效应模型分析肿瘤实例基因芯片数据,并以基因集富集分析方法(GSEA)作为参照比较分析结果的有效性和科学性,探讨其检验效果。结果:通过混合效应模型和基因集富集分析(GSEA)两种方法对肿瘤基因芯片数据的分析和比较,两种方法筛选出共同的差异表达通路外,混合效应模型额外地筛选出来GSEA未能检验到的8条差异表达通路,且得到文献支持;混和效应模型筛选出的前10个差异表达通路中有6个已有生物学证明而基因集富集分析方法(GSEA)筛选出的前10个差异表达通路中仅有4个已有生物学证明。结论:混合效应模型作为top-down方法中的典型代表,其优势在于通过构建潜变量达到降维目的,可有效地减少多个复杂的变异来源从而保证了结果的准确性和科学性,其检验效能优于基因集富集分析方法(GSEA),是一种行之有效的筛选肿瘤基因芯片数据的分析方法。  相似文献   

2.
【目的】采用生物信息学方法分析公共数据库来源的细菌性败血症患者全血转录组学表达谱,探讨细菌败血症相关的宿主关键差异基因及意义。【方法】基于GEO数据库中GSE80496和GSE72829全血转录组基因数据集,采用GEO2R、基因集富集分析(GSEA)联用加权基因共表达网络分析(WGCNA)筛选细菌性败血症患者相比健康人群显著改变的差异基因,通过R软件对交集基因进行GO功能分析和KEGG富集分析。同时,通过String 11.0和Cytoscape分析枢纽基因,验证枢纽基因在数据集GSE72809(Health组52例,Definedsepsis组52例)全血标本中的表达情况,并探讨婴儿性别、月(胎)龄、出生体重、是否接触抗生素等因素与靶基因表达谱间的关系。【结果】分析GSE80496和GSE72829数据集分别筛选得到932个基因和319个基因,联合WGCNA枢纽模块交集得到与细菌性败血症发病相关的10个枢纽基因(MMP9、ITGAM、CSTD、GAPDH、PGLYRP1、FOLR3、OSCAR、TLR5、IL1RN和TIMP1);GSEA分析获得关键通路(氨基酸糖类-核糖代谢、PPAR信号通路、聚糖生物合成通路、自噬调控通路、补体、凝血因子级联反应、尼古丁和烟酰胺代谢、不饱和脂肪酸生物合成和阿尔兹海默症通路)及生物学过程(类固醇激素分泌、腺苷酸环化酶的激活、细胞外基质降解和金属离子运输)。【结论】本项研究通过GEO2R、GSEA联用WGCNA分析,筛选出与细菌性败血症发病相关的2个枢纽模块、10个枢纽基因以及一些关键信号通路和生物学过程,可为后续深入研究细菌性败血症致病机制奠定理论依据。  相似文献   

3.
目的:探索差异表达基因集(DEGs)筛选的有效方法.方法:基于蒙特卡洛模拟比较Efron's GSA、SAFE、Globaltest、PCOT2等四种基因集方法在分析微阵列数据时的统计推断能力.结果:Globaltest和PCOT2两种基于模型构建的基因集方法在处理模拟微阵列数据时效能相当,Globaltest略优于PCOT2,而Effort's GSA、SAFE方法检验效能低下.结论:Globaltest是一种较有效的微阵列数据分析方法.  相似文献   

4.
基于基因表达变异性的通路富集方法研究   总被引:1,自引:0,他引:1  
当前的通路富集方法主要是基于基因的表达差异,很少有方法从通路变异性(方差)角度对其富集分析.我们注意到用合适的统计量描述通路的变异性时,在疾病表型下一些通路的变异性有明显的上升或者下降.因此本研究假设:通路变异性程度在不同表型中存在差异.本文设计了14种描述通路变异性的统计量与检验方法,检测不同表型下变异性有差异的通路即富集通路,并将富集结果与文献检索结果进行比较,同时,分析不同芯片预处理方法对数据和结果的影响.研究结果表明:5种预处理方法中,多阵列对数健壮算法(RMA)是数据预处理的最优方法;不同表型下通路的变异性程度存在差异;根据文献检索的通路结果,14种基于变异性的通路富集方法中,以通路中各基因欧氏距离的方差做统计量进行permutation检验(方法11)能有效识别显著通路,其富集结果优于基因集富集分析(GSEA).综上所述,基于通路变异性的通路富集策略具有可行性,不仅对通路富集分析有一定的理论指导意义,而且为人类疾病研究提供新的视角.  相似文献   

5.
基因表达谱富集分析方法研究进展   总被引:1,自引:0,他引:1  
微阵列技术是生物技术变革的核心,允许研究者同时监测成千上万个基因的表达水平,已广泛应用于医学研究。如何挖掘海量基因表达信息中的有用信息并进行生物学专业解释,是基因表达谱数据分析领域所面临的一个重要挑战。不同的研究者提出了各种基于基因集进行富集分析的方法,在此将这些方法大致分为两大类,即bottom-up方法和top-down方法。前者先进行单基因分析,然后根据生物学领域知识注释基因集并进行分析。该方法应用广泛,且结果比单基因分析容易解释。后者先根据生物学领域知识将各基因进行归类,然后进行基因差异表达模式分析。该方法不仅能提高结论的可解释性,而且能达到降维的目的。  相似文献   

6.
为探究乙型肝炎病毒(Hepatitis B virus,HBV)感染后肝细胞基因表达和信号通路的改变情况,从Gene Expression Omnibus(GEO)数据库中下载了HBV感染者肝细胞样本制作的基因表达谱数据集GSE83148,进行质量检测、数据标准化后筛选出差异表达基因,进一步做GO和KEGG富集分析以及基因网络相互作用分析,筛选关键基因和信号通路。从HBV感染样本中筛选出fold change≥2,p-value0. 05的上调差异表达基因44个,GO分析获得关键基因BAK1和TP63,差异表达基因网络互作获得5个位于枢纽位置的基因:NDUFS1、NDUFS2、COX7B、ATP5B、OPA1。KEGG分析获得关键信号通路有:乙型肝炎信号通路、病毒癌变信号通路、Fox O信号通路、PI3K-Akt信号通路。本研究筛选出的多数基因与线粒体和氧化呼吸链有关,造成这一现象的具体机制还需进一步探究。  相似文献   

7.
GSEA是一个可下载后免费使用的全基因组表达谱芯片数据分析工具。它根据已有的对基因的定位、性质、功能、生物学意义等知识的基础上,首先构建了一个分子标签数据库,数据库中包含了多个功能基因集。通过分析一组处于两个生物学状态的基因表达谱杂交数据,它们在特定的功能基因集中的表达状况,以及这种表达状况是否存在某种统计学显著性。GSEA是从另一个角度来诠释生物信息,可进一步完善我们对相关生物学事件的认识。  相似文献   

8.
杨燕霞  金莲  王欣  张洁  柳小平 《生命科学研究》2020,24(2):127-135,159
为了从基因层面探讨非小细胞肺癌(non-small cell lung cancer, NSCLC)发生发展的内在机制,筛选与NSCLC诊断、预后相关的基因,为NSCLC分子机制的进一步研究提供生物信息学依据,利用生物信息学方法对GEO数据库和TCGA数据库的数据集进行合并分析,筛选NSCLC组织与正常肺组织之间的差异表达基因(differentially expressed genes, DEGs),并对所取交集的DEGs进行基因集富集分析(gene set enrichment analysis, GSEA)、基因本体论(gene ontology, GO)分析、KEGG (kyoto encyclopedia of genes and genomes)通路富集分析、蛋白质相互作用(protein-protein interaction, PPI)分析、ROC曲线诊断效能分析及LASSO生存分析。文中共筛选出240个DEGs,主要涉及核分裂、染色体分离等生物学过程。GSEA分析结果显示,富集的通路主要涉及DNA修复和细胞周期。从PPI网络中筛选出20个hub基因, ROC结果显示, UBE2C (AUC=0.939)、TOP2A(AUC=0.927)、RRM2 (AUC=0.927)、CCNB1 (AUC=0.928)、MKI67 (AUC=0.930)、AURKA (AUC=0.931)、MELK(AUC=0.950)相对具有较高的诊断价值, LASSO COX回归结果则显示IL6、KIAA0101、MKI67、TPX2、AURKA、CDKN3及CDCA5与NSCLC患者的预后强相关。本研究结果表明, ZWINT、KIF2C、MELK、CDCA5可能在NSCLC中发挥着重要的作用,为阐明NSCLC的分子机制提供了新思路。  相似文献   

9.
10.
当两组样本间基因表达的差异程度较低或样本量较少时,采用通常的错误发现率(falsediscovery rate,FDR)控制水平(如5%或10%),可能无法识别足够多的差异表达基因以进行后续的功能富集分析。然而,功能富集分析对差异表达基因中的错误发现具有一定的稳健性。所以,采用较低的FDR控制水平(即允许较高的FDR)识别差异表达基因,可能可以可靠地发现疾病相关功能。本文分析了5套研究乳腺癌转移的基因表达谱,通过其中差异表达信号较强的3套数据,论证了即使差异表达基因的FDR达到25%,功能富集分析的结果仍具有较高的稳健性。然后,在另外2套差异表达信号微弱的数据中,采用25%的FDR控制水平筛选差异表达基因来进行功能富集分析,并与前述3套数据的功能富集结果做比较。结果显示,采用较低的FDR控制水平筛选差异表达基因,仍然可以可靠地识别乳腺癌转移相关功能。分析结果也提示,在乳腺癌转移过程中,一些功能较为宽泛的生物学过程(如细胞分裂、细胞周期和DNA复制等)整体受到了扰动,反映出乳腺癌转移是一种涉及广泛基因表达改变的系统性疾病。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号