首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
基于WGCNA算法的基因共表达网络构建理论及其R软件实现   总被引:2,自引:0,他引:2  
WGCNA(weighted geneco-expression network analysis)算法是一种构建基因共表达网络的典型系统生物学算法,该算法基于高通量的基因信使RNA(mRNA)表达芯片数据,被广泛应用于国际生物医学领域。本文旨在介绍WGCNA的基本数理原理,并依托R软件包WGNCA以实例的方式介绍其应用。WGCNA算法首先假定基因网络服从无尺度分布,并定义基因共表达相关矩阵、基因网络形成的邻接函数,然后计算不同节点的相异系数,并据此构建分层聚类树(hierarchical clusteringtree),该聚类树的不同分支代表不同的基因模块(module),模块内基因共表达程度高,而分数不同模块的基因共表达程度低。最后,探索模块与特定表型或疾病的关联关系,最终达到鉴定疾病治疗的靶点基因、基因网络的目的。  相似文献   

2.
作为泌尿系统常见的肿瘤之一,肾肿瘤发病率在逐年上升。针对Affymetrix hgu133b的基因芯片数据进行差异表达基因筛选,应用加权基因共表达网络分析算法构建肾肿瘤差异表达基因的共表达网络。分析肾部正常组织和肿瘤组织差异表达基因之间的关联模式;选取与肿瘤发生关联程度最高的模块,筛选枢纽基因。最后,针对枢纽基因进行基因本体富集分析。细胞衰老是抑制肿瘤发生的主要机制之一,分析结果显示枢纽基因PLA2R1和TBX3与细胞衰老有关,可能对肾肿瘤的形成具有重要影响。该结果与基因PLA2R1通过促进细胞衰老抑制肾部肿瘤发生的研究结论一致。  相似文献   

3.
刘杰  李勃  陈晓洁  陈斌 《昆虫学报》1950,63(10):1171-1182
【目的】利用权重基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)探索埃及伊蚊Aedes aegypti不同组织基因共表达模式。【方法】从NCBI SRA数据库中选择埃及伊蚊不同组织的转录组数据中具代表性的9种组织(雌雄成蚊的触角和脑,雌蚊的喙、下颚须和卵巢,雄成蚊的前足、中足、后足和腹部末端)的双端测序数据;经过缺失值移除以及方差计算后,筛选出方差最大的5 000个基因,利用R软件中WGCNA包建立埃及伊蚊成蚊不同组织的基因共表达网络并划分模块;然后利用clusterProfiler包对组织特异性模块内的基因进行GO(Gene Ontology)和KEGG(Kyoto Encyclopediaof Genes and Genomes)富集分析,并用Cytoscape软件中的CytoHubba插件筛选共表达模块内的hub基因。【结果】从埃及伊蚊成蚊不同组织中共鉴定出11个基因共表达模块,在雌蚊触角、喙、卵巢、下颚须以及雄蚊脑、腹部末端组织中各鉴定出1个特异性表达模块,雄蚊前足、中足和后足组织中无特异性表达模块。6个组织特异性表达模块内基因功能注释到组织生物学功能;其中,雌蚊触角特异性green模块内基因具有气味结合和嗅觉受体活性等功能;雌蚊喙特异性purple模块内基因具有丝氨酸型肽链内切酶活性和丝氨酸水解酶活性等功能;雄蚊脑特异性blue模块内基因在生物学过程调节、信号转导和神经系统过程等生物学过程中发挥主要作用。利用CytoHubba进一步鉴定出所选组织特异性共表达模块中具有高连通性的hub基因,包括AAEL010426, AAEL002896, AAEL002600, AAEL000961, AAEL007784和AAEL006429。【结论】本研究依据埃及伊蚊不同组织转录组数据,利用WGCNA方法发现了许多重要的基因共表达模块。本研究的结果为蚊虫基因共表达模式分析提供新思路和方法基础,对探究蚊虫不同组织特有的基因资源信息以及功能基因生物信息学研究有参考价值。  相似文献   

4.
为了研究KLF基因家族成员在乳腺癌发生中的分子机制及其与患者预后的关系,我们利用GEPIA对KLF家族进行Kaplan-Meier生存分析,筛选出与患者预后显著相关家族成员;在Oncomine数据库中分析前面筛选出的与乳腺癌预后有关的KLF家族成员;采用c Bio Portal筛选出与患者预后有关的KLF家族成员共表达基因;STRING构建蛋白互作网络,Cytoscape软件中的MCODE插件识别网络模块,再用STRING对网络模块进行聚类分析。Kaplan-Meier生存分析显示KLF家族成员中KLF13和KLF15与乳腺癌预后显著相关(p0.05);Oncomine分析显示只有KLF13在乳腺癌组织表达显著高于正常组织(p0.01);c Bio Portal中筛选出KLF13共表达基因274个;Cytoscape软件中的MCODE插件识别出网络模块3个,STRING进行GO分析发现,网络模块中基因主要参与线粒体内的翻译和呼吸链氧化磷酸化生成ATP等生物过程,KEGG分析发现网络模块中涉及基因主要线粒体蛋白质翻译场所核糖体及其氧化磷酸化等信号通路有关。以上表明KLF13可能通过线粒体信号通路来影响乳腺癌的发生,可作为一个候选的乳腺癌临床预后标志物和潜在的治疗靶点。  相似文献   

5.
本研究旨在从分子水平揭示小鼠成纤维细胞直接重编程为心肌细胞的机制,为诱导心肌细胞再生提供新思路。在公共基因芯片数据库(GEO)中下载小鼠(Mus musculus)心肌细胞直接重编程相关的基因芯片数据,其中成纤维细胞样本数24例,诱导性心肌细胞样本数43例。利用统计软件R3.1.1采用Rankprod算法(p0.05,|lg FC|1)获得心肌细胞直接重编程过程中的差异表达基因,利用DAVID、Topp Gene和STRING等在线工具对差异表达基因进行生物信息学分析。最终分析筛选出210个心肌细胞直接重编程过程的差异表达基因,包括115个表达上调,95个表达下调。生物信息学分析发现Cybb、C1qa和Fabp4等基因以及横纹肌收缩等信号通路在心肌细胞直接重编程过程中起着重要作用。  相似文献   

6.
利用在多种应激条件下酵母的基因表达谱数据 ,分别计算互作蛋白质及复合物亚基编码基因的表达相关性。结果发现 ,相对于随机对照组 ,互作蛋白质的编码基因与蛋白质复合物的编码基因表达相关性均显著 (P <0 .0 1) ,即互作蛋白质及复合物亚基有共表达的倾向。通过比较 ,进一步发现蛋白质复合物亚基的基因表达相关性显著高于互作蛋白质的基因表达相关性 (P <0 .0 1) ,这与复合物亚基之间功能联系强于定义不甚确切的互作蛋白之间功能联系现象吻合。  相似文献   

7.
本研究基于单细胞测序数据探讨SENP2在肾细胞癌(renal cell carcinoma, RCC)3种不同亚型中的表达差异和作用机制。通过R语言进行UMAP降维可视化和差异表达基因(differentially expressed genes, DEGs)的筛选;对DEGs进行功能注释和富集分析并构建蛋白相互作用(protein-protein interaction, PPI)网络,通过Cytoscape软件筛选关键基因;通过分析SENP2的表达差异与3种RCC亚型患者生存预后和临床分期的关系,揭示其在不同亚型中的作用;通过分析SENP2及其互作基因的相关性,探索SENP2引起3种不同RCC亚型患者生存预后和临床分期差异性的调控机制;最后,对肾透明细胞癌(kidney renal clear cell carcinoma, KIRC)中的SENP2进行免疫组化实验。本研究结果表明,RCC 3种亚型中的基因表达具有差异性;RCC 3种亚型中差异表达基因显著富集于细胞增殖、蛋白质代谢、细胞衰老以及TP53调节等生物学过程中;筛选关键基因,锁定SENP2;生存分析和临床分期分析结果表明...  相似文献   

8.
《蛇志》2018,(2)
目的采用权重基因共表达网络分析方法(WGCNA)挖掘不同前列腺特异抗原(PSA)水平下的前列腺癌发展枢纽基因。方法数据来自NCBI的GEO数据库中下载不同PSA水平下的前列腺癌全基因组表达数据集,经过数据预处理后,用WGCNA构建基因共表达网络,识别不同PSA水平下的前列腺癌发展模块与枢纽基因。结果筛选出的差异基因聚集成一个模块,并且找到10个枢纽基因。结论结合文献发现,SNAI2、TRIM29、LAMB3、CYP3A5和SLC14A1这5个基因很可能影响不同PSA水平下前列腺癌的发展。  相似文献   

9.
本研究从美国国立生物信息中心(NCBI)的子数据库基因表达数据库(GEO)中选择基因表达谱GSE36830数据集,采用GEO2R筛选正常钩突和鼻息肉组织之间的差异表达基因(DEGs),对关键通路和差异表达基因进行数据库挖掘和分析,经筛选后的差异表达基因采用戴维在线工具对其进行基因本体富集分析(GO)、京都基因和基因组百科全书(KEGG)分析,然后将DEGs导入String数据库进行蛋白质互作网络分析,绘制差异表达基因互作网络图,将其数据导入Cytoscape软件中,筛选网络中心节点和关键基因,分析关键子网络。共筛选出699个DEGs,其中475个基因为上调表达基因,224个基因为下调表达基因。在GO分析中,针对生物过程,上调的DEGs包括:炎症反应、免疫反应、细胞趋化性、炎症反应的正向调节和细胞的粘附等;下调的DEGs主要参与:唾液分泌、生物矿物组织发展、细胞氨基酸生物合成过程、视网膜内稳态及离子跨膜转运等。在KEGG分析中,上调的DEGs主要在参与造血细胞系、细胞因子-细胞因子受体相互作用、破骨细胞分化、趋化因子信号通路、癌症中的转录失调、哮喘、金黄色葡萄球菌感染等信号通路中富集,而下调的DEGs在唾液腺分泌及胆汁分泌信号通路中富集。差异表达基因互作网络图筛选出前10个关键基因:ITGAM、IL10、CD86、TLR8、ITGAX、CCL2、CCR7、SRC、EGF及ITGB2。本研究得到了一组鼻息肉差异表达基因的生物信息学分析结果,但仍需进一步用基础试验来验证。本文分析的结论为慢性鼻-鼻窦炎、鼻息肉的研究提供了新的研究方向,也为鼻息肉发病机制研究的思路提供了一定的建设性作用。  相似文献   

10.
慢性乙型肝炎病毒(Hepatitis B virus,HBV)感染引起的原发性肝癌涉及多种基因、转录本和蛋白质的相互作用及调控。从单个基因的角度来看,某个基因的表达量的改变只能对肝癌发生发展的局部作出解释而无法从整体行为进行深入和全面的探索,无法满足高度复杂性的调控研究需要。筛选乙肝相关性肝癌的基因芯片数据获取差异表达基因后,应用加权基因共表达网络分析算法构建基因共表达网络,识别与肝癌发生相关的模块,利用可视化筛选枢纽基因,并针对枢纽基因进行基因本体富集分析和初步验证。富集分析和文献挖掘一致发现,某些枢纽基因确实与多种癌症的发生与发展存在显著的关联。权重基因共表达网络分析方法被证明是一个高效的系统生物学方法,应用该方法发现了新的HBV相关性肝癌枢纽基因。经实验验证,发现枢纽基因SHARPIN促进细胞迁移。该研究对肝癌发生的调控机制以及发现HBV慢性感染导致肝癌的新型诊断标志物和(或)药物作用靶点提供了新的视野。  相似文献   

11.
榕小蜂的雌雄个体之间存在很大表型差异,以至于很难将雌雄个体彼此联系在一起.以对叶榕传粉榕小蜂作为材料,利用"加权基因共表达网络分析"软件(WGCNA),对榕小蜂的基因组和转录组进行分析,结果发现,5个基因共表达模块,分别用蓝色、蓝绿色、棕色、绿色和黄色标识,其中2个模块偏爱在雌蜂中表达,3个模块偏爱在蛹中表达.基因本体(GO)分析发现在蓝绿色和黄色表达模块中发现3个功能富集的基因集合.在蓝绿色基因表达模块中发现2个基因集合,分别与细胞周期和核苷酸结合活性有关;在黄色基因表达模块中发现1个基因结合,与细胞分化有关,尤其是与神经发育有关.  相似文献   

12.
梁爽  凡奎  张燕  谢杨眉 《生物信息学》2020,18(3):163-168
为了寻找诊断、鉴别IgA肾病(IgAN)和膜性肾病(MN)的血液特异性标记物,利用公共数据库中的IgAN和MN患者的外周血单核细胞(PBMCs)的转录组表达谱数据集识别特异性生物标记物,为诊断和鉴别提供简便、可靠的依据补充。从公共基因表达数据库(GEO)下载IgAN患者组(n=15)和MN患者组(n=8)芯片数据集,筛选前250个差异表达基因(DEGs)。通过分析筛选关键基因和途径,进行基因本体(GO)富集分析、京都基因与基因组百科全书(KEGG)通路分析和蛋白质与蛋白质相互作用关系(PPI)分析等进一步了解DEGs。通过分析共发现75个显著DEGs,其中73个上调基因,2个下调基因。GO富集分析的生物学过程(BP)主要包括蛋白质转运、内溶酶体到溶酶体转运、趋化因子介导的信号通路作用等。显著富集差异表达基因KEGG通路分析包括Endocytosis和Hepatitis B的相关信号通路。PPI筛选出EPS15、STAT4、CCL2、SUN2、SEC24C、SEC31A、GOLGB1、F2R,RAB12和PTK2B等关键基因。成功筛选出核心差异表达基因,为IgAN和MN的诊断和鉴别提供简便、可靠的依据补充,甚至提供治疗的新靶点。  相似文献   

13.
14.
为了对骨质疏松症基因芯片数据集进行整合分析并识别出外周血细胞中与骨质疏松症相关的枢纽基因,通过检索GEO和ArrayExpress数据库获得骨质疏松症相关的表达谱芯片数据集;运用GWGS (genome-wide global significance)方法对纳入的数据集进行整合分析,筛选出差异表达基因(differentially expressed genes, DEGs);然后,运用GO (gene ontology)富集分析和KEGG (kyoto encyclopedia of genes and genomes)通路富集分析对差异表达基因进行功能注释,并建立蛋白质相互作用(protein-protein interaction, PPI)网络,筛选出骨质疏松症相关的枢纽基因。公共数据库检索得到3个符合纳入排除标准的研究集, GWGS整合分析筛选出排序前200的DEGs,这些基因主要富集的GO条目为脂多糖的细胞反应、凋亡过程和炎症反应,与骨质疏松症相关的KEGG富集通路为破骨细胞分化等。PPI分析进一步检测到与骨质疏松症相关的10个枢纽基因,其中9个基因已有研究报道和骨质疏松症的发生发展相关,而ELANE基因还未有研究报道与骨质疏松症有关。ELANE基因同时在人的骨髓组织、小鼠骨髓和骨组织中高表达,这个基因很可能与骨质疏松症有潜在的联系。本研究的结果将有助于进一步理解骨质疏松症的分子致病机理。  相似文献   

15.
筛选并分析间充质干细胞(mesenchymal stem cells,MSCs)诱导分化为心肌样细胞过程中GCN5招募促分化相关蛋白集合体的组成。免疫荧光细胞化学、实时荧光定量PCR鉴定MSCs经5-氮杂胞苷(5-azacytidine,5-azaC)诱导分化为心肌样细胞;免疫共沉淀技术分离、串联质谱鉴定GCN5募集蛋白集合体组成,并从心肌细胞分化角度筛选、验证分化相关蛋白因子。MSCs经5-azaC诱导分化的心肌样细胞表达心肌特异性基因GATA4、MEF2C和心肌细胞结构、功能蛋白cTnt、MHC和Cx43;筛选、验证出心肌细胞分化相关GCN5招募蛋白归类为:(1)DNA结合蛋白Sp1/KLF;(2)转录辅激活子PGC-1α和Rb1;(3)转录延伸复合体组成成分以及信号通路蛋白Akt。通过筛选获得MSCs经诱导向心肌样细胞分化过程中心肌分化相关蛋白因子,为进一步研究干细胞分化信号传导途径、特异性生物靶点干预以及提高干细胞分化效率打下了基础。  相似文献   

16.
目的:筛选肝细胞癌(HCC)预后不良相关基因,并探讨其临床意义。方法:在基因表达综合数据库(GEO)中获取符合分析条件的肝细胞癌全基因组表达谱数据并分析得到差异表达基因(DEGs),再运用生物学信息注释及可视化数据库 (DAVID) 和蛋白相互作用数据库 (String) 分别进行功能富集分析和蛋白质互作用网络的构建。利用癌症基因组图谱数据库(TCGA)和Cox比例风险回归模型对相关差异基因进行预后分析。结果:找到一个符合条件的人类HCC数据库 (GSE84402),共筛选出1141个差异表达基因(DEGs),其中上调基因720个,下调基因421个。基因功能富集分析和蛋白质互作用分析结果显示CDK1、CDC6、CCNA2、CHEK1、CENPE 、PIK3R1、RACGAP1、BIRC5、KIF11和CYP2B6为HCC预后的关键基因。TCGA数据库和Cox回归模型分析显示CDC6、PIK3R1、RACGAP1和KIF11的表达升高,CENPE的表达降低与HCC预后不良密切相关。结论:CDC6、CENPE、PIK3R1、RACGAP1和KIF11可能和HCC的预后不良相关,可作为未来HCC预后研究的参考标志物。  相似文献   

17.
《蛇志》2020,(1)
目的探讨强直性脊柱炎(AS)患者差异表达基因,并基于差异基因探讨强直性脊柱炎发病相关的可能生物学过程和信号通路。方法检索基因表达谱数据库(GEO)并筛选AS相关基因表达谱数据集。应用GEO在线分析功能GEO2R分析AS组和正常对照组的差异表达基因,用Cytoscape软件clueGO插件进行基因本体论和京都基因与基因组百科全书分析,采用String蛋白-蛋白相互作用(PPI)数据库分析差异表达基因编码蛋白间的相互作用;应用Cytoscape绘制蛋白相互作用网络图,并软件筛选信号通路关键基因分析。结果选取AS患者全血表达数据集GSE25101为研究对象,分析获得差异表达基因72个。72个差异表达基因分子功能主要为参与高迁移率族盒染色体蛋白1(HMGB1)转导机制;生物学过程主要富集于巨噬细胞迁移、骨髓细胞凋亡过程、线粒体呼吸链复合体装配、ATP合成偶联电子传输、线粒体ATP合成耦合电子输运等;细胞成分主要富集于呼吸链复合体、线粒体呼吸体等。信号通路富集于氧化磷酸化信号通路和帕金森综合征相关信号通路。PPI网络经过cytohubba插件筛选,ATP5J、NDUFS4、UQCRB、UQCRH、NDUFB3、COX7B、LSM3、ATP5EP2、ENY2、PSMA4被筛选为网络中的核心基因。结论通过生物信息学方法进行预测了AS的潜在机制,并筛选出10个潜在的与AS相关的重要分子,其中氧化磷酸化可能在AS发病机制中发挥了重要的作用。  相似文献   

18.
为探究氧化应激相关基因在心力衰竭发生发展中的作用,并发现核心基因进行靶基因药物预测。从GEO数据库下载GSE120895基因表达图谱,通过GEO2R筛选差异表达基因,将差异表达基因与GeneCard数据库中筛选的氧化应激相关基因取交集,得到心力衰竭氧化应激相关差异表达基因,利用R软件对差异表达基因进行GO及KEGG分析,利用Cytoscape进行PPI网络的模块以及关键基因的筛选。之后在GSE17800基因表达图谱中验证关键基因的表达,并针对关键基因进行相互作用药物预测。差异表达基因与氧化应激相关基因取交集后,共筛选出52个上调的氧化应激相关差异表达基因,在此基础上,筛选出ACTB,STAT3,FN1,EDN1,CAT共5个关键基因,在GSE17800基因表达图谱中验证后,针对4个关键基因预测了19个靶基因潜在药物。总之,本研究通过生物信息学方法鉴定关键基因,并预测潜在治疗药物,从而为了解心力衰竭的分子机制及其诊治方法提供新的见解。  相似文献   

19.
应用生物信息学方法筛选新型冠状病毒肺炎(corona virus disease 2019,COVID-19)感染的潜在关键分子生物标志物并分析其免疫浸润特征。从GEO数据库下载GSE152418数据集,其中COVID-19患者17例,健康对照17例。用加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)方法筛选出COVID-19最相关的模块基因。与差异基因取交集得到共同基因,进行功能及信号通路富集分析,构建蛋白互作网络筛选关键基因,构建关键基因的miRNATF-mRNA调控网络,用CIBERSORT算法预测样本免疫细胞浸润特征。差异分析得到2 049个差异基因。WGCNA分析7个模块中“土耳其蓝色”模块与COVID-19相关性最高(r=0.91,P<0.001)。模块中基因显著性和模块隶属度呈显著正相关(r=0.96,P<0.001)。得到共同基因766个,主要参与有丝分裂、微管结合、阳离子通道活性及卵母细胞减数分裂、细胞衰老等。蛋白互作网络筛选到前10位关键基因分别为CDK1、BUB1、CCNA2...  相似文献   

20.
脂肪的过度积累严重危害人类健康。前体脂肪细胞分化是脂肪发育的关键过程,研究前体脂肪细胞分化相关基因的表达有助于认识脂肪沉积的机理。尽管家兔是一种理想的研究脂肪发育的动物模型,但是针对其前体脂肪细胞分化不同时期基因表达谱的研究鲜见报道。本研究通过诱导家兔前体脂肪细胞分化,在分化第0 d、3 d和9 d收集脂肪细胞,利用转录组测序(RNA-seq),在分化第3 d样本与第0 d样本的比较中筛选出1352个差异表达基因(differentially expressed genes, DEGs),在分化第9 d样本与第3 d样本的比较中筛选出888个DEGs。GO (gene ontology)功能富集和KEGG (kyoto encyclopedia of genes and genomes)通路分析发现,0~3 d分化期上调的DEGs显著富集在PPAR信号通路和PI3K-Akt信号通路上,3~9d分化期上调的DEGs显著富集到与细胞周期调控有关的GO条目和KEGG信号通路,0~3d和3~9d阶段特异上调的DEGs可能分别作用于细胞质和细胞核。通过DEGs的蛋白-蛋白互作(protein-protein interaction, PPI)网络分析发现,筛选出的核心节点(hub node)基因可能通过调控细胞周期而影响家兔前体脂肪细胞分化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号