首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 739 毫秒
1.
本文利用先进的生物信息学方法,首次从全基因组水平综合基因表达、甲基化水平和拷贝数变异三类数据,寻找与肺鳞状细胞癌(LUSC)发生和发展密切相关的特征基因,为进一步解释其内在机理、开发新的靶向药物和治疗手段提供更加深入的理论依据.为克服全基因组数据超高维高噪声小样本特性对机器学习算法性能的影响,防止信息饱和现象的干扰,本文创新性地组合应用4种特征基因筛选方法,分别从特异性、相关性、生物学功能和对肿瘤分类模型的贡献等多个方面,通过迭代降维技术递归筛选真正的特征基因.研究中,我们以TCGA(The Cancer Genome Atlas project)数据库中的LUSCⅠ~Ⅲ期病人样本为例,对其基因表达数据(GE)、基因甲基化数据(ME)以及拷贝数变异数据(CNV)进行分析.结果筛选出67个GE特征基因,对3类样本分类的平均准确率达到86.29%,70个ME特征基因,相应的分类准确率为90.92%,31个CNV特征基因,相应的分类准确率为69.16%.KEGG(Kyoto Encyclopedia of Genes and Genomes)和IPA(Ingenuity Pathway Analysis)对上述3类特征基因集在代谢通路水平和基因调控网络水平上的分析,证明了其在调控水平上的密切关系.同时也表明,识别的特征基因与LUSC肿瘤进展之间有着重要的直接关系,这对了解肿瘤机理以及新靶向治疗的发展非常重要.  相似文献   

2.
本文选取癌症基因组图谱数据库的乳腺癌样本作为数据集,在全基因组的水平上研究乳腺癌病人从正常到发病Ⅰ期基因表达的变化,寻找与乳腺癌发病密切相关的特征基因,建立乳腺癌发生的模式识别分类方法,为乳腺癌预防及早期诊断提供理论支持.研究中,综合利用相关性、t检验、置信区间等统计学方法,建立乳腺癌发生特征基因筛选方法,获得与乳腺癌发生具有显著性差异的特征基因336个.通过机器学习方法建模,得到的分类准确率能达到98%以上,与之前乳腺癌相关的研究相比,准确率更高.同时采用KEGG(kyoto encyclopedia of genes and genomes)通路分析得到与基因显著相关(P0.05)的通路有8个,GO(gene ontology)基因功能富集分析显示与基因显著相关(P0.05)的功能有18个.最后对映射在8个通路中的一部分基因进行简要功能分析,说明了其在调控水平上的密切关系,表明识别的特征基因在乳腺癌的发生过程中有重要的作用,这对了解乳腺癌发病机理以及乳腺癌的早期诊断非常重要.  相似文献   

3.
从分子层面对泛癌进行研究已经得到了很大的进展,但是对宫颈鳞状细胞癌的分子分类研究仍然需要更多的探索.为了找到宫颈鳞状细胞癌潜在的子类,本文提出了一个基于多维组学数据的癌症亚型分类分析流程.通过统计学方法对癌症基因组图谱(The Cancer Genome Atlas,TCGA)宫颈鳞状细胞癌的mRNA表达数据、小分子核糖核酸(microRNA,miRNA)表达数据、DNA甲基化数据以及拷贝数变异数据4个维度包含的分子进行筛选,然后对筛选后的分类特征进行整合聚类,进一步筛选能够区分不同子类的关键分类特征,并使用这些关键分类特征建立宫颈鳞状细胞癌分类模型.本研究为宫颈鳞状细胞癌分子层面子类的识别提供了分析流程,得到了两个临床生存水平具有显著性差异的宫颈鳞状细胞癌子类,并确定了8个宫颈鳞状细胞癌的关键分类特征.本研究中识别的宫颈鳞状细胞癌子类和关键分类特征为宫颈鳞状细胞癌早期分类及分类标志物的鉴定提供了重要参考.  相似文献   

4.
华琳  郑卫英  刘红  林慧  高磊 《生物工程学报》2008,24(9):1643-1648
利用随机森林-通路分析法,通过袋外样本OOB的分类错误率筛选特征代谢通路,在特征通路上作基因表达相关性研究并对通路上的基因采用MAP(Mining attribute profile)算法挖掘不同实验条件下基因的共调控表达模式,对共调控表达模式进行聚类.分析结果显示同一特征代谢通路上的基因表达倾向相似,有2条特征代谢通路存在共表达模式.其中一条通路含108个表达模式,对这些模式进行聚类,其最低聚类的相似系数仍高达0.623.说明同一特征代谢通路上的基因共表达模式在不同实验条件下仍具有高度的相似性.对以通路作为基因模块进行复杂疾病的研究具有借鉴意义.  相似文献   

5.
DNA甲基化是真核生物基因组最重要的修饰方式之一。就植物DNA甲基化模式、建立、维持机制及其特征进行了综述,并且着重解释了植物DNA甲基化影响基因表达的机制。总结了在胁迫环境下单基因甲基化状态发生改变对于基因表达的影响,并对当前利用高通量测序技术分析植物全基因组范围内DNA甲基化与基因表达的关联分析研究进行综述。  相似文献   

6.
本研究对非小细胞肺癌(non-small cell lung carcinoma,NSCLC)基因表达数据进行差异表达分析,并与蛋白质相互作用网络(PPIN)数据进行整合,进一步利用Heinz搜索算法识别NSCLC相关的基因功能模块,并对模块中的基因进行功能(GO term)和通路(KEGG)富集分析,旨在探究肺癌发病分子机制。蛋白互作网络分析得到一个包含96个基因和117个相互作用的功能模块,以及8个对NSCLC的发生和发展起到关键作用候选基因标志物。富集分析结果表明,这些基因主要富集于基因转录催化及染色质调控等生物学过程,并在基础转录因子、黏着连接、细胞周期、Wnt信号通路及HTLV-Ⅰ感染等生物学通路中发挥重要作用。本研究对非小细胞肺癌相关的基因和生物学通路进行预测,可用于肺癌的早期诊断和早期治疗,以降低肺癌死亡率。  相似文献   

7.
夏遥  孔薇 《生物磁学》2011,(Z1):4742-4747
目的:基于阿尔茨海默病微阵列基因表达数据,分析研究微阵列基因表达数据预处理的新的有效方法。方法:首先采用标准差滤波、FSC(特征记分准则)和WPT-SAM(小波包变换-微阵列数据显著性分析)方法对微阵列基因表达数据进行预处理,比较处理后获得的基因数和FDR值;然后采用分类聚类方法对处理后的数据进行分类聚类和分层决策聚类,比较分类聚类结果。结果:标准差滤波和FSC方法获得的初筛基因数据较WPT-SAM方法多,但FDR值也高、后续分类聚类结果较WPT-SAM方法差。结论:WPT-SAM方法在预处理微阵列基因表达数据中,是比较灵活理想的分析方法。  相似文献   

8.
目的:基于阿尔茨海默病微阵列基因表达数据,分析研究微阵列基因表达数据预处理的新的有效方法.方法:首先采用标准差滤波、FSC(特征记分准则)和WPT-SAM(小波包变换-微阵列数据显著性分析)方法对微阵列基因表达数据进行预处理,比较处理后获得的基因数和FDR值;然后采用分类聚类方法对处理后的数据进行分类聚类和分层决策聚类,比较分类聚类结果.结果:标准差滤波和FSC方法获得的初筛基因数据较WPT-SAM方法多,但FDR值也高、后续分类聚类结果较WPT-SAM方法差.结论:WPT-SAM方法在预处理微阵列基因表达数据中,是比较灵活理想的分析方法.  相似文献   

9.
基因鉴定集成法:全基因组基因表达研究的新策略   总被引:2,自引:0,他引:2  
人类基因组包含的核苷酸数目庞大,基因鉴定(识别)的技术策略是基因克隆研究至为重要的基础。在全基因组基因表达分析策略方面,已相继建立了mRNA差异显示、代表性差异分析、抑制性消减杂交、基因表达系列分析和cDNA微阵列等技术。基因鉴定集成法是新近在综合上述技术的优缺点的基础上建立的全基因组分析新策略,具有充分利用生物基因信息数据库进行基因鉴定(识别),并能提高稀有拷贝基因鉴定效率的优点。本文简要介绍其  相似文献   

10.
该研究以核桃的复幼和成龄插穗为材料,通过甲基化修饰依赖性内切酶测序技术(MethylRAD-Seq),在全基因组水平上检测成龄与复幼插穗中DNA甲基化位点分布特征,进一步对复幼处理前后插穗中差异甲基化位点相关基因的表达情况进行分析。结果显示:(1)复幼处理可显著降低核桃插穗的DNA甲基化水平。(2)功能富集分析结果显示,差异甲基化位点相关基因主要参与油菜素内酯信号转导、次级代谢产物生物合成和木质素生物合成等功能,参与光合作用、MAPK(mitogen-activated protein kinase, MAPK)信号通路、果糖和甘露糖代谢、cAMP(cyclic AMP, CAMP)信号途径和苯丙烷生物合成等代谢通路。(3)qRT-PCR分析结果显示,复幼处理前后,不定根发生的关键调控基因NAC1、ARF5、ARF6和WRKY22在复幼和成龄材料中具有不同的表达模式。研究认为,复幼处理降低了核桃插穗中基因组DNA的甲基化水平,进而影响不定根发生过程关键功能基因的表达,可能是复幼调控核桃不定根发生能力的重要途径。  相似文献   

11.
本研究运用生物信息学方法识别非吸烟女性非小细胞肺癌(NSCLC)潜在的靶基因,并从分子水平探索其潜在的发病机制。从GEO数据库下载非吸烟女性非小细胞肺癌相关基因芯片数据集,经癌症组和癌旁对照组差异表达基因识别,并利用R软件对差异基因进行层次聚类分析,DAVID进行基因本体(gene ontology)和KEGG通路富集分析,STRING和Cytoscape软件构建蛋白-蛋白交互(PPI)网络,以及运用PASTAA分析,识别NSCLC相关转录因子,构建转录因子-基因共表达网络。结果表明,185个基因在NSCLC中差异表达,其中40个上调,145个下调;通过PASTAA分析识别出5个NSCLC基因相关转录因子。差异基因与胶原分解代谢过程、炎症反应的正调控等生物过程密切相关,基因的产物主要参与蛋白质细胞外基质、胶原三聚体等细胞组分,且主要发挥调节金属内肽酶活性、肝素结合和调节受体活性等分子功能;KEGG通路富集分析表明差异基因显著富集到胞外基质-受体信号通路、粘着斑信号通路、PPAR信号通和PI3K-Akt信号通路等,与非小细胞肺癌的发生发展密切相关。通过生物信息学方法,最终筛选到4个NSCLC关键基因:IL6、MMP1、COL1A1、CD36,其可能是非吸烟女性NSCLC潜在的治疗靶点。  相似文献   

12.
选取癌症基因组图谱数据库的肺鳞状细胞癌(Lung Squamous Cell Carcinoma,LUSC)样本作为数据集,在全基因组的水平上研究肺鳞状细胞癌病人从正常到发病I期基因表达的变化,寻找与LUSC发病密切相关的早期标志物,并建立一种基于早期标志基因的肿瘤预测模型。方法 采用模式识别分类法和基因通路和功能分析相结合的筛选方法,对LUSC的早期标志物进行识别,并运用Fisher判别建立肿瘤预测模型。得到12个LUSC的早期标志物,分别是CLDN18, CD34, ESAM, JAM2, CDH5, F11, F8, CFD, MRC1, MARCO, SFTPA2 和 SFTPA1,机器学习建模后对LUSC早期癌症样本和正常肺组织样本的分类精度达到了98%以上。由基因SFTPA1和ESAM建立的LUSC早期肿瘤预测模型,对正常肺组织和LUSC肿瘤Ⅰ期样本的分类敏感性和特异性分别为99.18%和100%,并且独立验证集的分类准确率也在90%以上。结论 筛选出的12个早期分子标志物有望成为LUSC诊断的标志分子,并且建立的肿瘤预测模型具有极高的准确性,可以为LUSC的发生机理研究以及早期肿瘤预测提供帮助。  相似文献   

13.
DNA甲基化微阵列   总被引:1,自引:0,他引:1  
DNA甲基化微阵列是近年发展起来的高通量分析基因组水平DNA甲基化状态和模式的新型技术,已成为肿瘤表观遗传学组研究的重要工具之一。利用DNA甲基化微阵列研究某种疾病状态下异常甲基化的基因有利于进一步明确该疾病的表观遗传学异常机制,发现与之相关的表观遗传学标志物。现有的DNA甲基化微阵列主要包括CpG岛微阵列和甲基化寡聚核苷探针微阵列,根据已有的文献资料,较为详细地阐述了上述技术的原理、特点和适用范围,对于研究者根据自己的研究目的选择适当的DNA甲基化微阵列技术具有一定的指导价值。  相似文献   

14.
基因组DNA甲基化及组蛋白甲基化   总被引:1,自引:0,他引:1  
王瑞娴  徐建红 《遗传》2014,(3):6-12
在真核生物中,DNA甲基化是一种非常重要的表观遗传学标记,能影响染色质的结构和基因的表达。随着全基因组甲基化测序的发展,全基因组范围内的DNA甲基化水平得以了解。文章概述了基因组中启动子、基因本体、增强子、沉默子和转座子等不同元件的DNA甲基化的研究进展,以及DNA甲基化与基因表达调控间的关系。启动子的DNA甲基化对基因的表达有抑制作用,而基因本体的DNA甲基化与基因的表达关系因物种或细胞类型不同而异。增强子的DNA甲基化状态与基因活性呈反比关系,沉默子则相反呈正相关。转座子的DNA高度甲基化抑制其转座活性,从而维持基因组的稳定性。文章还探讨了DNA甲基化与组蛋白甲基化间的相互作用及其对基因表达、可变剪切、转录的调控作用,以及本领域的未来研究方向。  相似文献   

15.
癌症通常由基因变异的累积所驱动,有效地识别癌症的驱动突变是一个巨大的挑战。目前已有方法更多是通过将基因组区域中观察到的突变率与背景突变率(BMR)预期的突变率进行比较或功能影响测试来识别驱动基因,该驱动基因本质上是存在统计异常的基因。而且并未对已有明确分类的癌症的子类之间驱动基因进行研究。本文引入关联规则算法,探寻发生该基因突变诱使病人患该子类低级别脑胶质瘤的有效规则,将突变数据与患癌结果通过算法建立关系,再通过支持度、置信度和提升度这三个指标对产生的规则进行筛选和评估,来预测候选驱动基因以及类间驱动基因差异。最后利用491例低级别脑胶质瘤体细胞突变数据,得到22个与结果存在关联的驱动基因及其所属的子类,敏感性和假阳性结果优于目前已有的单一算法,且22个基因均具有重要的生物学功能。同时建立了基于22个基因的低级别脑胶质瘤子类识别方法,模型总体准确率达98.99%,方法可有效区分三子类。  相似文献   

16.
为探讨DNA甲基化在睾酮缺乏促进高脂饮食诱导的小型猪肥胖中的作用,本研究采用甲基化DNA免疫共沉淀测序(MeDIP-Seq)技术分析高脂饲喂的不去势、去势和去势+睾酮3组小型猪内脏脂肪组织DNA甲基化差异,对筛选出的差异甲基化基因进行注释和功能富集分析,并运用RT-qPCR技术检测差异甲基化基因的表达.结果 表明,不去势、去势和去势+睾酮3组样本在基因组上的甲基化分布情况相似,即Genebody区的甲基化水平高于3'UTR和5'UTR区.另外,在去势Vs.不去势和去势Vs.去势+睾酮两组样本中分别筛选得到2839个和2510个差异甲基化基因,这些基因主要富集在脂肪细胞因子转导、抗原处理以及呈递、脂肪酸代谢和氨基酸代谢等通路.睾酮缺乏导致高脂饲喂小型猪内脏脂肪组织LEP以及NCF1内含子区甲基化和SLC-27A1启动子区甲基化水平升高,并且LEP和NCF1 mRNA表达与甲基化呈正相关,而SLC27A1 mR-NA表达与甲基化呈负相关.本研究推测,睾酮缺乏可能通过影响脂质代谢和炎症反应等多个途径基因DNA甲基化参与调控脂肪沉积和肥胖发生.  相似文献   

17.
DNA甲基化与基因表达调控研究进展   总被引:4,自引:0,他引:4  
表观遗传修饰是指不改变DNA序列的、可遗传的对碱基和组蛋白的化学修饰,主要包括DNA甲基化、组蛋白修饰、染色质重塑以及非编码RNA等.表观遗传修饰是更高层次的基因表达调控手段.DNA甲基化是一种重要的表观遗传修饰,参与基因表达调控、基因印记、转座子沉默、X染色体失活以及癌症发生等重要生物学过程.近年来随着研究方法和技术的进步,全基因组DNA甲基化的研究广泛兴起,多个物种全基因组甲基化图谱被破译,全局水平对DNA甲基化的研究不仅利于在宏观层面上了解DNA甲基化的特性与规律,同时也为深入分析DNA甲基化的生物学功能与调控奠定了基础.结合最新研究进展综述DNA甲基化在基因组中的分布模式、规律以及和基因转录的关系等.  相似文献   

18.
目的:研究NANOGP8基因在肺癌细胞系A549中启动子区域甲基化水平及其与基因表达的相关性。方法:利用MethPrimer甲基化岛预测和甲基化引物设计软件,预测NANOGP8启动子区甲基化位点。分别从人成纤维细胞系和肺癌细胞系中提取基因组DNA,经过亚硫酸氢钠处理后,用针对甲基化位点设计的引物进行PCR扩增,获得相应区段DNA后,连接到pGEM-T载体,转化大肠杆菌鉴定阳性克隆后,测序并与GenBank数据库中NANOGP8基因组DNA序列比对,获得其甲基化水平数据。分别提取两个细胞系的总RNA,RT-PCR获得相应cDNA进行PCR扩增,扩增产物经琼脂糖凝胶电泳后,经酶切和测序验证,获取其表达水平数据。结果:成功预测NANOGP8的两个区域有甲基化位点,并检测到人成纤维细胞系和肺癌A549细胞系中NANOGP8启动子甲基化水平分别为59.7%和12.5%,表达检测结果显示在A549细胞系中检测到NANOGP8的基因片段,而在人成纤维细胞系中没有扩增到相应产物。结论:在正常成体细胞中NANOGP8基因由于启动子的高度甲基化而沉默,而在肺癌细胞系中NANOGP8基因启动子去甲基化激活其表达。NANOGP8基因的表达与其启动子区域去甲基化密切相关,同时NANOGP8在肺癌细胞分化过程中发挥重要作用。  相似文献   

19.
目的:探讨生长因子颗粒蛋白前体(PGRN)、肿瘤坏死因子受体(TNFR)基因启动子区改变以及全基因组DNA甲基化与阿尔茨海默病的相关性。方法:收集阿尔茨海默病患者血液样本80例以及健康对照血液样本80例,PCR扩增PGRN和TNFR基因启动子区并进行测序,观察两组间的单核苷酸多态性位点是否有差异。同时,用甲基化特异性PCR法检测启动子区DNA甲基化情况以及用ELISA法检测全基因组DNA甲基化水平。结果:在TNFR基因启动子区域发现阿尔茨海默病和对照组之间在多态性位点rs4149570和rs4149569有显著性差异(P0.001和P=0.033)。阿尔茨海默病患者全基因组甲基化水平为(0.79±0.29)%,显著低于对照组的(1.00±0.36)%(P0.001)。结论:TNFR基因多态性位点rs4149570和rs4149569的变异可能与阿尔茨海默病相关,全基因组甲基化水平降低可能与阿尔茨海默病相关。  相似文献   

20.
基于基因表达谱的肿瘤特异基因表达模式研究   总被引:1,自引:1,他引:0  
基于肿瘤基因表达谱, 利用生物信息学的方法, 从肿瘤与正常组织的样本分类入手就肿瘤特异表达基因的发现及其表达模式问题进行了分析和研究, 进而探讨了肿瘤在基因表达上的特点. 首先, 在分析肿瘤基因表达谱特点的基础上, 提出了基于Relief算法的样本分类特征基因选取策略; 然后, 以支持向量机为分类工具进行样本类型的识别, 以分类错误率为标准选取样本分类特征基因, 并对其中反映肿瘤与正常样本组织构成特点的组织特异表达基因进行排除以突出肿瘤样本真实的类别特征; 最后结合统计学方法, 从信息学的角度论证了分类特征基因在肿瘤组织中特异表达的确实性和普遍性, 并对这些基因在肿瘤组织中呈现出的特异的表达模式进行了分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号