首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 23 毫秒
1.
基于SVM和平均影响值的人肿瘤信息基因提取   总被引:1,自引:0,他引:1       下载免费PDF全文
基于基因表达谱的肿瘤分类信息基因选取是发现肿瘤特异表达基因、探索肿瘤基因表达模式的重要手段。借助由基因表达谱获得的分类信息进行肿瘤诊断是当今生物信息学领域中的一个重要研究方向,有望成为临床医学上一种快速而有效的肿瘤分子诊断方法。鉴于肿瘤基因表达谱样本数据维数高、样本量小以及噪音大等特点,提出一种结合支持向量机应用平均影响值来寻找肿瘤信息基因的算法,其优点是能够搜索到基因数量尽可能少而分类能力尽可能强的多个信息基因子集。采用二分类肿瘤数据集验证算法的可行性和有效性,对于结肠癌样本集,只需3个基因就能获得100%的留一法交叉验证识别准确率。为避免样本集的不同划分对分类性能的影响,进一步采用全折交叉验证方法来评估各信息基因子集的分类性能,优选出更可靠的信息基因子集。与基它肿瘤分类方法相比,实验结果在信息基因数量以及分类性能方面具有明显的优势。  相似文献   

2.
[目的]基于GEO数据库中乳腺癌相关基因表达谱芯片,探讨乳腺癌组织及正常乳腺组织基因表达差异.[方法]收集2016年10月~2017年10月于医院进行乳腺癌根治术患者乳腺癌组织及其对应正常乳腺组织,共213对样本.GEO数据库提取乳腺癌相关基因表达谱芯片数据,根据筛选基因对应基因差异倍数(FC)对数值,定义表达上调和下...  相似文献   

3.
基于基因表达谱的疾病亚型特征基因挖掘方法   总被引:1,自引:0,他引:1  
在本研究中,提出了一种基于基因表达谱的疾病亚型特征基因挖掘方法,该方法基于过滤后基因表达谱,融合无监督聚类识别疾病亚型技术和提出的衡量特征基因对疾病亚型鉴别能力的模式质量测度,以嵌入的方式实现特征基因挖掘。最后将提出的方法应用于40例结肠癌组织与22例正常结肠组织中2000个基因的表达谱实验数据,结果显示:提出的方法是一种可行的疾病亚型特征基因挖掘方法,方法的优势在于可并行实现疾病亚型划分和特征基因识别。  相似文献   

4.
为分析甲状腺癌基因表达谱,筛选疾病相关的基因标志物。基于肿瘤基因组图谱(TCGA)数据库中的甲状腺癌基因表达数据,运用R/Bioconductor统计平台进行数据处理与统计学分析。分别应用edgeR算法和limma算法选取肿瘤组织与对照组间倍数改变 > 2,P< 0.05的基因作为差异基因;进一步运用Medcalc统计软件进行受试者工作特征曲线(ROC)分析,鉴定出有诊断标志物潜在应用价值的基因标志物。通过两种运算方法筛选出甲状腺癌组织中存在着1 945个差异基因(上调基因1 033个,下调基因912个);根据差异倍数进一步鉴定出11个基因在肿瘤组织中表达上调,且对鉴别肿瘤组与对照组有较好的应用价值。本研究分析了TCGA中的甲状腺癌表达谱数据,鉴定出了与疾病诊断显著相关的差异表达基因,能够为探索疾病发生发展机制及寻找新型分子标志物提供依据。  相似文献   

5.
Wang GS  Cui WW  Wu BY  Wang MW 《中国应用生理学杂志》2008,24(3):334-337,I0004
目的:筛选人类正常胃肠道组织特异性高表达基因.方法:以公开发表的人类正常组织基因表达数据库资料为研究对象,应用单侧 Student T检验筛选胃、回肠和结肠组织的特异性高表达基因.Ingenuity软件和KEGG分析特异性高表达基因相关的生理功能;Cluster软件分析胃特异性高表达基因谱在胃癌基因数据库中的表达特征.结果:筛选出胃高表达基因196个,回肠高表达基因203个,结肠高表达基因224个,高表达基因的功能与胃肠道的主要生理功能相吻合.筛选出的正常胃肠高表达基因中含有一些癌基因和抑癌基因.系统聚类分析发现胃特异性高表达基因在胃癌数据库的胃正常组织中高表达,而相应的胃癌组织低表达,癌组织和正常组织可以完好聚类分组,并且可以区分中分化和低分化胃癌.结论:人类正常胃、回肠和结肠具有组织特异的与生理功能密切相关的高表达基因群.  相似文献   

6.
通过对基因表达谱数据的分析从而促进肿瘤诊断与治疗技术的发展,其研究正成为生物医学领域的一个热点。因此,提出了一种熵信息处理和主成分分析(principal component analysis,PCA)相结合的方法。首先运用熵信息对超高维基因表达谱数据进行粗选取,得到特征基因子集;由于基因子集仍存在相关性,进而利用PCA对其进一步冗余剔除;最后对得到的无冗余且具有正交性信息的基因特征进行真实数据实验。实验结果显示所采用的方法能有效去除肿瘤样本中的不相关和冗余信息,同时最大程度的保留肿瘤分类信息。与其他肿瘤分类方法相比,在精度上具有比较明显的优势,从而验证了该方法是有效的、可行的。  相似文献   

7.
目的:运用基因表达谱芯片筛选并分析新疆维吾尔族与汉族胰腺癌组织样本间的差异表达基因。方法:收集我院2014年1月至2016年6月间行手术切除的维吾尔族与汉族胰腺导管细胞癌组织并提取总RNA,选取经Nanodrop 2000与Agilent 2100仪器质检合格的样本总RNA采用Affymetrix基因表达谱芯片筛选出差异表达基因并绘制统计图,运用基因本体(GO)分析及信号通路(Pathway)分析对这些差异表达基因的生物信息进行汇总分析。结果:通过基因表达谱芯片分析,新疆维吾尔族与汉族胰腺癌组织样本间共检测到1063个基因存在差异表达,在维吾尔族胰腺癌标本中显著上调表达的基因共281个,差异表达倍数最高的为IGLV1-44基因(差异倍数:9.99)下调表达的基因共782个,差异表达倍数最高的为CPB1基因(差异倍数:33.76);在Gene Ontology数据库中共检索到815个上述差异表达基因具有明确的GO分类,差异表达倍数最高的为CPB1基因(差异倍数:33.76);Pathway分析中共检测到30条信号通路包含有上述差异表达基因,共涉及196个基因,其中以FAK信号通路差异表达基因富集程度最高,差异表达倍数最高的基因为COL11A1基因(差异倍数:5.02)。结论:基因表达谱芯片分析结果显示,在新疆维吾尔族与汉族胰腺癌组织样本间存在大量的差异表达基因,这些基因与胰腺癌的增殖分化、侵袭转移及多药耐药等特性密切相关,且参与了多条生物体内重要信号转导通路的调控。  相似文献   

8.
华琳  郑卫英  刘红  林慧  高磊 《生物工程学报》2008,24(9):1643-1648
利用随机森林-通路分析法,通过袋外样本OOB的分类错误率筛选特征代谢通路,在特征通路上作基因表达相关性研究并对通路上的基因采用MAP(Mining attribute profile)算法挖掘不同实验条件下基因的共调控表达模式,对共调控表达模式进行聚类.分析结果显示同一特征代谢通路上的基因表达倾向相似,有2条特征代谢通路存在共表达模式.其中一条通路含108个表达模式,对这些模式进行聚类,其最低聚类的相似系数仍高达0.623.说明同一特征代谢通路上的基因共表达模式在不同实验条件下仍具有高度的相似性.对以通路作为基因模块进行复杂疾病的研究具有借鉴意义.  相似文献   

9.
基于基因表达谱的肿瘤分型和特征基因选取   总被引:20,自引:0,他引:20  
在分析基因表达谱数据特性的基础上,提出了一个将之用于肿瘤分子分型和选型和选取相应亚型特征基因的策略。该策略包括三个步骤:首先采用一个无监督的基因过滤算法以降低用于分型计算的数据的噪声,其次提出了一个概率模型对样本中的分类结构进行建模,最后基于聚类的结果采用相对熵的方法获得对分类贡献大的基因作为特征基因,应用该策略对两个公开发表的数据集进行了再挖掘,结果表明不但获得了其他方法可以得到的信息,而且还提供了更精细、更具有显著生物学意义的信息,具有明显的优越性。  相似文献   

10.
目的:探讨糖尿病患者肝脏与正常对照肝脏基因表达谱的变化,并进行代谢通路生物信息学分析.方法:应用Affymetrix的Human Genome U133A array芯片检测糖尿病肝脏组织(n=2)和正常对照肝脏组织(n=2)的基因表达谱变化,通过DAVID分析平台对芯片监测到的表达上调的基因进行KEGG通路分析,并用RT-PCR验证部分基因的表达情况.结果:以比值大于2或小于-2为准,共有492条基因明显上调,820条基因明显下调;在差异表达明显的前20位基因中,涉及氧化应激、免疫炎症反应和脂代谢.KEC-G代谢通路分析显示:该差异表达基因谱符合2型糖尿病的发病机制,其差异表达明显基因的代谢通路涉及胰岛素信号通路、脂代谢、补体和凝血系统、糖代谢、粘附功能和细胞因子和受体的相互作用.RT-PCR证实差异表达明显基因SOD2mRNA和CRPmRNA确实表达明显上调.结论:糖尿病肝脏与正常肝脏组织基因表达谱的变化在代谢通路上主要表现为在糖、脂代谢和胰岛素信号通路、补体和凝血系统等的改变,肝脏在糖尿病发病机制中的作用可能与其参与糖脂代谢和胰岛素的作用异常有关.  相似文献   

11.
基因表达系列分析(SAGE)技术在肿瘤研究中的应用   总被引:1,自引:0,他引:1  
基因表达系列分析(serial analysis of gene expression,SAGE)是一项高效、快捷、低成本的研究生物基因表达水平的方法,广泛用于各种肿瘤的分析研究。SAGE技术对于全面分析肿瘤组织基因表达谱、寻找肿瘤特异性表达新基因、发现肿瘤组织特异标志物和揭示肿瘤发病的分子机制发挥重要的作用。随着“肿瘤基因组解剖工程”(CGAP)的进行,CGAP SAGE可以通过网站分析和展示SAGE数据,并自动的将基因名称和SAGE转录物水平联系起来。因此,这为SAGE技术深入和广泛研究肿瘤提供了方便。  相似文献   

12.
王蕊平  王年  苏亮亮  陈乐 《生物信息学》2011,9(2):164-166,170
海量数据的存在是现代信息社会的一大特点,如何在成千上万的基因中有效地选出样本的分类特征对癌症的诊治具有重要意义。采用局部非负矩阵分解方法对癌症基因表达谱数据进行特征提取。首先对基因表达谱数据进行筛选,然后构造局部非负矩阵并对其进行分解得到维数低、能充分表征样本的特征向量,最后用支持向量机对特征向量进行分类。结果表明该方法的可行性和有效性。  相似文献   

13.
基因表达谱代表了细胞中基因表达的状况。通过比较肿瘤细胞和相应正常组织细胞的基因表达谱所获得的信息,就可获得在肿瘤和正常细胞中差异表达的基因,进一步研究这些基因的结构和功能,对研究肿瘤的发生发展和肿瘤的临床诊断和治疗都具有重要的意义。本文着重介绍了目前常用的研究肿瘤基因表达谱的各种方法,包括mRNA水平和蛋白质水平肿瘤基因表达谱的研究方法,国内外的最新研究进展及应用前景。  相似文献   

14.
MAGE D1是黑色素瘤抗原编码基因家族 (MAGE)中MAGE D亚家族的新成员 .为了研究该基因的性质及其可能功能 ,采用Northernblot和Dotblot杂交技术研究了其组织表达谱 .结果发现 ,该基因在多种肿瘤组织和正常组织中均广泛表达 .在所检测的 4 8种肿瘤组织中 ,经与对应正常组织进行比较发现 ,该基因在 13种肿瘤组织中的表达显著增高 ,而在 7种肿瘤组织中的表达则显著降低 .进一步分析提示该基因在多种胚胎组织中的表达高于成年组织 .由于MAGE A、 B、 C亚家族均具有在肿瘤组织 睾丸中特异表达的特点 ,而作为MAGE D亚家族成员的MAGE D1并非在肿瘤组织中特异表达 ,提示需要对MAGE基因家族进行深入的功能研究 .  相似文献   

15.
目的:探讨弥漫大B细胞淋巴瘤(Diffuse Large B-Cell Lymphoma,DLBCL)中1号染色体基因表达情况。方法:采用激光显微切割技术分离临床DLBCL病人淋巴结标本中的淋巴细胞,提取淋巴细胞的mRNA并与表达谱芯片杂交,通过信号扫描、处理后获得表达基因杂交信号强度。每基因设11-20对探针。杂交信号与错配探针对比,扣除背景值后,使用Wilcoxon符号秩和检验选取与错配杂交信号有显著差异的基因作为分析结果(P=0.05)。然后随机选取四个检测到的基因,使用PCR方法检验基因芯片结果的可靠性。结果:成功地从快速冷冻保存的DLBCL标本中提取RNA。使用表达谱芯片进行研究,发现了共316条1号染色体编码的基因在DLBCL细胞中表达。根据胞内定位,基因功能和基因所属的代谢通路三种分类方法对所得基因进行分类分析。基因表达密度分析显示DLBCL中1号染色体上的基因表达情况与编码基因分布情况存在统计学差异。结论:使用表达谱芯片研究了DLBCL中1号染色体上的基因表达情况。  相似文献   

16.
目的:研究弥漫大B淋巴瘤(Diffuse Large B-Cell Lymphoma,DLBCL)12号染色体基因表达情况。方法:收取临床DLBCL病人淋巴结标本液氮速冻,快速冷冻切片,采用激光显微切割技术分离单纯淋巴瘤细胞,提取淋巴瘤细胞中的mRNA与表达谱芯片杂交,通过信号扫描、处理后获得表达基因杂交信号强度。每基因设11-20对探针。杂交信号与错配探针对比,扣除背景值后,使用Wilcoxon符号秩和检验选取与错配杂交信号有显著差异的基因作为分析结果(P=0.05)。随机选取两个检测到的基因,使用PCR方法检验基因芯片结果的可靠性。结果:成功地从快速冷冻保存的DLBCL标本中提取了RNA。使用表达谱芯片进行研究,发现了共164条12号染色体编码的基因在淋巴瘤细胞中表达。并根据胞内定位,基因功能和基因所属的代谢通路三种分类方法对所得基因进行分类分析。基因表达密度分析显示12号染色体上的基因表达情况与编码基因分布情况比较一致。结论:使用表达谱芯片研究了12号染色体上的基因表达情况,为研究DLBCL提供了依据。  相似文献   

17.
目的:从基因水平研究蠕虫感染和自身免疫性疾病之间的关系,发展治疗自身免疫病的新策略.方法:使用Gene Ontology和two-way ANOVA的方法,通过GeneSiRer VizX Labs LLC,Seattle,WA,USA软件对肺组织钩虫感染的基因表达谱进行分析.结果:得到具有种系效应的517个差异基因,对这些基因聚类,可以划分为在WT小鼠高表达和低表达两类,其中参与黄体酮代谢的基因Afp在WT小鼠肺组织呈过表达状态.结论:Th2细胞活化对自身免疫性疾病多发性硬化(Ms)具有抑制作用,并筛选出了Th2反应中的9个特异基因.  相似文献   

18.
基于肿瘤基因表达谱的肿瘤分类是生物信息学的一个重要研究内容。传统的肿瘤信息特征提取方法大多基于信息基因选择方法,但是在筛选基因时,不可避免的会造成分类信息的流失。提出了一种基于邻接矩阵分解的肿瘤亚型特征提取方法,首先对肿瘤基因表达谱数据构造高斯权邻接矩阵,接着对邻接矩阵进行奇异值分解,最后将分解得到的正交矩阵特征行向量作为分类特征输入支持向量机进行分类识别。采用留一法对白血病两个亚型的基因表达谱数据集进行实验,实验结果证明了该方法的可行性和有效性。  相似文献   

19.
洪靖君 《生命的化学》2001,21(5):397-398
表达谱芯片 ,是指将几千个基因特异的探针或其cDNA片段固定在一块基因芯片上 ,对来源于不同个体 (正常人与患者 )、不同组织、不同细胞周期、不同发育阶段、不同病变、不同刺激 (包括不同诱导、不同治疗手段 )下的细胞内的mRNA或逆转录产物cDNA进行检测从而大规模对这些基因表达的个体特异性、组织特异性、发育特异性、分化阶段特异性、病变特异性、刺激特异性进行综合的分析和判断。基因表达谱芯片研究基因在不同组织或细胞、不同发育阶段中基因表达的改变 ,通过基因表达的改变进而阐明基因的功能。1 .杂交信号检测原理用不同…  相似文献   

20.
为研制肿瘤相关寡核苷酸芯片,并实现其在抗肿瘤反义核酸“癌泰得”作用机理研究方面的初步应用,制备了包含近450种肿瘤相关基因特异寡核苷酸探针的寡核苷酸芯片,建立了相应的质控标准.“癌泰得”用脂质体转染HepG2肿瘤细胞,提取细胞总RNA反转录并荧光标记cDNA,用制备的寡核苷酸芯片检测肝癌细胞HepG2的肿瘤相关基因表达水平,用软件分析获得其差异基因表达谱.0.4 μmol/L的反义核酸“癌泰得”作用于HepG2细胞15 h后,MDNCF、DHS等基因mRNA表达下调,MUC2、MPP11、LAT、HRIF-B、JNK3A1等mRNA基因表达上调,初步检测到了“癌泰得”的抗肿瘤作用可能的相关基因,为进一步的分子作用机理的探讨奠定基础.结果表明,制备的肿瘤相关芯片敏感度高、特异性高、重复性均较好,可用于检测肿瘤相关基因的表达谱,为临床诊断和基础研究提供了技术平台.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号