首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 70 毫秒
1.
由于基因表达数据高属性维、低样本维的特点,Fisher分类器对该种数据分类性能不是很高。本文提出了Fisher的改进算法Fisher-List。该算法独特之处在于为每个类别确定一个决策阀值,每个阀值既包含总体样本信息,又含有某些对分类至关重要的个体样本信息。本文用实验证明新算法在基因表达数据分类方面比Fisher、LogitBoost、AdaBoost、k-近邻法、决策树和支持向量机具有更高的性能。  相似文献   

2.
基因调控网络模型为深入理解生命本质提供了一个新的研究框架和平台。作为基因调控网络模型的其中一种,互信息关联网络模型使用熵和互信息描述基因和基因之间的关联。本文描述了用互信息度量基因表达相似性的方法,提出基于Bootstrap的互信息估计算法,并对产生的偏离现象提出了改进策略。实验结果表明,改进的互信息估计方法可以有效提高基因表达相似性估计的精确度。  相似文献   

3.
王蕊平  王年  苏亮亮  陈乐 《生物信息学》2011,9(2):164-166,170
海量数据的存在是现代信息社会的一大特点,如何在成千上万的基因中有效地选出样本的分类特征对癌症的诊治具有重要意义。采用局部非负矩阵分解方法对癌症基因表达谱数据进行特征提取。首先对基因表达谱数据进行筛选,然后构造局部非负矩阵并对其进行分解得到维数低、能充分表征样本的特征向量,最后用支持向量机对特征向量进行分类。结果表明该方法的可行性和有效性。  相似文献   

4.
苏洪全  朱义胜  姜玉梅 《生物信息学》2010,8(4):356-358,363
基因表达系列分析(Serial analysis of gene expression,SAGE)是一种基因表达数据,反映了细胞内的动态变化。模式识别和可视化方法是分析SAGE数据的基本工具,但是由于缺乏描述数据的统计特性,传统的聚类分析技术不适用于SAGE数据的分析。本文提出了一种基于多分类和支持向量机的SAGE数据的分析法。经过对模拟数据和人类癌症SAGE数据的分析,基于径向基核函数的多分类支持向量机算法"一对一"(one-against-one,OAO)算法提供了比PoissonC和PoissonS更好的分类结果。  相似文献   

5.
针对局部线性嵌入算法(LocalLinearEmbedding,LLE)利用试凑法寻找近邻数耗时的缺陷性,提出一种增强的核局部线性嵌入算法(EnhancedKernelLocalLinearEmbedding,EKLLE)自动为样本分配邻域;该算法以高斯核函数为核心改进标准LLE距离度量准则,结合样本的类别信息,无需人工干预自动为样本设置不同的近邻数,克服了试凑法获得最优结果时需要大量时间;最后在各样本近邻数不相同的情况下对数据进行维数简约及待测样本分类。EKLLE算法有效地将高维基因表达谱数据映射到低维本质空间中,解决了传统LLE算法不能很好地处理合噪声或者稀疏数据的缺点。通过对比其他肿瘤样本分类实验,验证本文方法的实时性和精确性。  相似文献   

6.
基于基因表达谱的肿瘤特异基因表达模式研究   总被引:1,自引:1,他引:0  
基于肿瘤基因表达谱, 利用生物信息学的方法, 从肿瘤与正常组织的样本分类入手就肿瘤特异表达基因的发现及其表达模式问题进行了分析和研究, 进而探讨了肿瘤在基因表达上的特点. 首先, 在分析肿瘤基因表达谱特点的基础上, 提出了基于Relief算法的样本分类特征基因选取策略; 然后, 以支持向量机为分类工具进行样本类型的识别, 以分类错误率为标准选取样本分类特征基因, 并对其中反映肿瘤与正常样本组织构成特点的组织特异表达基因进行排除以突出肿瘤样本真实的类别特征; 最后结合统计学方法, 从信息学的角度论证了分类特征基因在肿瘤组织中特异表达的确实性和普遍性, 并对这些基因在肿瘤组织中呈现出的特异的表达模式进行了分析.  相似文献   

7.
夏遥  孔薇 《生物磁学》2011,(Z1):4742-4747
目的:基于阿尔茨海默病微阵列基因表达数据,分析研究微阵列基因表达数据预处理的新的有效方法。方法:首先采用标准差滤波、FSC(特征记分准则)和WPT-SAM(小波包变换-微阵列数据显著性分析)方法对微阵列基因表达数据进行预处理,比较处理后获得的基因数和FDR值;然后采用分类聚类方法对处理后的数据进行分类聚类和分层决策聚类,比较分类聚类结果。结果:标准差滤波和FSC方法获得的初筛基因数据较WPT-SAM方法多,但FDR值也高、后续分类聚类结果较WPT-SAM方法差。结论:WPT-SAM方法在预处理微阵列基因表达数据中,是比较灵活理想的分析方法。  相似文献   

8.
目的:基于阿尔茨海默病微阵列基因表达数据,分析研究微阵列基因表达数据预处理的新的有效方法.方法:首先采用标准差滤波、FSC(特征记分准则)和WPT-SAM(小波包变换-微阵列数据显著性分析)方法对微阵列基因表达数据进行预处理,比较处理后获得的基因数和FDR值;然后采用分类聚类方法对处理后的数据进行分类聚类和分层决策聚类,比较分类聚类结果.结果:标准差滤波和FSC方法获得的初筛基因数据较WPT-SAM方法多,但FDR值也高、后续分类聚类结果较WPT-SAM方法差.结论:WPT-SAM方法在预处理微阵列基因表达数据中,是比较灵活理想的分析方法.  相似文献   

9.
基因表达谱聚类/分类技术研究及展望   总被引:3,自引:0,他引:3       下载免费PDF全文
随着人类及多种模式生物全基因组测序基本完成,人类基因组计划的研究进入后基因组时代.后基因组时代研究的焦点已经从测序转向功能研究。聚类/分类技术作为分析基因表达谱和识别基因功能的重要工具之一,近年来获得很大的发展。对目前基因表达谱聚类/分类技术及它们的发展,进行了综述性的研究,分析了它们的优缺点,结合我们的研究,提出了解决问题的思路和方法,为基因表达谱的进一步研究提供了新的途径。  相似文献   

10.
基于遗传算法的基因表达数据的K-均值聚类分析   总被引:1,自引:0,他引:1  
聚类算法在基因表达数据的分析处理过程中得到日益广泛的应用。本文通过把K-均值聚类算法引入到遗传算法中,结合基因微阵列的特点,来讨论一种基于遗传算法的K-均值聚类模型,目的是利用遗传算法的全局性来提高聚类算法找到全局最优的可能性,实验结果证明,该算法可以很好地解决某些基因表达数据的聚类分析问题。  相似文献   

11.
利用基因芯片可以得到不同基因在不同生命过程中的表达,因此在医学诊断与病变分析中受到重视,并开始大量应用.经测定发现,不同基因在病变过程的不同阶段中的表达是不相同的,由此可以得到在病变过程的不同基因的表达特征.在本文中,我们给出了乳腺癌在转移过程中的基因表达特征的聚类分析法分析,并改进了k-means聚类算法,使之具有自动搜索聚类数的功能,并且有助于改善k-means算法的聚类结果陷入局部最小值的状况.通过对平均聚类误差指标的比较,kr—means要优于k-means算法.本文所得到的结果可供乳腺癌诊断与病变分析参考,同时可以应用于小型基因检测芯片的制备,也可以用于构建基因网络调控图.  相似文献   

12.
黄伟  尹京苑 《生物信息学》2009,7(4):243-247
根据肿瘤分类检测模型的特点,提出了一种新的算法,该算法结合使用了基因选择和数据抽取的有效方法,并在此基础上使用支持向量机对基因表达数据进行分类或者检测。其中乳腺癌的分类交叉验证结果由88.46%提高到100.0%,急性白血病的也由71.05%提高至100.0%。实验结果说明了这一方法的有效性,为在大量的基因表达数据中提高检测癌症的准确性提出了一种比较通用的方法。  相似文献   

13.
14.

Background

Symptomatic infection by dengue virus (DENV) can range from dengue fever (DF) to dengue haemorrhagic fever (DHF), however, the determinants of DF or DHF progression are not completely understood. It is hypothesised that host innate immune response factors are involved in modulating the disease outcome and the expression levels of genes involved in this response could be used as early prognostic markers for disease severity.

Methodology/Principal Findings

mRNA expression levels of genes involved in DENV innate immune responses were measured using quantitative real time PCR (qPCR). Here, we present a novel application of the support vector machines (SVM) algorithm to analyze the expression pattern of 12 genes in peripheral blood mononuclear cells (PBMCs) of 28 dengue patients (13 DHF and 15 DF) during acute viral infection. The SVM model was trained using gene expression data of these genes and achieved the highest accuracy of ∼85% with leave-one-out cross-validation. Through selective removal of gene expression data from the SVM model, we have identified seven genes (MYD88, TLR7, TLR3, MDA5, IRF3, IFN-α and CLEC5A) that may be central in differentiating DF patients from DHF, with MYD88 and TLR7 observed to be the most important. Though the individual removal of expression data of five other genes had no impact on the overall accuracy, a significant combined role was observed when the SVM model of the two main genes (MYD88 and TLR7) was re-trained to include the five genes, increasing the overall accuracy to ∼96%.

Conclusions/Significance

Here, we present a novel use of the SVM algorithm to classify DF and DHF patients, as well as to elucidate the significance of the various genes involved. It was observed that seven genes are critical in classifying DF and DHF patients: TLR3, MDA5, IRF3, IFN-α, CLEC5A, and the two most important MYD88 and TLR7. While these preliminary results are promising, further experimental investigation is necessary to validate their specific roles in dengue disease.  相似文献   

15.
用杆状病毒载体在家蚕细胞中表达HBeAg基因   总被引:2,自引:0,他引:2  
以PCR技术扩增含有PreC信号肽序列及完整的HBeAg基因的序列(即HBcAg基因5′端447bp),在5′端加上合适的酶切位点,克隆到家蚕核多角体病毒转移载体pBm030上,与野生型BmNPVDNA共转染家蚕BmN细胞,空斑纯化后得到多角体基因失活的重组病毒。ELISA法测定表明培养液上清中HBeAg效价达1∶32000,细胞内HBeAg效价为1∶2000,培养液及细胞内的HBcAg含量极低(<1∶160)。研究结果表明,BmN细胞能正确识别与切割HBeAg信号肽序列,所表达的HBeAg效价高,纯度好,明显优于大肠杆菌表达系统  相似文献   

16.
目的:动脉粥样硬化是一种高致死率的慢性炎症疾病,其发生和发展的机制尚不明确。本文基于人类信号网络和基因表达谱数据对动脉粥样硬化相关模块进行挖掘,以探究其在疾病发生发展中的作用机制。方法:结合人类信号网络和基因表达谱数据,设计显著差异模块筛选策略,通过功能分析,挖掘动脉粥样硬化相关模块,对动脉粥样硬化的致病机制进行研究。结果:基于网络模块的平均表达值改变量,采用两种随机方法,进行显著差异模块筛选,最终获得8个动脉粥样硬化相关的显著差异模块。结论:应用本文提出的整合筛选策略,能识别与动脉粥样硬化相关的模块,获得潜在的致病基因,并从外周血的基因表达改变来探究动脉粥样硬化致病机制,这对动脉粥样硬化的诊断、治疗以及发生发展机制的研究具有重要意义。  相似文献   

17.
利用DNA或RNA植物病毒作载体表达外源蛋白是近几年发展较快的一种新的遗传转化方式,它具有以下几个优点:表达量大,表达速度快,易于进行基因操作和接种以及适用对象广泛。已发展的四种载体构建策略包括:基因取代,基因插入,融合抗原和基因互补。植物病毒表达载体可以用于基因的重组、病毒的移动和基因功能的检测等基础性研究,也可用于商业上表达多种药用蛋白或疫苗。植物病毒表达载体的稳定性主要取决于存在同源序列而引起的基因重组。本文还对病毒载体的生物安全性进行了讨论。  相似文献   

18.
柞蚕核型多角体病毒(AnpeNPV)作为基因表达载体在柞蚕培养细胞(AnPe细胞)和柞蚕蛹中已经成功地表达出了外来基因,并生产出了大量蛋白质。本文比较了AnpeNPV与苜蓿尺蠖核型多角体病毒(AcMNPV)、家蚕核型多角体病毒(BmNPV)和美国白蛾核型多角体病毒(HycuNPV)基因表达载体在培养细胞和昆虫活体组织内的β-半乳糖苷酶基因表达效果。结果显示,5×105个细胞中β-半乳糖苷酶的最高酶活性分别是AnpeNPV在AnPe细胞为40.9 units/ml (TC-100培养液,FBS10%)和59.9 units/ml(SF-900Ⅱ培养液),AcMNPV在Sf9细胞为72.4 units/ml(TC-100,FBS10%)和66.4 units/ml(SF-900Ⅱ)、在High5细胞为326 units/ml(EX-CELL 405培养液),BmNPV在Bm4细胞为15.1 units/ml(TC-100,FBS10%),HycuNPV在SpIm细胞为68.6 units/ml(SF-900Ⅱ)。活体组织内β-半乳糖苷酶的最高酶活性分别是柞蚕雌蛹为14.3 units/g、雄蛹为11.7 units/g,家蚕幼虫是10.1 units/g。实验证明AnpeNPV/AnPe的外来基因表达水平与AcMNPV/ Sf9和HycuNPV/SpIm相似、比BmNPV/ Bm4高、不及AcMNPV/ High5;AnpeNPV/柞蚕蛹,其雌蛹比BmNPV/家蚕5龄幼虫的外来基因表达效果好、雄蛹与之无明显差异,说明AnpeNPV基因表达载体无论是在培养细胞还是昆虫活体组织中均可与其他NPV基因表达载体相媲美。柞蚕蛹由于可以机械化、大规模地操作,显示对于大量生产蛋白质具有更好的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号