首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
文章研究了基于微阵列基因表达数据的胃癌亚型分类。微阵列基因表达数据样本少、纬度高、噪声大的特点,使得数据降维成为分类成功的关键。作者将主成分分析(PCA) 和偏最小二乘(PLS)两种降维方法应用于胃癌亚型分类研究,以支持向量机(SVM)、K- 近邻法(KNN)为分类器对两套胃癌数据进行亚型分类。分类效果相比传统的医理诊断略高,最高准确率可达100%。研究结果表明,主成分分析和偏最小二乘方法能够有效地提取分类特征信息,并能在保持较高的分类准确率的前提下大幅度地降低基因表达数据的维数。  相似文献   

2.
文章采用反向区间偏最小二乘法结合连续投影算法,筛选南丰蜜桔近红外检测的多元线性回归变量。对南丰蜜桔近红外光谱进行多元散射校正后,利用反向间隔偏最小二乘法,从500~1750 nm中初选出7个光谱区间,用于多元线性回归变量筛选。利用通过遗传算法和连续投影算法筛选出的变量建立了多元线性回归模型。经比较发现,利用反向区间偏最小二乘法结合连续投影算法筛选出的变量建立的多元线性回归模型,预测结果最优,模型预测相关系数为0.937,模型预测均方根误差为0.613 oBrix。结果表明,反向区间偏最小二乘法结合连续投影算法,可以有效地筛选近红外光谱的多元线性回归变量,提高南丰蜜桔可溶性固形物模型的预测精度。  相似文献   

3.
基于DWT-GA-PLS的土壤碱解氮含量高光谱估测方法   总被引:1,自引:0,他引:1  
以山东齐河县为研究区,实地采集土壤样本,在土样高光谱测试并进行一阶导数变换的基础上,先运用离散小波变换(DWT)对土壤光谱去噪降维,然后采用遗传算法(GA)筛选土壤碱解氮定量估测模型的参与变量,最后应用偏最小二乘(PLS)回归构建土壤碱解氮含量的估测模型.结果表明: 离散小波变换结合遗传算法和偏最小二乘法(DWT-GA-PLS)用于土壤碱解氮含量定量估测,不仅可压缩光谱变量、减少模型参与变量,而且可改善模型估测准确度;较之于采用土壤全谱,小波离散分解1~2层低频系数构建的模型在参与变量大幅减少的情况下,取得更准确或与之相当的预测结果,其中,基于第2层小波低频系数采用GA筛选变量构建的PLS模型的预测效果表现最好,预测R2达到0.85,RMSE为8.11 mg·kg-1,RPD为2.53.说明DWT-GA-PLS用于土壤碱解氮含量高光谱定量估测的有效性.  相似文献   

4.
孙远帅  陈垚  玄萍  江弋 《生物信息学》2013,11(3):161-166
基因芯片技术的发展为生物信息学带来了机遇,使在基因表达水平上进行癌症诊断成为可能。但基因芯片数据高维小样本的特征也使传统机器学习方法面临挑战。本文利用真实的基因表达数据,测试了目前主要的分类方法和降维方法在癌症诊断方面的效果,通过实验对比发现:基于线性核函数的支持向量机可以有效地分类肿瘤与非肿瘤的基因表达,从而为癌症诊断提供借鉴。  相似文献   

5.
基于基因表达谱的肿瘤特异基因表达模式研究   总被引:1,自引:1,他引:0  
基于肿瘤基因表达谱, 利用生物信息学的方法, 从肿瘤与正常组织的样本分类入手就肿瘤特异表达基因的发现及其表达模式问题进行了分析和研究, 进而探讨了肿瘤在基因表达上的特点. 首先, 在分析肿瘤基因表达谱特点的基础上, 提出了基于Relief算法的样本分类特征基因选取策略; 然后, 以支持向量机为分类工具进行样本类型的识别, 以分类错误率为标准选取样本分类特征基因, 并对其中反映肿瘤与正常样本组织构成特点的组织特异表达基因进行排除以突出肿瘤样本真实的类别特征; 最后结合统计学方法, 从信息学的角度论证了分类特征基因在肿瘤组织中特异表达的确实性和普遍性, 并对这些基因在肿瘤组织中呈现出的特异的表达模式进行了分析.  相似文献   

6.
特征选择技术被广泛应用于生物信息学中。通过重复利用偏最小二乘(partial least square,PLS)方法提取主成分,通过逐次选择在主成分中权重较大的基因,将PLS应用于特征选择中。将这种方法用于对肿瘤基因表达谱数据的特征基因选择中,并用提取的特征基因分类,用8个特征基因进行分类时,能达到92.5%的正确率。  相似文献   

7.
基于最佳波段判别的湿地植物叶片全氮反演研究   总被引:1,自引:0,他引:1  
郭超凡  段福洲  郭逍宇  赵文吉  刘克 《生态学报》2014,34(17):4839-4849
利用高光谱遥感技术定量估测湿地植被叶片全氮含量,对于监测和诊断湿地植被的生理状况及生长趋势具有重要意义。但叶片氮素遥感诊断研究多存在反演模型过拟合、入选波段与生化参量间因果关系不明确和入选变量间"多重共线性"等局限。以芦苇(Phragmites australis)和香蒲(Typha angustifolia)叶片全氮含量作为研究对象,通过谱带分区,分区最佳波段选取和偏最小二乘回归相结合的方法构建芦苇和香蒲叶片全氮含量反演模型,并利用交叉验证决定系数(R2cv)和均方根误差(RMSEcv)对模型精度进行检验,尝试克服传统反演方法中的不足。结果表明,不同湿地植物类型相比,利用芦苇反射光谱建立的预测模型精度都高于香蒲。不同回归模型相比,一阶导数光谱-偏最小二乘回归模型(FDS-PLSR)精度远高于原始光谱-偏最小二乘回归模型(OS-PLSR)。芦苇最佳模型交叉验证决定系数(R2cv)达到了0.84,方根误差(RMSEcv)为0.10,香蒲最佳模型交叉验证的决定系数(R2cv)达到了0.66,方根误差(RMSEcv)为0.13,是构建湿地植物芦苇和香蒲光谱与叶片全氮含量关系的最佳模型。在不降低湿地植物叶片氮含量反演精度的基础上,有效地避免了传统地物高光谱模型反演中的局限性,是无损害遥感探测方面的有益尝试。  相似文献   

8.
为探讨小流域尺度丘陵区的高分辨率数字土壤制图方法,通过对景观相分类的探索,配合应用不同尺度的Geomorphons(GM)微地形特征数据构成分类变量组参与高分辨率土壤pH、黏粒含量和阳离子交换量的预测制图,并与传统数字高程模型衍生变量和遥感变量进行组合与比较分析。此外,采用支持向量机、偏最小二乘回归和随机森林3种机器学习模型择优与残差回归克里金复合参与预测模型的构建与评价。结果表明: 景观及多尺度微地形分类变量组的应用分别提高小流域尺度丘陵地貌区pH、黏粒含量和阳离子交换量预测精度的18.8%、8.2%和8.7%。包含植被信息的景观相分类图相比土地利用数据有更高的模型贡献度;5 m分辨率的GM微地形分类图相比低分辨率的分类图更适宜高精度的预测制图。黏粒含量使用随机森林复合模型有最高的预测精度,而pH和阳离子交换量则不适宜在随机森林模型的基础上加入残差回归克里金模型。景观-多尺度微地形分类变量、数字高程模型衍生变量和遥感变量三者结合的模型预测表现最佳,表明多元变量在起伏地形区域相比单一数据源能够包含更多的土壤有效信息。由GM数据和地表景观数据组成的景观分类变量组作为主要变量能够解释小流域丘陵区部分土壤属性约40%的空间变异。在同类型土壤预测制图研究中,多分辨率GM及景观分类数据有潜力作为环境变量参与预测模型的构建。  相似文献   

9.
预测物种潜在分布区——比较SVM与GARP   总被引:2,自引:0,他引:2       下载免费PDF全文
 物种分布与环境因子之间存在着紧密的联系,因此利用环境因子作为预测物种分布模型的变量是当前最普遍的建模思路,但是绝大多数物种分 布预测模型都遇到了难以解决的“高维小样本"问题。该研究通过理论和实践证明,基于结构风险最小化原理的支持向量机(Support vector machine, SVM)算法非常适合“高维小样本"的分类问题。以20种杜鹃花属(Rhododendron)中国特有种为检验对象,利用标本数据和11个1 km×1 km的栅格环境数据层作为模型变量,预测其在中国的潜在分布区,并通过全面的模型评估——专家评估,受试者工作特征(Receiver operator characteristic, ROC)曲线和曲线下方面积(Area under the curve, AUC)——来比较模型的性能。我们实现了以SVM为核心的物种分布预测 系统,并且通过试验证明其无论在计算速度还是预测效果上都远远优于当前广泛使用的规则集合预测的遗传算法(Algorithm for rule-set prediction, GARP)预测系统。  相似文献   

10.
刘辉  宫兆宁  赵文吉   《生态学杂志》2014,25(12):3609-3618
高光谱信息是探测植物体内氮素含量状况的重要手段,而植物体中的氮素与水体含氮量息息相关.本研究区为以再生水为主要补给水水源的北京门城湖湿地公园,通过获取区内典型的再生水氮净化挺水植物芦苇和香蒲叶片的高光谱数据,并在室内测定对应样点的水体总氮含量指标, 探讨基于典型湿地挺水植物高光谱数据对水体总氮进行遥感探测的可行性.采用4种高光谱参数(光谱指数、归一化差值指数、“三边”参数及吸收特征参数)分别建立一元线性模型、逐步多元回归模型和偏最小二乘模型,根据决定系数(R2)和均方根误差(RMSE)进行模型精度检验.结果表明: 逐步多元回归和偏最小二乘模型的预测精度高于一元线性模型. 3种模型对芦苇的拟合效果均优于香蒲.偏最小二乘模型对芦苇的拟合效果最优(R2=0.854,RMSE=0.647).500~700 nm是反映水氮含量的最佳波段范围,绿峰与红谷反射率的比值与水体总氮含量具有较强的相关性,尤其是吸收特征参数能够较好地预测水体总氮含量.  相似文献   

11.
张思嘉  蔡挺  张顺 《生物信息学》2022,20(4):247-256
基于SNP突变数据与mRNA表达谱关联分析,构建一种肝癌分子分型方法并对比不同分型预后的差异,并对不同分型肝癌的发生发展机制进一步研究。首先通过TCGA数据库收集359例肝细胞癌患者的SNP突变数据和mRNA表达数据,采用Wilcoxon秩和检验,筛选突变后差异表达基因,并通过生物信息学工具String和Cytoscape 构建差异表达基因的蛋白互作网络,筛选连接度最高的10个Hub基因。利用Consensus Cluster Plus软件包,基于Hub基因mRNA表达水平构建NMF分子分型模型,再结合生存数据评估各分型患者的预后。最后利用加权基因共表达网络分析(WGCNA),识别与肝癌分子分型相关的模块,并针对关键模块的基因进行通路富集,从而对不同分型肝癌的基因表达谱进行比较。结果:NMF模型将肝癌分为高危、低危2个分型,其中CDKN2A和FOXO1基因对分型贡献度高。生存分析显示低危组患者的生存情况显著优于高危组,高危组富集多个与肿瘤细胞侵蚀、转移、复发过程相关的信号通路,低危组则与细胞周期和胰液分泌相关。本研究在无先验性信息的前提下,基于突变后显著差异表达的Hub基因表达水平构建的肝癌分子分型对肝癌患者预后评估具有一定的指导意义,其中CDKN2A和FOXO1突变是肝癌患者的不良预后因素,针对二者的靶向药研发,可能为肝癌患者提供新的治疗策略。  相似文献   

12.
13.
We performed gene expression profiling of normal and hepatocellular carcinoma (HCC) liver tissues using a high-density microarray that contained 3,063 human cDNA. The results of a microarray hybridization experiment from eight different HCC tissues were analyzed and classified by the Cluster program. Among these differentially-expressed genes, the galectin-3, serine/threonine kinase SGK, translation factor eIF-4A, -4B, -3, fibroblast growth factor receptor, and ribosomal protein L35A were up-regulated; the mRNAs of Nip3, decorin, and the insulin-like growth factor binding protein-3 were down-regulated in HCC. The differential expression of these genes was further confirmed by an RT-PCR analysis. In addition, our data suggest that the gene expression profile of HCC varies according to the histological types.  相似文献   

14.
Hepatocellular Carcinoma (HCC) is one of the leading causes of cancer-associated mortality worldwide. However, the role of epigenetic changes such as aberrant DNA methylation in hepatocarcinogenesis remains largely unclear. In this study, we examined the methylation profiles of 59 HCC patients. Using consensus hierarchical clustering with feature selection, we identified three tumor subgroups based on their methylation profiles and correlated these subgroups with clinicopathological parameters. Interestingly, one tumor subgroup is different from the other 2 subgroups and the methylation profile of this subgroup is the most distinctly different from the non-tumorous liver tissues. Significantly, this subgroup of patients was found to be associated with poor overall as well as disease-free survival. To further understand the pathways modulated by the deregulation of methylation in HCC patients, we integrated data from both the methylation as well as the gene expression profiles of these 59 HCC patients. In these patients, while 4416 CpG sites were differentially methylated between the tumors compared to the adjacent non-tumorous tissues, only 536 of these CpG sites were associated with differences in the expression of their associated genes. Pathway analysis revealed that forty-four percent of the most significant upstream regulators of these 536 genes were involved in inflammation-related NFκB pathway. These data suggest that inflammation via the NFκB pathway play an important role in modulating gene expression of HCC patients through methylation. Overall, our analysis provides an understanding on aberrant methylation profile in HCC patients.  相似文献   

15.
microRNA异常表达促进癌症的发生发展.本研究通过microRNA表达谱分析2个肝癌细胞和2个正常细胞microRNA的表达,寻找与肝癌相关的microRNA,发现microRNA-215在肝癌细胞中高表达,q RT-PCR验证microRNA-215在肝癌细胞呈显著高表达.进一步研究发现,microRNA-215直接靶向Dicer1基因的3′UTR并抑制Dicer1蛋白表达,Dicer1是microRNA加工成熟过程中必需的蛋白.过表达microRNA-215抑制Dicer1从而促进肝癌细胞迁移和转化,而抑制microRNA-215表达起相反作用.Dicer1抑制后,许多抑癌microRNA表达被抑制,从而促进迁移和转化.相对于癌旁组织,Dicer1在肝癌组织呈明显低表达.本研究揭示,microRNA-215异常活化并抑制Dicer1表达与肝癌发展相关.  相似文献   

16.
Lee D  Choi SW  Kim M  Park JH  Kim M  Kim J  Lee IB 《Biotechnology progress》2003,19(3):1011-1015
Hepatocellular carcinoma (HCC) is one of the most common human malignancies in the world. To identify the histological subtype-specific genes of HCC, we analyzed the gene expression profile of 10 HCC patients by means of cDNA microarray. We proposed a systematic approach for determining the discriminatory genes and revealing the biological phenomena of HCC with cDNA microarray data. First, normalization of cDNA microarray data was performed to reduce or minimize systematic variations. On the basis of the suitably normalized data, we identified specific genes involved in histological subtype of HCC. Two classification methods, Fisher's discriminant analysis (FDA) and support vector machine (SVM), were used to evaluate the reliability of the selected genes and discriminate the histological subtypes of HCC. This study may provide a clue for the needs of different chemotherapy and the reason for heterogeneity of the clinical responses according to histological subtypes.  相似文献   

17.
为了筛选原发性肝细胞癌 (hepatocellularcarcinoma ,HCC)中差异表达的基因 ,以了解HCC发生发展的分子基础 ,选取了一例早期高分化肝癌标本作为材料 ,采用抑制消减杂交 (suppressionsubtractivehybridization ,SSH)技术 ,进行了前向及反向消减杂交 ,结合反向Northern印迹筛选 ,得到多个差异表达的基因 .对有意义的基因用半定量RT PCR检测了肝癌中的表达 .结果显示 ,PON2、hSRP1alpha、H4 1在大部分肝癌中表达升高 ,IGFBP1、ITIH1在早期癌症中 ,大部分癌的表达升高 ,在晚期癌症中则表达下降 .EGR1在大部分肝癌中表达降低 .研究表明 ,不同分化程度、不同临床分期的肝癌 ,有共同的或不同的基因表达发生改变 ,明确这些差异表达的基因谱 ,对于肝癌发生发展机理的阐明及肝癌的预防、诊断、治疗都有重要意义 .  相似文献   

18.
The study was aimed to screen out miRNAs with differential expression in hepatocellular carcinoma (HCC), and to explore the influence of the expressions of these miRNAs and their target gene on HCC cell proliferation, invasion and apoptosis. MiRNAs with differential expression in HCC were screened out by microarray analysis. The common target gene of these miRNAs (miR‐139‐5p, miR‐940 and miR‐193a‐5p) was screened out by analysing the target genes profile (acquired from Targetscan) of the three miRNAs. Expression levels of miRNAs and SPOCK1 were determined by quantitative real time polymerase chain reaction (qRT‐PCR). The target relationships were verified by dual luciferase reporter gene assay and RNA pull‐down assay. Through 3‐(4,5‐dimethyl‐2‐thiazolyl)‐2,5‐diphenyl‐2‐H‐tetrazolium bromide,thiazolyl blue tetrazolium bromide (MTT) and transwell assays and flow cytometry, HCC cell viability, invasion and apoptosis were determined. In vivo experiment was conducted in nude mice to investigate the influence of three miRNAs on tumour growth. Down‐regulation of miR‐139‐5p, miR‐940 and miR‐193a‐5p was found in HCC. Overexpression of these miRNAs suppressed HCC cell viability and invasion, promoted apoptosis and inhibited tumour growth. SPOCK1, the common target gene of miR‐139‐5p, miR‐940 and miR‐193a‐5p, was overexpressed in HCC. SPOCK1 overexpression promoted proliferation and invasion, and restrained apoptosis of HCC cells. MiR‐139‐5p, miR‐940 and miR‐193a‐5p inhibited HCC development through targeting SPOCK1.  相似文献   

19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号