首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提要Q型多变量线性回归方法是定量古生物学研究中经常使用的一组方法。不同于把研究重心放在变量或变量组之间关系的R型回归方法,Q型回归方法对样本进行整体分析,通过构建样本之间的相似性系数矩阵或者距离矩阵,并进行分解与变换,进而用可视化的方法展示样本的整体相似性关系。本文将介绍常用的Q型多变量线性回归方法,包括主坐标分析(Principal coordinate analysis)、Q型聚类分析(Q-Cluster analysis)、Q型因子分析(Q-Factor analysis),以及综合了R型和Q型的对应分析(Correspondence analysis),和它们在计算中的注意事项与适用场景。本文选取瓜迪亚纳河入海口大陆架地区底栖有孔虫分布特征研究作为实例,分别用上述方法进行分析,以解释它们在定量古生物学中的具体应用。  相似文献   

2.
多变量空间相关分析多基于时间序列数据,对数据时长与统计要求严格,空间非平稳性特征分析可以利用单期数据分析多变量之间的相关性。通过空间变系数回归模型分析了2006年和2011年的新疆伊犁地区降水量和温度对植被覆盖度指数影响的空间变化特征,利用局部线性地理加权回归(GWR)方法估计得到了回归系数曲面,揭示出变量间相互影响的空间异质性,同时利用线性回归最小二乘估计进行了对比。结果表明:(1)空间变系数回归模型可以用于变量间的空间相关分析;(2)局部线性GWR估计方法明显优于线性回归最小二乘估计;(3)拟合结果表明,伊犁地区降水量和温度对植被覆盖指数的影响具有显著的空间非平稳性特征;(4)模型估计误差是降水、气温之外的地形、地貌及人类活动等多种因素造成的,需进一步研究。方法可为具有空间非平稳性特征变量间空间相关性分析以及植被覆盖指数的空间模拟分布提供思路和方法。  相似文献   

3.
第四讲相关与回归相关与回归是分析两个(或多个)变量之间的关系的方法。譬如说某一特定人群的身高与体重,不仅只分析身高或体重的某一方面(或说指标),而是分析身高与体重两个指标之间有无关联,这便是相关与回归所要分析的内容。当然,相关与回归分析也包括根据样本估计总体  相似文献   

4.
形态测量学用定量化的方法和手段描述、研究对象形态特征。几何形态测量学是形态测量学的分支,用界标点或轮廓线等标识研究对象的形态,并运用多变量运算进行量化分析和判别。形态测量学方法在生物学与古生物学领域的应用日益广泛,在生物的个体发育、系统演化、类群判别等方面均可发挥重要作用。本文重点介绍了目前在形态测量学中常用的数据类型、分析方法与步骤,即线性距离、界标点、轮廓线等数据类型的获取,普鲁克迭加、傅里叶转换、特征形状分析与增强特征形状分析等数据转换方法,以及主变量分析、典型变量分析等常用多变量线性回归方法的原理与分析过程。选择以类有孔虫个体发育与类群鉴定中几何形态测量学的应用为例,解释最常用的多变量线性回归方法——主成分分析与典型变量分析的应用与结果剖析。  相似文献   

5.
男性型脱发(male pattern baldness,MPB)是一种雄激素依赖性的遗传性脱发疾病,对个人形象、心理产生较大的消极影响.近期欧美人群中进行的大样本全基因组关联分析(genome wide association studies,GWAS)已报道大量与MPB相关的遗传易感性单核苷酸多态性(single nucleotide polymorphisms,SNPs)位点,但这些位点在东亚人群中的遗传效应尚不清楚.本研究基于我国684个亚欧混合人群(Eurasian)样本,对在英国生物样本库(UK Biobank) 205 327个欧洲男性GWAS分析发现的624个与MPB相关的SNPs进行人群异质性分析,基于多基因风险打分(polygenic risk scores,PRS)建立预测模型,并对预测因子数量与模型预测性能的关系进行了研究.通过质控的467个SNPs中6.9%与MPB显著相关(P<0.05).结合年龄、体质指数(body mass index,BMI)和25个SNPs建立的线性回归和逻辑回归模型,效果较好(R2=28.9%,AUC=0....  相似文献   

6.
本研究旨在确定具有免疫相关基因的可靠预后特征,该特征可以预测预后并对肺腺癌(lung adenocarcinoma, LUAD)患者的个体化管理提供帮助。从癌症基因组图谱(The Cancer Genome Atlas, TCGA)数据库下载LUAD患者的mRNA表达谱和相应的临床数据;使用单因素COX和LASSO模型来构建预后模型;使用基于风险评分的方法开发预后特征;通过Kaplan-Meier分析比较高风险患者和低风险患者之间的总生存期(overall survival, OS), OS的独立预测因子通过单变量和多变量COX分析确定;单样本基因集富集分析(single sample gene set enrichment analysis, ssGSEA)用于评估免疫细胞浸润程度;通过LASSO和COX回归分析构建生存预后特征。根据预后特征,在OS方面将患者显著分层为高风险组和低风险组,与低风险组相比,高风险组的LUAD患者OS显著降低。通过ROC曲线分析证实了预后基因标记的预测能力。多因素COX分析显示,风险评分是OS的独立预测因子。通过免疫分析,发现了肺腺癌转移组与未转移组的不...  相似文献   

7.
目的:观察miRNA-192在骨肉瘤中与各临床要素之间的关联,分析其与骨肉瘤患者生存情况之间的关系,为研究miRNA-192在骨肉瘤中的作用及可能的临床应用提供理论依据。方法:选取50例骨肉瘤新鲜样本组织及瘤旁组织,使用荧光RT-PCR的方法对样本中的miRNA-192的含量进行检测,结合详实的随访资料,分析miRNA-192与性别、年龄等临床要素之间的关系。通过生存分析的方法,分析miRNA-192与患者生存情况之间的关系。结果:miRNA-192与患者的年龄,肿瘤大小,分期,生存时间等有明显的统计学关联(P0.05),包括年龄(P=0.028),临床分期(P=0.007),远端转移(P=0.013)和生存率(P=0.001)。结论:在临床样本中,miRNA-192与患者的多项临床要素有显著性关联,包括年龄,临床分期,远端转移和生存率,为接下来关于miRNA-192在骨肉瘤中的各项研究,特别是作为生物标记信号的临床应用奠定了良好的实验基础。  相似文献   

8.
本文利用拉曼光谱技术检测由直肠癌的发生导致的血清成分的变化。比较了直肠癌患者和对照组之间血清拉曼光谱的差异,并对术后直肠癌患者血清拉曼光谱的变化也进行了比较,以监测术后治疗效果。结果表明在某些波数位置不同组的拉曼峰有统计学意义的变化,这些变化反应了血清中相应的生物物质的改变。之后,主成分分析(PCA)及峰强比参数这两种方法被用于原始拉曼光谱的特征变量的提取。将线性判别分析(LDA)和分类回归树(CART)两种判别分析法用于特征变量的判别分析。PCA-LDA和参数-CART方法的诊断准确率分别为87%和90%。  相似文献   

9.
物种分布模型通常用于基础生态和应用生态研究,用来确定影响生物分布和物种丰富度的因素,量化物种与非生物条件的关系,预测物种对土地利用和气候变化的反应,并确定潜在的保护区.在传统的物种分布模型中,生物的相互作用很少被纳入,而联合物种分布模型(JSDMs)作为近年提出的一种新的可行方法,可以同时考虑环境因素和生物交互作用,因而成为分析生物群落结构和种间相互作用过程的有力工具.JSDMs以物种分布模型(SDMs)为基础,通常采用广义线性回归模型建立物种对环境变量的多变量响应,以随机效应的形式获取物种间的关联,同时结合隐变量模型(LVMs),并基于Laplace近似和马尔科夫蒙脱卡罗模拟的最大似然估计或贝叶斯方法来估算模型参数.本文对JSDMs的产生及理论基础进行归纳总结,重点介绍了不同类型JSDMs的特点及其在现代生态学中的应用,阐述了JSDMs的应用前景、使用过程中存在的问题及发展方向.随着对环境因素与多物种种间关系研究的深入,JSDMs将是今后物种分布模型研究的重点.  相似文献   

10.
基于小波分析的大豆叶面积高光谱反演   总被引:2,自引:0,他引:2  
实测了不同水肥耦合、经营制度及有效营养面积条件下的大豆(Glycinemax)冠层高光谱反射率与叶面积指数(LAI),并对光谱反射率、微分光谱与LAI的关系进行了分析;采用比值植被指数(RVI)与归一化植被指数(NDVI)建立了大豆LAI反演模型;采用小波分析对采集的光谱反射率数据进行了能量系数提取,并以小波能量系数作为自变量进行了单变量与多变量回归分析,对大豆LAI进行估算。结果表明:大豆LAI与光谱反射率在可见光波段呈负相关;在近红外波段呈正相关;微分光谱在红边处与大豆LAI密切相关(R2=0.92);RVI与NDVI可以提高大豆LAI的估算精度(R2分别达0.79、0.84);各植被指数各有优缺点,应根据需要进行选择;小波能量系数回归模型可以进一步提高大豆叶面积的估算水平,以一个特定小波能量系数作为自变量的回归模型,大豆LAI回归确定系数R2高达0.884;以4个和6个小波能量系数建立LAI回归分析模型(R2分别达0.92、0.93),2个模型LAI预测值与大豆LAI实测值线性回归确定性系数R2分别为0.90、0.92。比较可知,小波分析可以对高光谱进行特征变量提取,进而反演大豆生理参数,并且反演的LAI精度较光谱反射率、微分光谱及植被指数都有明显提高,小波分析在植被生理参数的高光谱提取方面有着广阔的应用前景。  相似文献   

11.
太行山猕猴髋骨变量研究初报   总被引:10,自引:1,他引:9  
本文对22例(♂11,♀11)成年太行山地区猕猴髋骨有关变量进行测量,通过有关变量单因素方差分析、R型聚类和回归分析,结果表明:太行山猕猴的髋骨变量有较明显的自身特征,髋骨有关变量在雌雄之间有明显差异。  相似文献   

12.
【目的】北二星蝽Eysarcoris aeneus是一种广泛分布于古北区的重要农业害虫,可危害多种经济作物。其刺肩型和钝肩型前胸背板后侧角长度存在差异,暗示其种内变异的存在。【方法】基于几何形态学的多元回归分析(multivariate regression)、主成分分析(principal component analysis,PCA)、典型变量分析(canonical variate analysis,CVA)和判别函数分析(discriminant function analysis,DFA),对采集于中国19个地区的142头标本(98头北二星蝽标本和44头作为外群的广二星蝽E. ventralis标本)的前翅、后翅、头和小盾片4个性状进行分析比较,研究北二星蝽钝肩型和刺肩型之间的形态变异。【结果】对于所研究的4个性状来说,北二星蝽钝肩型和刺肩型标本间均未检测到异速生长的存在。主成分分析中,钝肩型和刺肩型的标本均有重叠,典型变量分析则显示它们之间存在显著差异(马氏距离和普氏距离的P值均小于0. 01)。判别函数分析显示,依据这4个性状两型样本间的正确判别率在67%~89%之间。【结论】结果表明,前翅、后翅、头和小盾片都可以作为北二星蝽钝肩型和刺肩型之间形态变异的评价指标,小盾片特征具有最高水平的鉴别价值;对于所研究的这4个性状来说,北二星蝽钝肩型和刺肩型之间都表现出显著的形状差异,而它们的质心距离差异不显著,说明相对于体型大小差异分析,形状差异分析能更灵敏地揭示谱系间的变异。本研究表明几何形态学可以有效地描述北二星蝽的种内形态变异,为蝽类昆虫种内变异的研究奠定了基础。  相似文献   

13.
李荣荣  李敏  闫江  张虎芳  白明 《昆虫学报》2019,62(9):1081-1089
【目的】北二星蝽Eysarcoris aeneus是一种广泛分布于古北区的重要农业害虫,可危害多种经济作物。其刺肩型和钝肩型前胸背板后侧角长度存在差异,暗示其种内变异的存在。【方法】基于几何形态学的多元回归分析(multivariate regression)、主成分分析(principal component analysis, PCA)、典型变量分析(canonical variate analysis, CVA)和判别函数分析(discriminant function analysis, DFA),对采集于中国19个地区的142头标本(98头北二星蝽标本和44头作为外群的广二星蝽E.ventralis标本)的前翅、后翅、头和小盾片4个性状进行分析比较,研究北二星蝽钝肩型和刺肩型之间的形态变异。【结果】对于所研究的4个性状来说,北二星蝽钝肩型和刺肩型标本间均未检测到异速生长的存在。主成分分析中,钝肩型和刺肩型的标本均有重叠,典型变量分析则显示它们之间存在显著差异(马氏距离和普氏距离的P值均小于0.01)。判别函数分析显示,依据这4个性状两型样本间的正确判别率在67%~89%之间。【结论】结果表明,前翅、后翅、头和小盾片都可以作为北二星蝽钝肩型和刺肩型之间形态变异的评价指标,小盾片特征具有最高水平的鉴别价值;对于所研究的这4个性状来说,北二星蝽钝肩型和刺肩型之间都表现出显著的形状差异,而它们的质心距离差异不显著,说明相对于体型大小差异分析,形状差异分析能更灵敏地揭示谱系间的变异。本研究表明几何形态学可以有效地描述北二星蝽的种内形态变异,为蝽类昆虫种内变异的研究奠定了基础。  相似文献   

14.
原子力显微镜(AFM)的发明为微纳尺度下高分辨率探测天然状态生物样本的物理特性提供了强大工具,是对传统生化特性检测方法的有力补充.近年来,多参数成像模式AFM的出现使得人们不仅可以获取生物样本表面形貌特征,还能同时获取生物样本多种力学特性图(如杨氏模量、黏附力、形变等),为研究生物结构、力学特性及其生理功能之间的关联提供了新的技术手段.多参数成像AFM的生物医学应用研究为细胞/分子生理活动及相关疾病内在机理带来了大量新的认识.本文结合作者在AFM细胞探测方面的研究工作,介绍了多参数成像AFM工作原理,总结了多参数成像AFM在细胞及分子力学特性探测方面的研究进展,并对其存在的问题进行了讨论和展望.  相似文献   

15.
基于地理加权回归克里格的日平均气温插值   总被引:2,自引:0,他引:2  
气温是大量农业、水文、气候、生态模型的输入变量.在地形复杂的区域,考虑气温与环境变量的线性回归关系和残差的自相关性的方法(如回归克里格法,regression Kriging,RK)是目前气温插值的主要方法.但此类方法多使用基于普通最小二乘的全局回归技术,没有顾及回归关系的空间非平稳性.地理加权回归克里格(geographically weighted regression-Kriging,GWRK)是一种既能顾及回归关系的空间非平稳性、又能考虑残差的自相关性的一种插值方法.本文用RK和GWRK对海南岛2013年12月18日的日平均气温进行插值并进行比较研究.依相关性分析和逐步回归分析的结果,采用RK1(以海拔为辅助变量)、GWRK1(以海拔为辅助变量)、RK2(以纬度、海拔、海陆距离为辅助变量)和GWRK2(以海拔、海陆距离为辅助变量)4种模型进行研究,并用80个验证站评估4种模型的精度.结果表明:GWRK1模型的最大正误差、最大负误差、平均绝对误差、均方根误差均最接近于0.从最大正误差、平均绝对误差、均方根误差3个指标看,考虑更多辅助变量的RK2、GWRK2模型反而不及只考虑海拔的RK1、GWRK1模型,表明RK2、GWRK2模型中辅助变量之间的相关性对插值结果有较大影响.  相似文献   

16.
基于多元统计分析中对样本完整性的要求,为了在分析中不抛弃大量不完整的化石标本或者不大大减少变量,创建了一种恢复标本残缺数据的方法。本方法基于线性回归理论,假设同类标本个体之间的区别仅仅是大小的区别,形状的区别可以忽略不计,因此,在同类标本中,可以用一件标本的已知测量数据预测另一件标本的残缺测量数据。在多件标本的情况下,对某件标本的某个残缺数据的预测结果是用其他标本分别进行预测所得值的加权平均,加权系数的选取与每件标本的保存完好程度相关。用现生马属头骨及肢骨标本做的数据试验证明,该方法具有良好的稳定性,对标本的种类、数量及残缺值的多少均不敏感,对于尺寸较大的标本或数值较大的数据的预测效果要比对尺寸较小的标本或数值较小的数据的预测效果要好。与传统的线性回归方法的不同之处在于,本方法利用的是样本(即标本)间的线性相关性,传统方法利用的是变量(即测量项)间的线性相关性。在通常情况下,样本间的线性相关程度要优于变量间的线性相关程度。本方法简单实用,在对化石标本进行统计分析,特别是多元统计分析中具有良好的应用前景。  相似文献   

17.
目的:探讨湖北汉族人群中白细胞介素6受体基因(interleukin 6 receptorgene,IL6R)g 9外显子D358A多态与2型糖尿病(type 2 diabetes mellitus,T2DM)的关联.方法:采取病例-同胞对照和随机病例一对照两种实验设计,应用聚合~t-tt反应一限制性酶切片段长度多态性(PCR-RFLP)方法,对571例样本IL6R基因第9外显子D358A多态进行分析.结果:在所有样本及两种实验设计中,病例组与对照组基因型频率存在显著差异(P<0.05),所有样本和随机样本设计中,T2DM组C等位基因频率显著低于对照组(P<0.05),病例.同胞对样本设计中未发现显著差异(P>0.05).单因素Logistic回归分析发现,CC基因型与T2DM显著相关(P<0.05).结论:在中国湖北汉族人群中,IL6R基因第9外显子D358A多态性与2型糖尿病相关联,CC基因型是T2DM的保护因子.  相似文献   

18.
应用按氢分类的分子电距矢量(H-MEDV)对蒙椴树叶挥发油的45 种组分的气相色谱保留时间(tR)进行了定量结构-色谱保留关系(QSRR)的研究.通过多元线性回归得到的模型(M1)相关系数R为0.953.用逐步回归的方法建立6 变量模型(M2)和7 变量模型(M3),相关系数R分别为0.947 和0.950.再用留一法(Leave-one-out,LOO)交互检验对三模型进行评价,得到的相关系数RCV分别为0.889、0.914 和0.916.结果表明所建模型具有良好的稳定性和预测能力.  相似文献   

19.
几何形态学是通过定量分析手段对生物的形态特征在几何空间中的变化进行测量, 并将这些测量得到的信息转变为数字信息进行统计学分析以达到形态特征间比较的目的, 目前被越来越多地用于探索生物的特征进化和多样性研究。先前的研究通常提取、比对生物的间断性特征信息用以类群之间的划分, 针对连续性特征研究的缺乏使得有关生物进化和形态学的相关知识变得匮乏。锹甲(鞘翅目: 锹甲科)由于其性二型、雄虫多型性和独特的习性成为形态学研究的重要类群。基于此, 本研究中我们提供了一个包含1,302种锹甲成虫(涵盖全世界99%已知种)的形态学数据集, 数据集包含锹甲的典型的连续性特征, 即前胸背板和鞘翅的外轮廓形态。我们提供的数据集为甲虫的生物多样性、系统发育和进化生物学在内的多个学科的研究提供基础。  相似文献   

20.
通常来讲,生态学者对于解释生态关系、描述格局和过程、进行空间或时间预测比较感兴趣。这些工作可以通过模拟输出值(响应)与一些特征值(即解释变量)的关系来实现。然而,生态数据模拟遇到了挑战,这是因为响应变量和预测变量可能是连续变量或离散变量。需要解释的生态关系通常是非线性的,并且解释变量之间具有复杂的相互作用关系。响应变量和解释变量存在缺失值并不是不常有的现象,奇异值也经常出现在生态数据中。此外,生态学者通常希望生态模型即要易于建立又易要于解释。通常是利用多种统计方法来分析处理各种各样情景中出现的独特的生态问题,这些模型包括(多元)逻辑回归、线性模型、生存模型、方差分析等等。随机森林是一个可以处理所有这些问题的有效方法。随机森林可以用来做分类、聚类、回归和生存分析、评估变量的重要性、检测数据中的奇异值、对缺失数据进行插补等。鉴于随机森林本身在算法上的优势,将就随机森林在生态学中的应用进行总结,对建模过程进行概述,并以云南松分布模拟研究为例,对其主要功能特点进行案例展示。通过对随机森林的一般术语、概念和建模思想进行介绍,有利于读者掌握本方法的应用本质,可以预见随机森林在生态学研究中将得到更多的应用和发展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号