首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
目的:探讨应用ARIMA模型预测宝安区某街道其它感染性腹泻发病率的可行性。方法:应用SPSS13.0软件对2005年~2009年宝安区某街道其它感染性腹泻逐月发病率进行ARIMA模型建模拟合,用所得到的模型对2010年各月发病率进行预测,并评价其预测效果。结果:宝安区某街道其它感染性腹泻发病率每年11月为发病高峰,ARIMA(0,1,1)(0,1,0)12模型是其拟合的最佳模型,其预测结果和实际值绝对误差的绝对值最大为930.47,最小为1.96,平均值214.83,平均相对误差百分比39.04%。结论:模型虽然起到一定的预测效果,但预测精度仍存在误差,可通过积累新的周期数据对ARIMA模型进行修正和重新拟合,也可尝试新的预测方法或其他模型,才能加强和保证预测的精度。  相似文献   

2.
ARIMA与SVM组合模型在害虫预测中的应用   总被引:2,自引:0,他引:2  
向昌盛  周子英 《昆虫学报》2010,53(9):1055-1060
害虫发生是一种复杂、 动态时间序列数据, 单一预测模型都是基于线性或非线性数据, 不能同时捕捉害虫发生的线性和非线性规律, 很难达到理想的预测精度。本研究首先采用差分自回归移动平均模型对昆虫发生时间序列进行线性建模, 然后采用支持向量机对非线性部分进行建模, 最后得到两种模型的组合预测结果。将组合模型应用到松毛虫Dendrolimus punctatus发生面积的预测, 实验结果表明组合模型的预测精度明显优于单一模型, 发挥了两种模型各自的优势。组合模型是一种切实可行的害虫预测预报方法。  相似文献   

3.
利用双标图分析作物区试数据   总被引:9,自引:0,他引:9  
品种区试中品种的基因型和环境存在着交互作用(G×E),使区试数据的分析比较棘手.主效可加和互作可乘模型(简称AMMI模型)是分析区试数据的一新类模型,与常规的方差分析模型和线性回归模型相比,这一方法应用范围广而且更有效.而双标图(biplot)不仅是解释AMMI分析结果的直观有效的工具,而且可以帮助我们选择分析数据的合适模型.本文以95年南方水稻区试单季晚粳组数据为例,对AMMI模型及双标图作一扼要介绍,给出双标图的一些新的性质和用途,和一种可用于产量预测的双标图.  相似文献   

4.
应用神经网络和多元回归技术预测森林产量   总被引:16,自引:0,他引:16  
应用传统统计技术常会因样本小和测量数据不符某种分布而受到限制。本文评价一种前馈型神经网络算法以预测落叶阔叶林产量。另外,还介绍一种由定性变为定量的数据变换方法,以用相对小的样本建立多元回归预测模型。数据变换方法有助于改善多元回归模型的预测效果。在本实验的条件下,研究结果表明神经网络技术能够产生最好的预测效果.  相似文献   

5.
根据2年10个点次的田间试验结果建立了由数粒法、盘重法和盘径法预测向日葵籽实产量的回归数学模型,并根据1994年4个点次的产量实测结果对各模型的可靠性进行了验证.结果表明,三种方法建立的模型均有效、可靠.但在我国向日葵科研和生产实践中,以盘径法最为实用,建议推广应用.  相似文献   

6.
用非线性模型估测恒温和变温下棉铃虫蛹的发育率   总被引:4,自引:3,他引:1  
为了深入分析和探讨昆虫发育与环境温度的关系, 在恒温(15~37℃)和交替变温(12/18~34/40℃)下测定了棉铃虫Helicoverpa armigera蛹的发育历期(d),分别用线性模型和非线性模型(Logan模型﹑Lactin模型和王氏模型)拟合其发育率(1/d)数据。结果表明,这3个非线性模型能更准确地描述发育率与温度之间的曲线关系,判定系数(R2)在0.9878~0.9991之间。对全部观测数据的进一步研究表明,只要有6个分布合适的观测数据,就可以用这些非线性模型获得相当满意的估测效果。如果缺乏高温下的测定数据,用非线性模型预测的昆虫发育率可能失真。分析了蛹在恒温和变温下发育率差异的可能原因,讨论了应用这3个非线性模型预测蛹期发育的优点和缺点,指出用非线性模型取代线性日·度模型进行害虫发生预测和益虫饲养管理的合理性和必要性。  相似文献   

7.
本文构造了能够模拟蔬菜产量氮肥效应速率变化规律的函数模型,运用微分方程理论,得到了对蔬菜产量的氮肥效应进行预测的理论模型,并通过6个试验对所建理论模型进行了检验,取得了良好效果.  相似文献   

8.
研究了线性约束条件下的一般增长曲线模型中一类线性可预测变量和Φ-线性可预测变量的最优预测问题,分别得到了条件最优线性无偏预测和条件最优Φ-线性无偏预测,并证明了它们在几乎处处意义下的唯一性.  相似文献   

9.
基于投影寻踪理论的稻飞虱发生程度预测模型   总被引:3,自引:0,他引:3  
稻飞虱发生程度与相关气候因子的数据大多具有高维非正态、非线性特征,采用统计预测法会出现预测效果的不稳定,采用人工神经网络预测模型需要较多的训练样本.投影寻踪模型把高维数据投影到低维子空间上,对数据结构进行分析,一定程度上解决了非线性、非正态问题.本文建立了浙江省新昌县单季晚稻稻飞虱主害代发生程度的投影寻踪预测模型,并与BP神经网络模型、线性回归模型的预测结果进行了对比.结果表明:投影寻踪模型优于BP神经网络模型、线性回归模型;投影寻踪模型的历史符合率和预测准确率均为100%;BP神经网络模型历史符合率达到100%,但预测偏差较大;线性回归模型历史符合率和预测偏差均较大.可见,投影寻踪模型在稻飞虱发生程度的预测上具有较好的应用前景.  相似文献   

10.
基于支持向量机方法的蛋白可溶性预测   总被引:1,自引:0,他引:1  
按照蛋白质序列中残基的相对可溶性,将其分为两类(表面/内部)和三类(表面/中间/内部)进行预测。选择不同窗宽和参数对数据进行训练和预测,以确保得到最好的分类效果,并同其他已有方法进行比较。对同一数据集不同分类阈值的预测结果显示,支持向量机方法对蛋白质可溶性的整体预测效果优于神经网络和信息论的方法。其中,对两类数据的最优分类结果达到79.0%,对三类数据的最优分类结果达到67.5%,表明支持向量机是蛋白质残基可溶性预测的一种有效方法。  相似文献   

11.
林火是森林生态系统的重要影响因子,建立科学准确的林火预测预报模型对林火管理工作至关重要。本研究以不同气象因子为主要预测变量,基于Logistic回归和广义线性混合效应模型建立福建省林火发生预测模型,通过对比Logistic基础模型和广义线性混合效应模型的拟合度和预测精度,研究混合效应模型在林火预报中的适用性。结果表明: Logistic基础模型的受试者工作特征曲线下面积(AUC)值为0.664,验证准确率为60.4%。添加随机效应后,模型的拟合和检验精度均获得了提升。其中,考虑行政区划和海拔差异效应的两水平混合效应模型的表现最优,其AUC值和验证准确率分别比基础模型提升0.057和6.0%。用此混合效应模型对福建省各地区的林火发生概率进行预测的结果表明,福建省西北部和南部为林火中高发区域,西南部和东部为林火低发区域,与实际观测的火点分布一致。混合效应模型在数据拟合和林火发生预测方面均优于Logistic基础模型,可作为林火预测和管理的重要工具。  相似文献   

12.
用植物生活史性状预测种子扩散方式   总被引:2,自引:0,他引:2  
种子扩散方式对植物物种分布、种群动态及群落组成都有重要影响,但目前有关种子扩散方式的数据还很欠缺。植物的生活史性状与种子扩散方式联系密切,通过植物生活史性状预测种子的扩散方式是一种有效的研究手段。本文基于我国360种植物的生长型、株高、种子质量和果实类型以及种子扩散方式的数据集,随机抽取288个物种数据(80%)作为训练样本,采用神经网络、决策树、费舍尔线性判别和支持向量机算法,分别建立种子扩散方式的预测模型,将其余72个物种数据(20%)用于模型检验。以1,000次随机抽样后的平均判别正确率作为模型预测效果的评价指标。结果表明:用生长型、株高、种子质量及果实类型作为主要预测变量,构建的神经网络、决策树、费希尔线性判别和支持向量机模型均能达到较好的预测效果,准确率分别为78.90%、77.09%、77.81%和78.14%,其中以神经网络模型的预测效果最好。进一步研究发现,神经网络模型对动物扩散、无助力扩散和风扩散的预测效果分别为81.32%、74.90%和81.45%。本研究为植物种子扩散方式预测提供了一种新的思路。  相似文献   

13.
蛋白质结构预测研究进展   总被引:1,自引:0,他引:1  
蛋白质结构预测是生物信息学当前的主要挑战之一.按照蛋白质结构预测对PDB数据 库信息的依赖程度,可以将其划分成两类:模板依赖模型和从头预测方法.其中模板依赖模 型又可以分为同源模型与穿线法.本文介绍了各种预测方法主要步骤,分析了制约各种方法 的瓶颈,及其研究进展.同源模型所取得的结构精度较高,但其对模板依赖性强;用于低同 源性的穿线法是模板依赖的模型重要的研究方向;从头预测法中统计学函数与物理函数的综 合使用取得了很好的效果,但是对于超过150个残基的片段,依然是巨大的挑战.  相似文献   

14.
翻译起始位点(TIS,即基因5’端)的精确定位是原核生物基因预测的一个关键问题,而基因组GC含量和翻译起始机制的多样性是影响当前TIS预测水平的重要因素.结合基因组结构的复杂信息(包括GC含量、TIS邻近序列及上游调控信号、序列编码潜能、操纵子结构等),发展刻画翻译起始机制的数学统计模型,据此设计TIS预测的新算法MED.StartPlus.并将MED.StartPlus与同类方法RBSfinder、GS.Finder、MED-Start、TiCo和Hon-yaku等进行系统地比较和评价.测试针对两种数据集进行:当前14个已知的TIS被确认的基因数据集,以及300个物种中功能已知的基因数据集.测试结果表明,MED-StartPlus的预测精度在总体上超过同类方法.尤其是对高GC含量基因组以及具有复杂翻译起始机制的基因组,MED-StartPlus具有明显的优势.  相似文献   

15.
沈泽昊  赵俊 《生态学报》2007,27(3):953-963
将基于样本调查数据的群落-生境因子回归分析与GIS支持下的植物属性空间格局预测结合起来,是国际上植被-环境关系定量研究的新途径。通用可加性模型(GAM)的非参数属性使之具有对不同数据类型的广泛适应性,成为这种“回归分析+空间预测”途经的有效手段;不同程度上依赖于数字高程模型的环境空间数据集是实现空间预测的必要条件。介绍了这一新的研究途径,并应用于案例研究区域植物多样性指标空间格局的预测和分析。野外调查的一组样方地形特征指标和植物多样性指标(包括样方物种丰富度及乔木、灌木、草本、常绿木本、珍稀种类的丰富度),分别作为预测变量和响应变量,建立GAM模型。结合研究区域10m分辨率的数字高程模型,对该区域植物物种丰富度的空间格局进行空间预测,并对预测模型和结果进行统计分析和检验。结果表明:(1)不同的多样性指标具有不同的模型结构和模拟效果,重复模拟的结果稳定性也不同,反映了所受地形因子影响的差异;(2)影响各多样性指标空间格局的地形变量主要是坡位和坡度等小尺度特征,大尺度海拔因素的影响并不显著;(3)模拟结果与独立检验数据的相关分析表明,对乔木种、草本种、珍稀种的模拟全部有效;对常绿种和样方物种总数的模拟部分有效;而对灌木种丰富度的预测基本失败。(4)模型预测变量有效性和全面性决定了模型对数据的解释能力,样本大小对模型的稳定性和可靠性也有显著影响。就地形因子对生境条件的代表性、模拟误差的来源及GAMs模型的优缺点和应用前景进行了讨论。  相似文献   

16.
从氨基酸序列预测蛋白质折叠速率   总被引:1,自引:0,他引:1  
蛋白质折叠速率预测是当今生物物理学最具挑战性的课题之一.近年来,许多科研工作者开展了大量的研究工作来探索折叠速率的决定因素,许多参数和方法被相继提出.但氨基酸残基间的相互作用、氨基酸的序列顺序等信息对折叠速率的影响从未被提及.采用伪氨基酸组成的方法提取氨基酸的序列顺序信息,利用蒙特卡洛方法选择最佳特征因子,建立线性回归模型进行折叠速率预测.该方法能在不需要任何(显示)结构信息的情况下,直接从蛋白质的氨基酸序列出发对折叠速率进行预测.在Jackknife交互检验方法的验证下,对含有99个蛋白质的数据集,发现折叠速率的预测值与实验值有很好的相关性,相关系数能达到0.81,预测误差仅为2.54.这一精度明显优于其他基于序列的方法,充分说明蛋白质的序列顺序信息是影响蛋白质折叠速率的重要因素.  相似文献   

17.
目的:探讨应用ARIMA模型预测宝安区某街道其它感染性腹泻发病率的可行性。方法:应用SPSSl3.0软件对2005年~2009年宝安区某街道其它感染性腹泻逐月发病率进行ARIMA模型建模拟合,用所得到的模型对2010年各月发病率进行预测,并评价其预测效果。结果:宝安区桌街道其它感染性腹泻发病率每年11月为发病高峰,ARIMA(0,1,1)(0,1,0)12模型是其拟合的最佳模型,其预测结果和实际值绝对误差的绝对值最大为930.47,最小为1.96,平均值214.83,平均相对误差百分比39.04%。结论:模型虽然起到一定的预测效果,但预测精度仍存在误差,可通过积累新的周期数据对ARIMA模型进行修正和重新拟合,也可尝试新的预测方法或其他模型,才能加强和保证预测的精度。  相似文献   

18.
将连续性的基因型值数据和间断性的分子标记数据整合建立混合遗传距离,对比了应用混合遗传距离和单纯应用基因型遗传距离构建植物遗传资源核心子集的效果.应用混合线性模型中的调整无偏预测法(AUP)预测基因型值,结合不加权类平均法(UPGMA)逐步聚类构建遗传资源群体的核心子集,并检测一系列核心子集的代表性评价参数.采用包含8个农艺性状和60个SSR标记信息的水稻群体数据验证混合遗传距离的有效性.结果表明,采用混合数据构建的核心子集比单纯的基因型值数据构建的核心子集更有代表性.主成分分析结果验证了该结论的可知陛.  相似文献   

19.
基于Z标度法对C/18家族几丁质酶的特征序列PS01095和PS00232进行数字转换,将得到的数据集采用逐步回归方法回归预测,构建了几丁质酶特征序列与其最适pH间关系的数学模型.当模型的相关系数为R=0.964,显著水平P<0.001,得到了最佳的预测效果.模型对pH值拟合的平均绝对百分比误差为0.05 %,同时具有良好的预测效果,预测的平均绝对误差为0.26 个pH单位,比基于几丁质酶氨基酸组成的支持向量机模型更好.  相似文献   

20.
广义岭回归在家禽育种值估计中的应用   总被引:4,自引:1,他引:3  
讨论了岭回归方法应用于混合线性模型方程组中估计家禽育种值的方法,其实质是将传统的混合线性模型方程组理解为一种广义岭回归估计,为确定遗传参数的估计提供了一种途径;同时,以番鸭为例,考虑了一个性状和两个固定效应,采用广义岭回归法对公番鸭育种值进行了估计,并与最佳线性无偏预测法(BLUP 法)进行了比较,结果表明,广义岭回归方法和BLUP 法估计的育种值及其排序非常接近,其相关系数和秩相关系数分别达到了0.998~(**)和0.986~(**),且采用广义岭回归法预测的误差率低(在±10%以内);表明在混合线性模型方程组中使用广义岭回归估计动物育种值的方法具有可行性,并可省去估计遗传参数的过程,使BLUP 法在动物选育中的应用更具实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号