首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
在生态学中,尺度问题一直是重点也是难点,多尺度胸径分布问题经常遇到且至今没有很好的解决方法,建立多尺度胸径分布统一模型是解决问题的关键;多尺度胸径分布统一模型的建立包括2方面的内容:第一,选择合适的概率分布函数,应用最大熵原理推出胸径分布统一模型,它具有明确的解析表达式,既能克服常用方法无法解释测树因子服从某种概率分布的真正原因,也能克服常用方法无法区分测树因子服从多种概率分布的不足,从而可以作为林分尺度测树因子概率分布的统一模型.第二,尺度与尺度转换,常用研究尺度问题的方法具有2个不足:(1)研究大尺度时损失了样地(林分尺度)资料的宝贵信息;(2)研究林分尺度时无法进行尺度转换.提出的联合最大熵概率密度函数可以克服常用研究尺度方法的以上2个不足,该函数的每一个组成部分都是最大熵函数;联合最大熵概率密度函数可以作为多尺度胸径分布统一模型,既可以最大限度的利用每个样地的信息,又可以进行多尺度的自由转换,从而为测树因子统计分布建模提供了一种有效方法;用森林资源连续清查样地中属于安吉的22个毛竹样地对文中提出的方法进行了验证,结果表明方法可行且对每个样地的拟合精度都很高.  相似文献   

2.
基于最大熵原理的浙江毛竹胸径分布及测量不确定度评定   总被引:2,自引:0,他引:2  
应用最大熵原理构造了测树因子概率分布的统一模型,这样构造的模型具有明确的解析表达式,并能克服常用方法无法解释测树因子服从某种概率分布的真正原因,从而为测树因子统计分布建模提供了一种有效方法.使用1-3阶样本矩、1-4阶样本矩与1-5阶样本矩,用所构建的概率分布统一模型分别对浙江省域毛竹胸径分布分别作了仿真试验,结果表明当采用1-4阶样本矩时,仿真效果最好,而且比通过假设检验的Weibull分布仿真结果理想:(1)图形非常相似,对实测数据都能很好的模拟;(2)最大熵法的离差平方和为0.00018,Weibull分布的为0.00045[1].由于各种系统与非系统的原因,都会影响测量结果的准确性,对所构建的模型作了不确定度评定,表明结果具有很大的可靠性,测量结果的估计:7.85100,测量结果的标准不确定度:1.82710,置信概率:0.96020.  相似文献   

3.
姚雨微  任鸿瑞 《生态学报》2024,44(7):3049-3059
及时准确评估草地产草量对草地资源的科学管理和可持续发展具有重要意义。青藏高原自然环境特殊,气候差异显著,地形复杂,仅依靠遥感信息准确监测草地地上生物量(Aboveground Biomass,AGB)变化有较大限制。基于青藏高原草地AGB野外实测数据与Landsat遥感影像,探索了植被指数表征草地AGB信息的有效性,评估了气象和地形信息对准确估算草地AGB的影响,综合利用气象、地形和遥感信息,在新一代地球科学数据和分析应用平台(Google Earth Engine)上构建了梯度增强回归树草地AGB估算模型,绘制了青藏高原多年草地AGB空间分布图。结果表明:(1)基于单因素遥感因子的线性回归模型仅能解释8%-40%的草地AGB变化情况,其中绿色归一化植被指数(Green Normalized Difference Vegetation Index, GNDVI)对草地AGB解释能力较强(40%)。(2)基于遥感因子构建的梯度增强回归树模型测试集R2为0.57。分别添加气象、地形信息,模型对草地AGB的估测准确性有所提升,测试R2为0.62和0.63。(3)基于气象、地形和遥感因子的多因素估测模型能够提高草地AGB估测精度,经递归特征消除法优选后,基于13个特征变量的梯度增强回归树模型拟合效果最好(训练数据集R2=0.79,RMSE=43.42 g/m2,P<0.01;测试数据集R2=0.66,RMSE=53.64 g/m2,P<0.01),可以解释66%草地AGB变化情况。(4)2010年青藏高原平均AGB为94.58 g/m2,2015年93.63 g/m2,2020年100.78 g/m2。青藏高原西北部草地AGB较低,东南部草地AGB较高,整体呈现自西北向东南逐渐增加的分布格局。研究结果为准确估算青藏高原草地产草量和碳储量等研究提供重要参考。  相似文献   

4.
精确测定与模拟高山-亚高山灌丛生物量是了解陆地生态系统碳功能的重要基础工作。以甘肃南部高山-亚高山地区常见的7种高寒杜鹃(Rhododendron spp.)灌木为对象,通过标准植株收获法,建立易测因子与各器官生物量及总生物量的方程并检验拟合精度,筛选最优拟合方程。结果表明:(1)自变量和函数的类型对杜鹃生物量的模拟效果影响较大,700组方程中以DD2H为自变量和以幂函数为模型拟合的R2相对集中、中位数都较高。(2)遴选出的35组单物种最优生物量模型的R2介于0.66-0.99之间、中位数为0.92,除山光杜鹃(Rh.oreodoxa)的茎、叶生物量和地上生物量模型为线性函数、麻花杜鹃(Rh.maculiferum)的所有模型为指数函数外,其余的生物量模型均为幂函数;DD2H是单物种生物量模型的最佳预测变量,H仅是黄毛杜鹃(Rh.rufum)除根外、美容杜鹃(Rh.calophytum)叶生物量的最佳预测变量。(3)混合物种最优模型是以D2H为自变量的幂函数,除对叶生物量的模拟精度相对较低外,对其它生物量的模拟均较好。甘肃南部7种高寒杜鹃灌木生物量模型的建立为高寒地区灌丛生态系统碳汇功能的研究提供了支撑。  相似文献   

5.
兰洁  雷相东  何潇  高文强  李玉堂 《生态学报》2021,41(13):5128-5141
量化天然林生态系统的多功能性,分析不同功能间的权衡-协同关系及驱动因子,对于天然林保护及修复具有重要的意义。基于吉林省第8次森林资源清查天然阔叶混交林固定样地调查数据、土壤及气候数据,选取土壤保持、涵养水源、碳储量、气候调节、土壤肥力维持、生物多样性、生产力和木材生产8个生态系统功能来表征生态系统多功能性。利用平均值法中的最大值转换法计算多功能性指数。结果表明:(1)8个功能间权衡、协同和中性关系均存在,但以协同关系为主。生物多样性除与气候调节为权衡关系外,与其他功能均为协同关系;碳储量-木材生产协同关系最强(r=0.960,P<0.01),气候调节-涵养水源间权衡关系最强(r=-0.934,P<0.01);(2)吉林省天然阔叶混交林的多功能性指数在0.31-0.89之间,且生物多样性和气候调节为主导功能;(3)多功能性与驱动因子的结构方程模型确定系数为R2=0.795,多功能性的驱动因子的总路径系数依次为:林分密度指数(0.752) > 平均年龄(0.375) > 年降雨量(0.365) > 树种丰富度(0.101) > 土壤pH(0.064) > 结构多样性(-0.037) > 年均温(-0.105),林分密度是最重要的驱动因子。结果对理解天然阔叶混交林的多功能形成及经营调控有一定的意义。  相似文献   

6.
联合GF-6和Sentinel-2红边波段的森林地上生物量反演   总被引:1,自引:0,他引:1  
光谱反射率能反映地物差异,是森林地上生物量(Aboveground Biomass,AGB)遥感反演的理论基础。红边波段处于近红外与红光波段交界处快速变化的区域,能对植被冠层结构和叶绿素含量的微小变化做出快速反应,对植被生长状况较敏感。研究以GF-6和Sentinel-2多光谱影像作为数据源,结合野外调查AGB数据,构建落叶松和樟子松AGB线性和非线性估测模型,通过比较模型精度选择最优模型进行森林AGB反演和空间分布制图。结果表明:GF-6和Sentinel-2影像红边波段反射率与落叶松、樟子松AGB均呈显著相关(P<0.05),红边波段对AGB估测较敏感。多变量估测模型整体估测效果优于单变量模型,所有模型中多元线性回归模型取得了最优的决定系数(落叶松R2=0.66,樟子松R2=0.65)和最低的均方根误差(落叶松RMSE=31.45 t/hm2,樟子松RMSE=54.77 t/hm2)。相比单个数据源,联合GF-6和Sentinel-2影像构建的多元线性回归模型估测效果得到了显著提升,模型RMSE对于落叶松和樟子松AGB估测分别最大降低了22.9%和11.2%。增加红边波段进行AGB估测能显著提高模型估测精度,三组数据源分别加入红边波段信息后进行建模,模型RMSE得到了显著降低。GF-6拥有800 km观测幅宽和高效的重访周期,可以快速地提供大尺度时间序列数据,在森林地上生物量反演和动态监测方面有着很大潜力。  相似文献   

7.
基于高分辨率遥感影像的北亚热带森林生物量反演   总被引:2,自引:0,他引:2  
以北亚热带湖北省太子山林场为研究对象,基于高空间分辨率GF-2与SPOT-6卫星影像,提取不同窗口大小下的纹理信息与光谱信息,利用随机森林回归算法,并结合野外实测106块样地的生物量数据,建立不同影像下的太子山林场森林生物量反演模型。结果显示:(1) GF-2和SPOT-6虽然空间分辨率有差异,但是从其不同波段反射率的相关系数(0.75、0.78、0.73、0.61)发现,两种影像的波段反射率具有较高的相关性,说明两者的辐射性能相近;(2)通过分析不同纹理特征对生物量模型的影响,发现均值和对比度纹理参数对生物量反演具有很好的效果。(3)高分辨率的遥感数据在生物量反演中具有较好的表现,且GF-2生物量模型精度(R2=0.88,RMSE=27.11 Mg/hm2)与SPOT-6生物量模型的精度(R2=0.89,RMSE=23.93 Mg/hm2)相近。(4)两种影像对不同森林类型的生物量预测值不存在显著差异,都适合对不同林分类型的生物量进行预测。  相似文献   

8.
杨彪  张全建  王彬  龚旭  段晨松  张远彬 《生态学报》2020,40(17):6077-6085
雅砻江冬麻豆(Salweenia bouffordiana)是近年发现的西南特有冬麻豆属新濒危种,主要分布于四川新龙县的雅砻江河谷。开展其生境适宜性评价及其影响因素分析是对其有效保护的前提和基础。基于2015年8月在雅砻江河谷调查获得的55个分布点,结合24个环境变量数据,利用最大熵模型分析影响雅砻江冬麻豆生境的主要环境因子及其适宜生境预测。结果表明:(1)AUC(曲线下面积)值高于0.9,模型具有较高的准确度,适宜于雅砻江冬麻豆的生境适宜性预测和评估;(2)年均温、最湿月降水、昼夜温差月均值和距河流距离是影响雅砻江冬麻豆生境的最主要环境变量,其最适生境环境变量组合为年均温7.9℃、最湿月降水120-124 mm、昼夜温差月均值13.8℃以及距河流距离33 m;(3)雅砻江冬麻豆的潜在适宜和次适宜生境面积分别约为4.83×103 hm2和2.37×104 hm2,但仅约7.56×102 hm2的潜在适宜生境和3.28×103 hm2的潜在次适宜生境位于现有自然保护区管辖范围内。雅砻江冬麻豆的潜在适生区主要沿雅砻江河谷呈狭长的条带状分布,现存区受人类活动影响大,未有生物学地位定级,应尽快确定其生物学保护地位,建立保护小区或社区保护地进行就地保护。  相似文献   

9.
流域水文变化对胡杨荒漠河岸林林窗及形成木特征的影响   总被引:1,自引:0,他引:1  
林窗作为森林生态系统得以长期维持的主要驱动力之一,能够促进森林的自然更新与演替、优化森林结构和养分循环,从而提高生物多样性及生态系统服务功能。基于塔里木河中游历年径流量、耗水量与地下水埋深等水文数据,利用回归模型、拟合优度t检验与种群结构动态定量相结合的方法,分析了研究区水文条件对胡杨荒漠河岸林林窗数量及其形成木种群结构与动态的影响。结果表明:1)1970年前塔里木河中游水量较为充足,在一定程度上可满足胡杨生存发育的需水量。自1980年来,塔里木河中游年径流量(R2=0.785,P < 0.01)与耗水量(R2=0.524,P < 0.01)呈明显减少趋势、地下水日益匮乏,其埋深呈直线下滑趋势(R2=0.8618,P < 0.01)。这导致河道两岸的胡杨林生态用水日益紧缺,从而引起胡杨林林窗现象频繁出现,尤其是在1997-2006年期间。2)随着中游年径流量与耗水量逐渐减少、地下水埋深逐渐增加,林窗内胡杨形成木数量则变为增长趋势。3)林窗形成木除1957-1966、1967-1976年属衰退型外,1977-1986、1987-1996、1997-2006和2007-2016年均呈现增长型特征。特别是林窗内胡杨形成木Ⅱ级幼龄树大幅度增加,其表现出胡杨林年龄结构的老龄化特征。4)由模型显示,林窗及其形成木数量与径流量之间存在显著性负相关,径流量降至17.81×108 m3时,林窗内的胡杨将面临高峰死亡。由此可知,在干旱区水文条件是决定胡杨生死的主导因子,也是塔里木河中游荒漠河岸林林窗形成的主要原因。  相似文献   

10.
左嫚  陈奇伯  黎建强  杨关吕  胡景  孙轲 《生态学报》2021,41(11):4552-4561
为研究枯落物输入变化对云南松(Pinus yunnanensis)林地CO2释放的影响。本研究于2018年3月至2020年2月,应用枯落物添加和去除实验(DIRT),设置对照(CK)、双倍枯落物(DL)、去除枯落物(NL)、去除有机层和A层(O/A-Less)、去除根系(NR)和无输入(NI)6个处理水平,采用Li-6400便携式光合作用测量仪及TRIME-PICO 64/32土壤温度水分测定仪对不同处理样地每月的CO2通量(Rs)、土壤温度和土壤水分(15cm)进行了测定。结果表明:(1)不同处理样地CO2通量均呈现出明显的月变化,7至8月最高,1至4月最低,平均值表现为Rs (DL)=8.10 μmol m-2 s-1 > Rs (CK)=6.27 μmol m-2 s-1 > Rs (NL)=5.44 μmol m-2 s-1 > Rs (NR)=4.46 μmol m-2 s-1 > Rs (O/A-Less)=3.86 μmol m-2 s-1 > Rs (NI)=2.94 μmol m-2 s-1。(2)与CK相比,DL样地CO2通量升高了29.12%,而去除地上枯落物和地下根系样地CO2通量显著降低,CO2通量平均变幅分别为α(NR)=-28.85%,α(NI)=-53.14%,α(O/A-Less)=-38.46%,α(NL)=-13.29%。(3)不同处理土壤水分和土壤温度均存在显著的月变化(P<0.01),NL和O/A-Less的土壤水分显著低于CK,而其余处理与CK间无显著差异(P>0.05);不同处理间土壤温度表现为NR和NI均显著高于CK,其余处理与CK间无显著差异(P>0.05)。(4)不同处理样地CO2通量与土壤温度呈显著指数相关(P<0.01),与土壤水分在NI和O/A-Less处理中无显著相关(P>0.05);与CK相比,NI、O/A-Less和NL处理的Q10增加,而NR和DL处理的Q10则降低;不同处理林地CO2通量与土壤水热因子双因素模型能更好的解释林地CO2通量的变化。本研究表明枯落物不同处理通过改变土壤碳输入和土壤环境因子从而影响生态系统碳排放,研究结果可为未来气候变化和人为干扰下云南松林的碳循环提供基础数据。  相似文献   

11.
关于最大信息熵原理与群体遗传平衡一致性的探讨   总被引:16,自引:1,他引:15  
张宏礼  张鸿雁 《遗传》2006,28(3):324-328
汪小龙等建立了用最大信息熵原理推导一个基因座上群体遗传平衡的统一数学模型,并给出了模型的最大值解,此解正是Hardy-Weinberg平衡定律所给出的基因型频率。这说明当群体基因型信息熵最大时,群体基因型频率不再变化,达到平衡状态,从而证明了最大信息熵原理与Hardy-Weinberg平衡定律具有一致性,同时指出这一结论可以推广至有迁移、突变、选择、遗传漂变、近亲交配的群体以及多个基因座情形。概括地说就是:最大信息熵原理与群体遗传平衡具有一致性。但是,他们仅仅证明了最大信息熵原理与一个基因座上Hardy-Weinberg平衡定律具有一致性,本文在这个范围内将其推广至多个基因座,且每一个基因座均为复等位基因情形。至于最大信息熵原理是否与其它的群体遗传平衡具有一致性,他们的结论仅仅是猜想,并未严格推导。事实上,要想将这种一致性推广到迁移、突变、随机漂变和近亲交配等群体,则不见得正确。   相似文献   

12.
最大信息熵原理与群体遗传平衡   总被引:29,自引:0,他引:29  
建立了用最大信息熵原理推导群体遗传平衡定律的统一数学模型,并给出了模型的统一解,此解正是Hardy-Weinberg定律所给出的平衡群体的基因型频率,说明当群体信息熵达到最大时,群体基因型频率不再变化,即达到“平衡”。这证明了最大熵分布就是Hardy-Weinberg平衡分布。Hardy-Weinberg平衡定律与最大信息熵原理的内在一致性说明,杂交和随机交配是一个不可逆过程,使群体基因型信息熵增大,无序性增,是选择和近亲交配使群体的信息熵降低,有序性增加,育种过程实际就是调节群体信息熵的过程。过程信息熵的含义是表示一个概率分布的不确定性,最大熵原理意味着在一定的约束条件,选择具有最大不确定性的分布,从而其分布是最为随机的。最大熵原理在信息,工程,天文,地理,图像处理,模式识别等自然科学和社会科学领域都有广泛的成功应用,本文从群体遗传学角度证明了这一原理具有普遍适用性。熵是描述系统状态的函数,而最大熵原理则表明了系统发展变化的趋势,系统的最终状态必然是熵增加至最大值的状态,对于任何系统都是如此。因此,群体遗传系统的平衡定律可以统一用最大熵原理进行判定和描述;任意群体的基因型信息熵在随机交配世代传递时有不断增加的趋势;在一定约束条件下基因型信息熵达到最大值时,就称之为达到遗传平衡。本文将信息论原理应用于群体遗传学研究,揭示了基因信息熵的生物学意义,并表明可以用信息学和控制论的原理和方法来研究群体遗传学问题。  相似文献   

13.
蜡梅(Chimonanthus praecox)是我国二级濒危珍稀植物,是重要的冬季传统观花植物。利用已报道的246个分布点和worldclim中提取的19个气候因子,基于最大熵(Maxent)模型和地理信息系统(Arc Gis)对蜡梅在中国的潜在适生区分布进行预测分析,采用受试者工作特征(ROC)曲线对预测结果进行检验和评价。结果表明蜡梅的潜在适生范围相对集中,主要集中在西南的四川盆地、华中、华东及华北的中南部地区,其他地区则适应性较低。温度是影响蜡梅分布的决定性因子,其中,当最冷季度平均温度接近0℃,等温性范围为0—10℃,降雨量变异系数约为45时,蜡梅的分布概率最大。与原分布区相比较,蜡梅的适生区范围正向中国东部地区和北部地区迁移。ROC曲线检验评价结果表明,Maxent模型的ROC曲线分析法的面积(AUC)值为0.986,预测结果达到了极高精度。  相似文献   

14.
为了探究不同干扰程度下针阔混交林树种空间格局变化及树种种间关联性,本研究以关帝山庞泉沟自然保护区不同干扰强度的针阔混交林为对象,选取郁闭度、林分密度、伐桩数量作为划分干扰程度的因子,采用相对影响法,将林分划分为未干扰、中度干扰和严重干扰3个等级。利用空间点格局K2函数分析了林分的空间分布格局及其不同树种的种间关联。结果表明: 未干扰样地直径分布呈倒“J”型,中度和严重干扰样地直径分布均为双峰曲线分布。同时,未干扰和中度干扰林分在小尺度上呈现聚集分布,严重干扰的林分随机分布更为显著。针阔树种种间关系表现为未干扰林分在所有尺度上无关联;小尺度上中度干扰表现为正相关,严重干扰林分表现为负相关;较大尺度上中度与严重干扰林分均表现为不相关。说明林分干扰程度越严重,林下小径级林木数量越少,导致小尺度上种内聚集程度越低。同时,适当的干扰程度有利于林分内物种间对环境资源的协同利用。研究揭示了干扰对林分结构的影响,可为林分结构调整及抚育经营提供理论依据。  相似文献   

15.
Understanding the mechanisms of assembly of tree communities is very important for restoring and managing pine-oak mixed forests in the Qinling Mountains, China, but the essential mechanisms remain largely unexplored. The objective of this research was to uncover the underlying mechanisms of species coexistence and to identify the key environmental factors influencing the tree community assemblages in these forests. We investigated tree species and 15 environmental factors of topography, soil properties, and stand development of pine-oak mixed forests at an elevation of 1000-2000 m a.s.l. in the Qinling Mountains. Six classical models for the distribution of species abundance were used to fit the observed distributions; a clustering analysis was conducted to divide the ecological species groups, and a redundancy analysis examined the relationship between species assemblages and various environmental factors. Zipf-Mandelbrot, neutral-theory, log-normal, and Zipf models performed well in fitting the patterns of species-abundance distribution in the pine-oak mixed forests, which was related to the complexity of the community structure of the forests. A special combination of the Zipf-Mandelbrot and neutral-theory models, however, best explained the mechanism of species coexistence for the forests and indicated that these forests were progressive successional communities able to maintain stable development during succession. In addition, multiple factors controlled the tree community assemblage of pine-oak mixed forests in the mountainous regions, although available potassium, slope aspect, average tree DBH, and slope position were significant environmental variables.  相似文献   

16.
We extend macroecological theory based on the maximum entropy principle from species level to higher taxonomic categories, thereby predicting distributions of species richness across genera or families and the dependence of abundance and metabolic rate distributions on taxonomic tree structure. Predictions agree with qualitative trends reported in studies on hyper‐dominance in tropical tree species, mammalian body size distributions and patterns of rarity in worldwide plant communities. Predicted distributions of species richness over genera or families for birds, arthropods, plants and microorganisms are in excellent agreement with data. Data from an intertidal invertebrate community, but not from a dispersal‐limited forest, are in excellent agreement with a predicted new relationship between body size and abundance. Successful predictions of the original species level theory are unmodified in the extended theory. By integrating macroecology and taxonomic tree structure, maximum entropy may point the way towards a unified framework for understanding phylogenetic community structure.  相似文献   

17.
This paper describes how Cox's Proportional Hazards model may be used to analyze dichotomized factorial data obtained from a right-censored epidemiological study where time to response is of interest. Exact maximum likelihood estimates of the relative mortality rates are obtained for any number of prognostic factors, as well as their joint asymptotic sampling distribution. These rates represent excess mortality due to the various levels of the prognostic factors. The results are used to discuss the effect of the factors on the survival probability distribution of a cohort of industrial workers who have been exposed to a carcinogen. Kaplan-Meier estimates of the survival function of the internal control population are used to determine the expected number of deaths in the study population. This method differs from the usual lite-table procedure. Asymptotic tests are proposed for some simultaneous and conditional statistical hypotheses.  相似文献   

18.
Poland D 《Biopolymers》2006,81(2):127-135
In this article we use the published heat capacity data of Dragan et al. (J Mol Biol 2003, 327, 293-411) for a short DNA duplex to calculate the enthalpy probability distribution for this species as a function of temperature. Our approach is based on a procedure that we developed (Poland, D. J Chem Phys 2000, 112, 6554) whereby one obtains moments of the enthalpy distribution from the temperature dependence of the heat capacity. One then uses the maximum-entropy method to construct the enthalpy probability distribution from the set of enthalpy moments. For the DNA duplex treated here the heat capacity goes through a maximum as a function of temperature reflecting the unwinding of the duplex structure. In the neighborhood of the heat capacity maximum, the enthalpy distribution functions show a clear bimodal structure, indicating the coexistence of two distinct states, the duplex and the single-strand state. The probabilities of theses two states can be estimated from the enthalpy distribution functions and can be used to calculate the temperature dependence of the equilibrium constant for the unwinding of the DNA duplex. This example illustrates that the temperature dependence of the heat capacity can be used to give a detailed picture of conformational transitions in biological macromolecules. In particular, the structure of the enthalpy distribution in this case allows one to see the temperature evolution of the two-state distribution in detail.  相似文献   

19.
A novel method for predicting the secondary structures of proteins from amino acid sequence has been presented. The protein secondary structure seqlets that are analogous to the words in natural language have been extracted. These seqlets will capture the relationship between amino acid sequence and the secondary structures of proteins and further form the protein secondary structure dictionary. To be elaborate, the dictionary is organism-specific. Protein secondary structure prediction is formulated as an integrated word segmentation and part of speech tagging problem. The word-lattice is used to represent the results of the word segmentation and the maximum entropy model is used to calculate the probability of a seqlet tagged as a certain secondary structure type. The method is markovian in the seqlets, permitting efficient exact calculation of the posterior probability distribution over all possible word segmentations and their tags by viterbi algorithm. The optimal segmentations and their tags are computed as the results of protein secondary structure prediction. The method is applied to predict the secondary structures of proteins of four organisms respectively and compared with the PHD method. The results show that the performance of this method is higher than that of PHD by about 3.9% Q3 accuracy and 4.6% SOV accuracy. Combining with the local similarity protein sequences that are obtained by BLAST can give better prediction. The method is also tested on the 50 CASP5 target proteins with Q3 accuracy 78.9% and SOV accuracy 77.1%. A web server for protein secondary structure prediction has been constructed which is available at http://www.insun.hit.edu.cn:81/demos/biology/index.html.  相似文献   

20.
Zaman MH  Berry RS  Sosnick TR 《Proteins》2002,48(2):341-351
We introduce a method to estimate the loss of configurational entropy upon insertion of a cross-link to a dimeric system. First, a clear distinction is established between the loss of entropy upon tethering and binding, two quantities that are often considered to be equivalent. By comparing the probability distribution of the center-to-center distances for untethered and cross-linked versions, we are able to calculate the loss of translational entropy upon cross-linking. The distribution function for the untethered helices is calculated from the probability that a given helix is closer to its partner than to all other helices, the "Nearest Neighbor" method. This method requires no assumptions about the nature of the solvent, and hence resolves difficulties normally associated with calculations for systems in liquids. Analysis of the restriction of angular freedom upon tethering indicates that the loss of rotational entropy is negligible. The method is applied in the context of the folding of a ten turn helical coiled coil with the tether modeled as a Gaussian chain or a flexible amino acid chain. After correcting for loop closure entropy in the docked state, we estimate the introduction of a six-residue tether in the coiled coil results in an effective concentration of the chain to be about 4 or 100 mM, depending upon whether the helices are denatured or pre-folded prior to their association. Thus, tethering results in significant stabilization for systems with millimolar or stronger dissociation constants.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号