排序方式: 共有28条查询结果,搜索用时 15 毫秒
1.
磷酸化作用在多种真核细胞中具有重要的功能. 由于对蛋白质激酶底物的实验测定方法限制较多, 同时费时费力, 因此急需发展快速、自动的机器学习方法. 利用蛋白质的一级序列信息可以对不同激酶家族作用的磷酸化位点进行预测, 同时也是对实验的一种补充和指导. 如果仅对磷酸化位点附近的短肽序列进行处理会丢失相当的信息, 将对预测结果造成一定影响. 提出了一种基于信息熵的磷酸化位点预测方法IEPP(information-entropy based phosphorylation prediction), 利用熵信息对磷酸化位点周围的氨基酸位点进行选择和排除, 仅选择对磷酸化作用有效的位点参与预测. 对3个代表性激酶家族ABL, MAPK和PKA的测试表明, 敏感性(Sn)和专一性(Sp)均好于较新的PPSP和GPS算法的结果. 而且同一些在线预测网站的实时测试, 如Scansite等相比, 结果也要好于这些测试方法. 这些都证明了本研究提出的方案是一种有效的磷酸化作用位点预测方法, 且具有简单、高效、实时性好等优点. 相似文献
2.
最大信息熵原理与群体遗传平衡 总被引:29,自引:0,他引:29
建立了用最大信息熵原理推导群体遗传平衡定律的统一数学模型,并给出了模型的统一解,此解正是Hardy-Weinberg定律所给出的平衡群体的基因型频率,说明当群体信息熵达到最大时,群体基因型频率不再变化,即达到“平衡”。这证明了最大熵分布就是Hardy-Weinberg平衡分布。Hardy-Weinberg平衡定律与最大信息熵原理的内在一致性说明,杂交和随机交配是一个不可逆过程,使群体基因型信息熵增大,无序性增,是选择和近亲交配使群体的信息熵降低,有序性增加,育种过程实际就是调节群体信息熵的过程。过程信息熵的含义是表示一个概率分布的不确定性,最大熵原理意味着在一定的约束条件,选择具有最大不确定性的分布,从而其分布是最为随机的。最大熵原理在信息,工程,天文,地理,图像处理,模式识别等自然科学和社会科学领域都有广泛的成功应用,本文从群体遗传学角度证明了这一原理具有普遍适用性。熵是描述系统状态的函数,而最大熵原理则表明了系统发展变化的趋势,系统的最终状态必然是熵增加至最大值的状态,对于任何系统都是如此。因此,群体遗传系统的平衡定律可以统一用最大熵原理进行判定和描述;任意群体的基因型信息熵在随机交配世代传递时有不断增加的趋势;在一定约束条件下基因型信息熵达到最大值时,就称之为达到遗传平衡。本文将信息论原理应用于群体遗传学研究,揭示了基因信息熵的生物学意义,并表明可以用信息学和控制论的原理和方法来研究群体遗传学问题。 相似文献
3.
数量遗传学中一种新的求综合性状的方法 总被引:4,自引:1,他引:3
本文运用申农(Shannon)提供的最大熵原理,提出一种构成单一综合性状的新方法,并以此与数量遗传学中的多元统计法作了比较。在作多元遗传分析吋,常用多元统计法求出多个数量性状的综合性状,再对这些相互关联的基本性状作主成份分析或用典范相关进行遗传分析。本文提出了不同于多元统计学的另一种新的方法——最大熵法求出多个数量性状的单一综合性状值。它具有数学结构简单,过程明晰,结果简明等优点。 相似文献
4.
基于信息熵的我国日降水量随机性和时空差异性 总被引:1,自引:0,他引:1
我国日降水过程呈现明显的随机性与时空差异性,如何准确认识其时空变化规律对洪涝灾害防治等实际工作的影响具有重要意义.本文基于1961—2013年全国520个气象站点的日降水数据,选用信息熵指标研究我国日降水量的随机性.结果表明:研究期间,我国东南地区日降水量的随机性大于西北地区,且不同等级日降水量随机性的空间分布存在差异,小雨(降雨量0.1~10 mm,P_0)等级日降水量随机性较大,差异不明显,中雨(10~25 mm,P10)、大雨(25~50 mm,P25)等级日降水量随机性最大,差异明显,暴雨及以上(≥50 mm,P50)等级日降水量随机性最小,差异最明显.整体上,日降水的信息熵值呈上升趋势,表明全球气候变化下我国大部分地区日降水量的随机性增大,尤其表现为极端暴雨发生的频次明显增大.日降水信息熵的空间分布及其变化趋势可以很好地综合反映我国日降水量随机性的空间分布格局,可为洪涝灾害防治、农业规划布局、生态环境规划等提供科学依据. 相似文献
5.
磷酸化作用在多种真核细胞中具有重要的功能. 由于对蛋白质激酶底物的实验测定方法限制较多, 同时费时费力, 因此急需发展快速、自动的机器学习方法. 利用蛋白质的一级序列信息可以对不同激酶家族作用的磷酸化位点进行预测, 同时也是对实验的一种补充和指导. 如果仅对磷酸化位点附近的短肽序列进行处理会丢失相当的信息, 将对预测结果造成一定影响. 提出了一种基于信息熵的磷酸化位点预测方法IEPP(information-entropy based phosphorylation prediction), 利用熵信息对磷酸化位点周围的氨基酸位点进行选择和排除, 仅选择对磷酸化作用有效的位点参与预测. 对3个代表性激酶家族ABL, MAPK和PKA的测试表明, 敏感性(Sn)和专一性(Sp)均好于较新的PPSP和GPS算法的结果. 而且同一些在线预测网站的实时测试, 如Scansite等相比, 结果也要好于这些测试方法. 这些都证明了本研究提出的方案是一种有效的磷酸化作用位点预测方法, 且具有简单、高效、实时性好等优点. 相似文献
6.
本文解释Renyi广义熵的定义和意义,讨论各阶广义熵同artrey最大熵、Shannon信息熵和Renyi关联熵间的对应关系。最后,以DNA碱基序列为例计算非记忆和记忆信息源有序化和记忆化的信息量,并指出Renyi广义熵的局限性和应用范围。 相似文献
7.
8.
群落排表分类的两种数学方法 总被引:6,自引:0,他引:6
本文描述两种执行群落排表分类的数学方法:X2分类法和信息熵分类法,并以德国西北部草地数据为例进行了应用和分析。结果表明这两个方法都是有效的群落排表分类方法,它们所排的群落表可直接地反映群落类型和种类组成之间的关系,体现了Braun-Blanquet传统排表法的特点。 相似文献
9.
真核生物DNA非编码区的组分分析 总被引:4,自引:0,他引:4
在全基因组水平上,用直方图、混沌表示灰度图、距离差异度和信息熵差异度四种方法,研究了拟南芥、线虫、果蝇的DNA内含子、基因间隔区DNA、外显子三种区域的核苷酸短序列组分及组分复杂度.结果表明:a.不同基因组之间,不管基因数目多少,用4种方法得到的外显子部分其组分复杂度都比较接近,而非编码区部分的组分复杂度却很大.这一点定量地说明了物种之间的复杂程度,主要不体现在编码区部分,而体现在非编码区部分.b.同一基因组中,内含子的核苷酸短序列组分复杂度都是相似的,外显子和intergenic DNA部分的组分复杂度也是相似的.c.内含子和intergenic DNA在转录、剪切、二级结构等方面有很大的不同,但它们在核苷酸短序列组分上的差异却很小,说明内含子和intergenic DNA在转录、剪切、二级结构上的不同并不通过核苷酸短序列组分来进行限制. 相似文献
10.
大肠杆菌、酵母和果蝇基因保守位点的信息熵分析 总被引:1,自引:0,他引:1
对大量的大肠杆菌(Escherichia coli)、酵母(Yeast)和果蝇(Drosophila melanogaster)已知基因起始密码子和终止密码子上、下游各30个碱基序列,用重新定义单碱基信息冗余(记为D1(ι),ι是位点)和紧邻碱基的信息冗余(记为D2(ι),统计计算每个位点的D1(ι)和D2(ι)值。从结果看,双碱基比单碱基携带更多的信息;酵母和果蝇基因起始密码子上游-3位点D1(-3)和D2(-3)有一明显峰值;大肠杆菌基因起始密码子上游SD区域D1(ι)和D2(ι)有明显峰值,与他人结论相同。发现酵母基因起始密码子下游的+4位点与+5位点的紧邻碱基的D2(ι)有一峰值,其关联模式为TC(联合概率为0.211)。这说明用重新定义的信息冗余去确认DNA序列中存在的保守位点是完全可行的。 相似文献