首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
蛋白质结构的预测在理解蛋白质结构组成和蛋白质的生物学功能有重要意义,而蛋白质二级结构预测是蛋白质结构预测的重要环节。当PSSM位置特异性进化矩阵被广泛应用于将蛋白质初级结构序列编码作为输入样本后,每个残基可以被表示成二维空间的数据平面,由此文中尝试利用卷积神经网络对其进行训练。文中还设计了另一种卷积神经网络,利用长短记忆网络感知了CNN最后卷积特征面的横向特征和纵向特征后连同卷积神经网络的全连接共同完成分类,最后用ensemble方法对两类卷积神经网络模型进行了整合,最终ensemble方法中包含两类卷积神经网络的六个模型,在CB513蛋白质数据集测得的Q3结果为77.2。  相似文献   

2.
本文以醚菊酯类似物作为研究对象,尝试使用神经网络方法进行构效关系分析,并对该种农药活性进行了预测。在所研究的样本集中,由结构预测活性的成功率可达100%,本文的研究表明:神经网络方法以其极强的非线性能力,可望成为农药构效关系研究的一种有效的工具.  相似文献   

3.
按照蛋白质序列中残基的相对可溶性,将其分为两类(表面/内部)和三类(表面/中间/内部)进行预测.选择不同窗宽和参数对数据进行训练和预测,以确保得到最好的分类效果,并同其他已有方法进行比较.对同一数据集不同分类阈值的预测结果显示,支持向量机方法对蛋白质可溶性的整体预测效果优于神经网络和信息论的方法.其中,对两类数据的最优分类结果达到79.0%,对三类数据的最优分类结果达到67.5%,表明支持向量机是蛋白质残基可溶性预测的一种有效方法.  相似文献   

4.
张霞  李占斌  张振文  邓彦 《生态学报》2012,32(21):6788-6794
预测陕西洛惠渠灌区地下水动态变化情况,在综合分析了各种地下水动态研究方法的基础上,提出了基于支持向量机和改进的BP神经网络模型的灌区地下水动态预测方法,并在MATLAB中编制了相应的计算机程序,建立了相应的地下水动态预测模型。以灌区多年实例数据为学习样本和测试样本,比较了两种模型的地下水动态预测优劣性。研究表明,支持向量机模型和BP网络模型在样本训练学习过程中都具较高的模拟精度,而在样本学习阶段,支持向量机的预测精度明显优于BP网络,可以很好的描述地下水动态复杂的耦合关系。支持向量机方法切实可行,更加适合大型灌区地下水动态预测,是对传统地下水动态研究方法的补充与完善。  相似文献   

5.
基于支持向量机方法的蛋白可溶性预测   总被引:1,自引:0,他引:1  
按照蛋白质序列中残基的相对可溶性,将其分为两类(表面/内部)和三类(表面/中间/内部)进行预测。选择不同窗宽和参数对数据进行训练和预测,以确保得到最好的分类效果,并同其他已有方法进行比较。对同一数据集不同分类阈值的预测结果显示,支持向量机方法对蛋白质可溶性的整体预测效果优于神经网络和信息论的方法。其中,对两类数据的最优分类结果达到79.0%,对三类数据的最优分类结果达到67.5%,表明支持向量机是蛋白质残基可溶性预测的一种有效方法。  相似文献   

6.
用植物生活史性状预测种子扩散方式   总被引:2,自引:0,他引:2  
种子扩散方式对植物物种分布、种群动态及群落组成都有重要影响,但目前有关种子扩散方式的数据还很欠缺。植物的生活史性状与种子扩散方式联系密切,通过植物生活史性状预测种子的扩散方式是一种有效的研究手段。本文基于我国360种植物的生长型、株高、种子质量和果实类型以及种子扩散方式的数据集,随机抽取288个物种数据(80%)作为训练样本,采用神经网络、决策树、费舍尔线性判别和支持向量机算法,分别建立种子扩散方式的预测模型,将其余72个物种数据(20%)用于模型检验。以1,000次随机抽样后的平均判别正确率作为模型预测效果的评价指标。结果表明:用生长型、株高、种子质量及果实类型作为主要预测变量,构建的神经网络、决策树、费希尔线性判别和支持向量机模型均能达到较好的预测效果,准确率分别为78.90%、77.09%、77.81%和78.14%,其中以神经网络模型的预测效果最好。进一步研究发现,神经网络模型对动物扩散、无助力扩散和风扩散的预测效果分别为81.32%、74.90%和81.45%。本研究为植物种子扩散方式预测提供了一种新的思路。  相似文献   

7.
目的:比较反向传播算法(BP)神经网络和径向基函数(RBF)神经网络预测老年痴呆症疾病进展的效果。方法:以老年痴呆症随访数据为研究对象,以性别、年龄、受教育程度、有无高血压、有无高胆固醇、有无心脏病、有无中风史、有无家族史8个指标作为输入变量,以五年随访的MMSE差值为输出变量,构建基于BP神经网络和RBF神经网络的老年痴呆症疾病进展预测模型。结果:与BP神经网络模型相比,RBF神经网络预测的结果更好,能够有效地预测老年痴呆症疾病进展。结论:神经网络模型将老年痴呆症疾病进展预测问题转化为随访数据中相关测量指标与MMSE差值的非线性问题,为复杂的老年痴呆症疾病进展预测提供了新思路。  相似文献   

8.
目的:通过对癌症基因表达数据的分析,预测多形性胶质母细胞瘤的驱动基因集。方法:基于主成分分析方法和神经网络,提出一种用于预测多形性胶质母细胞瘤驱动基因的系统生物学模型。首先对实验样本的原始表达谱数据进行预清洗,过滤掉无信息或表达不符合实验要求的表达数据,并对肿瘤表达谱数据进行标准化处理;然后对基因进行划分,相似突变率的基因将被划分到同一块中;最后通过学习神经网络,构建癌症相关基因的调控网络,得出驱动基因的预测集。结果:本研究应用上述模型,对多形性胶质母细胞瘤(glioblastoma multiforme,GBM)驱动基因进行预测。已发表的大量实验结果表明,我们预测出的大部分驱动基因在GBM中起重要作用。结论:我们提出一种对GBM表达谱数据分析的新方法,能够高精度地预测出该疾病的驱动基因,该模型同样能够较好地用于分析其它疾病的表达谱数据。  相似文献   

9.
基于多元统计分析中对样本完整性的要求,为了在分析中不抛弃大量不完整的化石标本或者不大大减少变量,创建了一种恢复标本残缺数据的方法。本方法基于线性回归理论,假设同类标本个体之间的区别仅仅是大小的区别,形状的区别可以忽略不计,因此,在同类标本中,可以用一件标本的已知测量数据预测另一件标本的残缺测量数据。在多件标本的情况下,对某件标本的某个残缺数据的预测结果是用其他标本分别进行预测所得值的加权平均,加权系数的选取与每件标本的保存完好程度相关。用现生马属头骨及肢骨标本做的数据试验证明,该方法具有良好的稳定性,对标本的种类、数量及残缺值的多少均不敏感,对于尺寸较大的标本或数值较大的数据的预测效果要比对尺寸较小的标本或数值较小的数据的预测效果要好。与传统的线性回归方法的不同之处在于,本方法利用的是样本(即标本)间的线性相关性,传统方法利用的是变量(即测量项)间的线性相关性。在通常情况下,样本间的线性相关程度要优于变量间的线性相关程度。本方法简单实用,在对化石标本进行统计分析,特别是多元统计分析中具有良好的应用前景。  相似文献   

10.
提出一种基于三维卷积神经网络对肺部计算机断层扫描图像(CT)进行肺结节自动探测及定位的方法.基于开源数据集LUNA16开展研究,对数据进行像素归一化、坐标转换等预处理,对正样本使用随机平移、旋转和翻转的方式进行扩充,对负样本进行随机采样.搭建了三维卷积神经网络并在训练过程中调整网络参数,直到得到性能最佳的网络.此外还设...  相似文献   

11.
对于一些复杂的农业生态系统,人们对其生态过程了解较少,且这些系统的不确定性和模糊性较大,用传统的方法难以模拟这些系统的行为,神经网络模型因为能较精确地模拟这些系统的行为,而引起生态学者们的广泛兴趣。该文着重介绍了误差逆传神经网络模型的结构、算法及其在农业和生态学中的应用研究。误差逆传神经网络模型一般采用三层神经网络模型结构,三层的神经网络模型能模拟任意复杂程度的连续函数,而且因为它的结构小而不容易产生与训练数据的过度吻合。误差逆传神经网络模型算法的主要特征是:利用当前的输入误差对权值进行调整。在生态学和农业研究中,误差逆传神经网络模型通常作为非线性函数模拟器用于预测作物产量、生物生产量、生物与环境之间的关系等。已有的研究表明:误差逆传神经网络模型的模拟精度要远远高于多元线性方程,类似于非线性方程,而在样本量足够的情况下,有一定的外推能力。但是误差逆传神经网络模型需要大量的样本量来保证所求取参数的可靠性,但这在实际研究中很难做到,因而限制了误差逆传神经网络模型的应用。近年来人们提出了强制训练停止、复合模型等多种技术来提高误差逆传神经网络模型的外推能力,也提出了Garson算法、敏感性分析以及随机化检验等技术对误差逆传神经网络模型的机理进行解释。误差逆传神经网络模型的真正优势在于模拟人们了解较少或不确定性和模糊性较大系统的行为,这些是传统模型所无法实现的,因而是对传统机理模型的重要补充。  相似文献   

12.
BP人工神经网络在光谱定量预测中的应用   总被引:1,自引:0,他引:1  
人工神经网络是模仿大脑神经元网络结构和功能而建立的一种信息处理系统,广泛的应用于各种波谱数据处理。误差反向传播多层前馈式网络(back-propagation network,简称BP网络)应用最广,发展最为迅速。将BP神经网络用于紫外-可见吸收光谱和拉曼光谱数据的定量分析和预测,与原文的一元线性回归模型数据处理方法相比,获得了比较满意的预测结果,预测精度有显著提高。这为相关的光谱分析和数据处理提供了一种更有效、更精确的方法。  相似文献   

13.
Different network models have been suggested for the topology underlying complex interactions in natural systems. These models are aimed at replicating specific statistical features encountered in real-world networks. However, it is rarely considered to which degree the results obtained for one particular network class can be extrapolated to real-world networks. We address this issue by comparing different classical and more recently developed network models with respect to their ability to generate networks with large structural variability. In particular, we consider the statistical constraints which the respective construction scheme imposes on the generated networks. After having identified the most variable networks, we address the issue of which constraints are common to all network classes and are thus suitable candidates for being generic statistical laws of complex networks. In fact, we find that generic, not model-related dependencies between different network characteristics do exist. This makes it possible to infer global features from local ones using regression models trained on networks with high generalization power. Our results confirm and extend previous findings regarding the synchronization properties of neural networks. Our method seems especially relevant for large networks, which are difficult to map completely, like the neural networks in the brain. The structure of such large networks cannot be fully sampled with the present technology. Our approach provides a method to estimate global properties of under-sampled networks in good approximation. Finally, we demonstrate on three different data sets (C. elegans neuronal network, R. prowazekii metabolic network, and a network of synonyms extracted from Roget's Thesaurus) that real-world networks have statistical relations compatible with those obtained using regression models.  相似文献   

14.
15.
Gene expression arrays typically have 50 to 100 samples and 1000 to 20,000 variables (genes). There have been many attempts to adapt statistical models for regression and classification to these data, and in many cases these attempts have challenged the computational resources. In this article we expose a class of techniques based on quadratic regularization of linear models, including regularized (ridge) regression, logistic and multinomial regression, linear and mixture discriminant analysis, the Cox model and neural networks. For all of these models, we show that dramatic computational savings are possible over naive implementations, using standard transformations in numerical linear algebra.  相似文献   

16.
17.
Addressing the forecasting issues is one of the core objectives of developing and restructuring of electric power industry in China. However, there are not enough efforts that have been made to develop an accurate electricity consumption forecasting procedure. In this paper, a panel semiparametric quantile regression neural network (PSQRNN) is developed by combining an artificial neural network and semiparametric quantile regression for panel data. By embedding penalized quantile regression with least absolute shrinkage and selection operator (LASSO), ridge regression and backpropagation, PSQRNN keeps the flexibility of nonparametric models and the interpretability of parametric models simultaneously. The prediction accuracy is evaluated based on China's electricity consumption data set, and the results indicate that PSQRNN performs better compared with three benchmark methods including BP neural network (BP), Support Vector Machine (SVM) and Quantile Regression Neural Network (QRNN).  相似文献   

18.
19.
20.
This paper compares regression and neural network modeling approaches to predict competitive biosorption equilibrium data. The regression approach is based on the fitting of modified Langmuir-type isotherm models to experimental data. Neural networks, on the other hand, are non-parametric statistical estimators capable of identifying patterns in data and correlations between input and output. Our results show that the neural network approach outperforms traditional regression-based modeling in correlating and predicting the simultaneous uptake of copper and cadmium by a microbial biosorbent. The neural network is capable of accurately predicting unseen data when provided with limited amounts of data for training. Because neural networks are purely data-driven models, they are more suitable for obtaining accurate predictions than for probing the physical nature of the biosorption process.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号