首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
药物从研发到临床应用需要耗费较长的时间,研发期间的投入成本可高达十几亿元。而随着医药研发与人工智能的结合以及生物信息学的飞速发展,药物活性相关数据急剧增加,传统的实验手段进行药物活性预测已经难以满足药物研发的需求。借助算法来辅助药物研发,解决药物研发中的各种问题能够大大推动药物研发进程。传统机器学习方法尤其是随机森林、支持向量机和人工神经网络在药物活性方面能够达到较高的预测精度。深度学习由于具有多层神经网络,模型可以接收高维的输入变量且不需要人工限定数据输入特征,可以拟合较为复杂的函数模型,应用于药物研发可以进一步提高各个环节的效率。在药物活性预测中应用较为广泛的深度学习模型主要是深度神经网络(deep neural networks,DNN)、循环神经网络(recurrent neural networks,RNN)和自编码器(auto encoder,AE),而生成对抗网络(generative adversarial networks,GAN)由于其生成数据的能力常常被用来和其他模型结合进行数据增强。近年来深度学习在药物分子活性预测方面的研究和应用综述表明,深度学习模型的准确度和效率均高于传统实验方法和传统机器学习方法。因此,深度学习模型有望成为药物研发领域未来十年最重要的辅助计算模型。  相似文献   

2.
深度学习是近年来机器学习领域最热门的研究方向,尤其是在图像及语音识别、自然语言处理、自动驾驶等方面取得了突破性进展.生物质谱是当今生命科学领域重要的研究工具,尤其在蛋白质组学、代谢组学、生物制药等领域发挥着关键作用.近年来,基于深度学习方法的发展,以生物质谱为核心的蛋白质组学大数据分析将迎来发展新契机.本文综述了深度学习方法在生物质谱数据解析及蛋白质组学研究方面的最新应用.  相似文献   

3.
实现对蜜蜂蜂群的实时动态监测,有助于养蜂业的数字化与智能化发展,对大幅提升养蜂管理水平具有重要意义。深度学习作为人工智能的一种新的研究方向,目前已被广泛应用于昆虫分类学、行为学、害虫生物防治等领域。随着深度学习检测算法的迅速发展,基于深度学习的蜜蜂蜂群监测技术不断涌现,为智能化养蜂提供了可能。为促进深度学习在蜜蜂领域的进一步应用,本文梳理了深度学习在蜜蜂的物种识别、行为跟踪监测、蜂群健康监测和蜂巢监测等方面的研究进展,分析了深度学习技术在蜜蜂蜂群监测研究及应用中存在的一些问题和未来发展方向,为深度学习在蜜蜂领域的应用提出了建议。  相似文献   

4.
夏彬彬  王军 《生物工程学报》2021,37(11):3863-3879
随着蛋白质序列及结构数据的大量累积,在获得了大量描述性信息之后如何有效利用海量数据,从已有数据中高效提取信息并且应用到下游任务当中就成为了研究者亟待解决的问题。蛋白质的设计可使新蛋白的研发不再受限于实验条件,这对药物靶点预测、新药研发和材料设计等领域具有重要意义。深度学习作为一种高效的数据特征提取方法,可以通过它对蛋白质数据进行建模,进而加入先验信息对蛋白质进行设计。故此基于深度学习的蛋白质设计就成为一个具有广阔前景的研究领域。文中主要阐述基于深度学习的蛋白质序列与结构数据的建模和设计方法。详述该方法的策略、原理、适用范围、应用实例。讨论了深度学习方法在本领域的应用前景及局限性,以期为相关研究提供参考。  相似文献   

5.
随着质谱技术的进步以及生物信息学与统计学算法的发展,以疾病研究为主要目的之一的人类蛋白质组计划正快速推进。蛋白质生物标志物在疾病早期诊断和临床治疗等方面有着非常重要的意义,其发现策略和方法的研究已成为一个重要的热点领域。特征选择与机器学习对于解决蛋白质组数据"高维度"及"稀疏性"问题有较好的效果,因而逐渐被广泛地应用于发现蛋白质生物标志物的研究中。文中主要阐述蛋白质生物标志物的发现策略以及其中特征选择与机器学习方法的原理、应用实例和适用范围,并讨论深度学习方法在本领域的应用前景及局限性,以期为相关研究提供参考。  相似文献   

6.
在介观尺度上,小鼠大脑图像的数据量可达到10 TB量级,人脑数据量则达到惊人的几十PB,从海量脑图像数据中识别和分析神经元的形态是一项复杂且具有挑战的任务。当前研究人员提出了基于传统机器学习和深度学习的神经元识别算法,其中传统机器学习方法存在迁移、泛化能力较差的问题,基于深度学习的算法虽然可以通过海量精确标注的训练数据提高模型的泛化性,但缺乏精确且丰富的图像标记数据集,因此同样存在过拟合和泛化能力弱等问题。本文提出了一种基于深度学习的弱监督神经元识别方案,仅需要少量有标注的数据,即可通过迭代策略获取海量神经元图像的精确识别结果,具备较强的泛化能力,并最大限度减少人工参与量。该方法在fMOST、BigNeuron等数据集上进行了实验,自动识别精度F1值分别为0.9247和0.8318,优于其他对比的神经元识别算法。  相似文献   

7.
生物制造以低碳循环、绿色清洁的优势在社会可持续经济发展模式中占有举足轻重的作用,其发展是未来大趋势。技术进步使得生物制造在微生物细胞代谢调控规律、生物加工过程的在线数据等方面形成了海量数据,但传统数据分析相关理论的不完善极大地限制了这些海量数据的挖掘,利用人工智能在数据处理方面的优势,通过机器学习对数据中蕴含的知识进行深入挖掘,是实现生物制造智能化路径的一个重要方向。本文中,笔者从人工智能的基本概念入手,针对生物制造的两个主体,即微生物细胞的智能化设计和生物过程的智能化检测与控制,提出了一些观点和建议,希望以此拓宽相关研究人员的研究思路,共同开启智能生物制造的时代。  相似文献   

8.
基于机器学习的肠道菌群数据建模与分析研究综述   总被引:1,自引:0,他引:1  
人体肠道菌群与人类的健康和疾病存在密切关系,对肠道菌群的宏基因组数据进行建模和分析,在疾病预测及诊断相关领域科学研究和社会应用方面均具有重要意义。本文从大数据分析和机器学习的角度,对人体肠道菌群数据的建模、分析和预测算法的原理、过程以及典型研究应用实例进行综述,以期推动肠道菌群分析相关研究发展以及探索结合机器学习算法进行肠道菌群分析的有效方式,同时也为开发基于肠道菌群数据的新型诊疗手段提供借鉴,推动我国精准医疗事业发展。  相似文献   

9.
讨论了工业生物过程大数据分析的重要意义,提出了基于大数据多尺度相关分析基础上实现生物反应器由自动化到智能化的发展。同时,分析了生物过程人工智能处理的应用问题,以克服目前基本上靠人工与专家经验来判断的局限性,以及面临的基因、代谢、过程到生产组织中的互不联系的实验或生产数据孤岛,为知识的发现、获取提供方法和途径,实现智能化决策。  相似文献   

10.
环境微生物研究中机器学习算法及应用   总被引:1,自引:0,他引:1  
陈鹤  陶晔  毛振镀  邢鹏 《微生物学报》2022,62(12):4646-4662
微生物在环境中无处不在,它们不仅是生物地球化学循环和环境演化的关键参与者,也在环境监测、生态治理和保护中发挥着重要作用。随着高通量技术的发展,大量微生物数据产生,运用机器学习对环境微生物大数据进行建模和分析,在微生物标志物识别、污染物预测和环境质量预测等领域的科学研究和社会应用方面均具有重要意义。机器学习可分为监督学习和无监督学习2大类。在微生物组学研究当中,无监督学习通过聚类、降维等方法高效地学习输入数据的特征,进而对微生物数据进行整合和归类。监督学习运用有特征和标记的微生物数据集训练模型,在面对只有特征没有标记的数据时可以判断出标记,从而实现对新数据的分类、识别和预测。然而,复杂的机器学习算法通常以牺牲可解释性为代价来重点关注模型预测的准确性。机器学习模型通常可以看作预测特定结果的“黑匣子”,即对模型如何得出预测所知甚少。为了将机器学习更多地运用于微生物组学研究、提高我们提取有价值的微生物信息的能力,深入了解机器学习算法、提高模型的可解释性尤为重要。本文主要介绍在环境微生物领域常用的机器学习算法和基于微生物组数据的机器学习模型的构建步骤,包括特征选择、算法选择、模型构建和评估等,并对各种机器学习模型在环境微生物领域的应用进行综述,深入探究微生物组与周围环境之间的关联,探讨提高模型可解释性的方法,并为未来环境监测、环境健康预测提供科学参考。  相似文献   

11.
Many ecosystems, particularly wetlands, are significantly degraded or lost as a result of climate change and anthropogenic activities. Simultaneously, developments in machine learning, particularly deep learning methods, have greatly improved wetland mapping, which is a critical step in ecosystem monitoring. Yet, present deep and very deep models necessitate a greater number of training data, which are costly, logistically challenging, and time-consuming to acquire. Thus, we explore and address the potential and possible limitations caused by the availability of limited ground-truth data for large-scale wetland mapping. To overcome this persistent problem for remote sensing data classification using deep learning models, we propose 3D UNet Generative Adversarial Network Swin Transformer (3DUNetGSFormer) to adaptively synthesize wetland training data based on each class's data availability. Both real and synthesized training data are then imported to a novel deep learning architecture consisting of cutting-edge Convolutional Neural Networks and vision transformers for wetland mapping. Results demonstrated that the developed wetland classifier obtained a high level of kappa coefficient, average accuracy, and overall accuracy of 96.99%, 97.13%, and 97.39%, respectively, for the data in three pilot sites in and around Grand Falls-Windsor, Avalon, and Gros Morne National Park located in Canada. The results show that the proposed methodology opens a new window for future high-quality wetland data generation and classification. The developed codes are available at https://github.com/aj1365/3DUNetGSFormer.  相似文献   

12.
Micro-CT provides a high-resolution 3D imaging of micro-architecture in a non-invasive way, which becomes a significant tool in biomedical research and preclinical applications. Due to the limited power of micro-focus X-ray tube, photon starving occurs and noise is inevitable for the projection images, resulting in the degradation of spatial resolution, contrast and image details. In this paper, we propose a C-GAN (Conditional Generative Adversarial Nets) denoising algorithm in projection domain for Micro-CT imaging. The noise statistic property is utilized directly and a novel variance loss is developed to suppress the blurry effects during denoising procedure. Conditional Generative Adversarial Networks (C-GAN) is employed as a framework to implement the denoising task. To guarantee the pixelwised accuracy, fully convolutional network is served as the generator structure. During the alternative training of the generator and the discriminator, the network is able to learn noise distribution automatically. Moreover, residual learning and skip connection architecture are applied for faster network training and further feature fusion. To evaluate the denoising performance, mouse lung, milkvetch root and bamboo stick are imaged by micro-CT in the experiments. Compared with BM3D, CNN-MSE and CNN-VGG, the proposed method can suppress noise effectively and recover image details without introducing any artifacts or blurry effect. The result proves that our method is feasible, efficient and practical.  相似文献   

13.
14.
In the face of the global concern about climate change and endangered ecosystems, monitoring individual animals is of paramount importance. Computer vision methods for animal recognition and re-identification from video or image collections are a modern alternative to more traditional but intrusive methods such as tagging or branding. While there are many studies reporting results on various animal re-identification databases, there is a notable lack of comparative studies between different classification methods. In this paper we offer a comparison of 25 classification methods including linear, non-linear and ensemble models, as well as deep learning networks. Since the animal databases are vastly different in characteristics and difficulty, we propose an experimental protocol that can be applied to a chosen data collections. We use a publicly available database of five video clips, each containing multiple identities (9 to 27), where the animals are typically present as a group in each video frame. Our experiment involves five data representations: colour, shape, texture, and two feature spaces extracted by deep learning. In our experiments, simpler models (linear classifiers) and just colour feature space gave the best classification accuracy, demonstrating the importance of running a comparative study before resorting to complex, time-consuming, and potentially less robust methods.  相似文献   

15.
为探讨小流域尺度丘陵区的高分辨率数字土壤制图方法,通过对景观相分类的探索,配合应用不同尺度的Geomorphons(GM)微地形特征数据构成分类变量组参与高分辨率土壤pH、黏粒含量和阳离子交换量的预测制图,并与传统数字高程模型衍生变量和遥感变量进行组合与比较分析。此外,采用支持向量机、偏最小二乘回归和随机森林3种机器学习模型择优与残差回归克里金复合参与预测模型的构建与评价。结果表明: 景观及多尺度微地形分类变量组的应用分别提高小流域尺度丘陵地貌区pH、黏粒含量和阳离子交换量预测精度的18.8%、8.2%和8.7%。包含植被信息的景观相分类图相比土地利用数据有更高的模型贡献度;5 m分辨率的GM微地形分类图相比低分辨率的分类图更适宜高精度的预测制图。黏粒含量使用随机森林复合模型有最高的预测精度,而pH和阳离子交换量则不适宜在随机森林模型的基础上加入残差回归克里金模型。景观-多尺度微地形分类变量、数字高程模型衍生变量和遥感变量三者结合的模型预测表现最佳,表明多元变量在起伏地形区域相比单一数据源能够包含更多的土壤有效信息。由GM数据和地表景观数据组成的景观分类变量组作为主要变量能够解释小流域丘陵区部分土壤属性约40%的空间变异。在同类型土壤预测制图研究中,多分辨率GM及景观分类数据有潜力作为环境变量参与预测模型的构建。  相似文献   

16.
Existing computational pipelines for quantitative analysis of high‐content microscopy data rely on traditional machine learning approaches that fail to accurately classify more than a single dataset without substantial tuning and training, requiring extensive analysis. Here, we demonstrate that the application of deep learning to biological image data can overcome the pitfalls associated with conventional machine learning classifiers. Using a deep convolutional neural network (DeepLoc) to analyze yeast cell images, we show improved performance over traditional approaches in the automated classification of protein subcellular localization. We also demonstrate the ability of DeepLoc to classify highly divergent image sets, including images of pheromone‐arrested cells with abnormal cellular morphology, as well as images generated in different genetic backgrounds and in different laboratories. We offer an open‐source implementation that enables updating DeepLoc on new microscopy datasets. This study highlights deep learning as an important tool for the expedited analysis of high‐content microscopy data.  相似文献   

17.
地形是土地景观格局变化的重要因素.为揭示不同地形梯度下景观格局的时空特征和变化规律,以1995、2005和2015年3期福州市遥感影像和数字高程模型(DEM)数据为基础,运用地形位指数、土地利用分布指数、地学信息图谱分析和景观指数等方法,探讨景观格局的地形梯度效应以及形成原因.结果表明: 研究期间,研究区林地主要位于中低、中高和高等级地形位,农地、水体、建设用地和未利用土地主要集中位于低等级地形位.1995—2015年,福州市林地、农地和未利用土地面积减少,建设用地和水体面积增加.景观类型变化以稳定型为主,主要分布于中低、中高及高等级地形梯度区域;景观格局在地形梯度上变化差异明显,低地形位区域景观类型主要转向建设用地,而在中低及中高地形位区域,主要发生农地与林地的交替转变.研究区景观格局破碎化、景观异质性和景观多样性等属性逐年上升,随着地形梯度升高而降低.  相似文献   

18.
地形因子对盐城滨海湿地景观分布与演变的影响   总被引:3,自引:0,他引:3  
侯明行  刘红玉  张华兵  王聪  谭清梅 《生态学报》2013,33(12):3765-3773
地形作为景观结构和空间格局的重要影响因子,不仅为景观格局的形成提供基础,其空间特征也影响着景观的演变过程.基于2002、2011年地形高程信息和遥感影像,运用GIS技术,并结合分布指数,分析了盐城滨海湿地景观分布与演变对地形因子的响应特征.结果表明:①盐城淤泥质滨海湿地总体地形变化平缓,海拔0-2.5m的区域占整个研究区面积的97%以上.其中,米草带主要分布于0.9-1.5m,碱蓬带主要分布于1.5-2.lm,而芦苇带则主要分布于2.1-2.7m.②2002-2011年9年间湿地景观时间变化明显,其中,芦苇面积增加了3倍,碱蓬面积由26.80%骤降至11.51%,同期,米草面积则增加了50%之多.③湿地景观空间分布特征与地形关系比较明显.其中,米草空间分布向0.6-1.2m区间演变,显示出强烈的向低海拔区间扩张的趋势;碱蓬分布范围随地形的升高总体上呈下降趋势;芦苇在地形较高区间上的分布指数增长迅速,其优势分布区间向2.1-3.0m扩展.  相似文献   

19.
Quantitative mass-spectrometry-based spatial proteomics involves elaborate, expensive, and time-consuming experimental procedures, and considerable effort is invested in the generation of such data. Multiple research groups have described a variety of approaches for establishing high-quality proteome-wide datasets. However, data analysis is as critical as data production for reliable and insightful biological interpretation, and no consistent and robust solutions have been offered to the community so far. Here, we introduce the requirements for rigorous spatial proteomics data analysis, as well as the statistical machine learning methodologies needed to address them, including supervised and semi-supervised machine learning, clustering, and novelty detection. We present freely available software solutions that implement innovative state-of-the-art analysis pipelines and illustrate the use of these tools through several case studies involving multiple organisms, experimental designs, mass spectrometry platforms, and quantitation techniques. We also propose sound analysis strategies for identifying dynamic changes in subcellular localization by comparing and contrasting data describing different biological conditions. We conclude by discussing future needs and developments in spatial proteomics data analysis.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号