首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随着DNA芯片技术的广泛应用,基因表达数据分析已成为生命科学的研究热点之一。概述基因表达聚类技术类型、算法分类与特点、结果可视化与注释;阐述一些流行的和新型的算法;介绍17个最新相关软件包和在线web服务工具;并说明软件工具的研究趋向。  相似文献   

2.
大数据技术的产生给海量生态环境数据的处理以及全球生态环境问题的监测和分析提供了新的思路。本文通过分析大数据的基本特征,对生态环境大数据的概念以及特征进行了简要阐述,并参考一般大数据的系统结构,从4个方面设计了生态环境大数据综合平台的总体构架:数据平台、基础设施平台、技术平台及应用服务平台。从数据获取、数据存储与管理、数据计算模式与系统和数据分析共4个模块详细阐述了生态环境大数据技术平台构建的关键技术。最后,针对生态环境大数据未来的发展,提出了的一些思考和建议。  相似文献   

3.
KDD技术及其在基因表达微阵列数据中的应用   总被引:2,自引:0,他引:2  
本文从多方面分析了基因表达微阵列数据所表证的基因功能及健康和疾病的分子基础,研究应用数据库中KDD的计算机技术,挖掘基因组输出信息的知识模式的算法。  相似文献   

4.
在介观尺度上,小鼠大脑图像的数据量可达到10 TB量级,人脑数据量则达到惊人的几十PB,从海量脑图像数据中识别和分析神经元的形态是一项复杂且具有挑战的任务。当前研究人员提出了基于传统机器学习和深度学习的神经元识别算法,其中传统机器学习方法存在迁移、泛化能力较差的问题,基于深度学习的算法虽然可以通过海量精确标注的训练数据提高模型的泛化性,但缺乏精确且丰富的图像标记数据集,因此同样存在过拟合和泛化能力弱等问题。本文提出了一种基于深度学习的弱监督神经元识别方案,仅需要少量有标注的数据,即可通过迭代策略获取海量神经元图像的精确识别结果,具备较强的泛化能力,并最大限度减少人工参与量。该方法在fMOST、BigNeuron等数据集上进行了实验,自动识别精度F1值分别为0.9247和0.8318,优于其他对比的神经元识别算法。  相似文献   

5.
基于高通量测序技术的微生物检测数据分析方法   总被引:1,自引:0,他引:1  
高通量测序技术的发展正在逐渐改变诸多生物学领域的研究方法.为应对突发疫情以及新发未知微生物威胁的需求,微生物鉴定技术逐渐从传统的物理化学方法及核酸杂交等分子水平方法进一步走向利用无需培养的测序数据进行快速分析检测.随之而来的是对高通量数据分析在精度及速度的要求.基于高通量测序数据的微生物检测数据分析方法在近些年得到了快速的发展.本文分析了目前基于高通量测序数据的微生物检测数据分析方法,对其数据分析的处理流程和计算方法进行了研究,比较了各个微生物检测数据分析方法的特点及适用场景.最后结合本实验室工作总结微生物检测数据分析方法在实际应用中可能遇到的问题,希望对该应用领域的研究有一定的参考意义.  相似文献   

6.
热带森林水文研究中数据收集技术的探讨   总被引:2,自引:0,他引:2  
以尖峰岭热带雨林集水区为基础,研究了降雨径流测定过程中的自动化收集技术,对于常规观测仪在边远原始林区、人为难于实现连续观测,而传动式周计月计仪器在高湿度下(相对湿度大于90%)收集数据误差较大等诸多问题,实验性地研制使用了电脑化的DS1001D降雨量记录仪和DT-5VW-200水位自动记录仪,经不断的测试、改进,在研究中已初步获得成效.  相似文献   

7.
分析了医疗大数据的价值与教学之间的关系,探讨面向数据价值的眼科临床教学模式。通过建立基于大数据技术的临床、教学、科研、管理过程中产生的数据进行优化组合的眼科临床教学体系,发挥大数据价值,重建眼科临床教学体系,将信息时代的医疗、科研电子数据作为眼科教学的主体,拓宽眼科教学途径,简化教学流程,更大限度提供给眼科医学生自主学习所需的各种资源。  相似文献   

8.
利用生物信息学方法,从前列腺癌RNA-seq数据中找出前列腺癌与正常前列腺组织细胞的差异基因,对差异基因进行pathway富集分析,最后做基因互作网络分析,发现IL8在前列腺肿瘤细胞中的对抑制肿瘤细胞生长有着重要的调控作用。  相似文献   

9.
在Oracle和InforSense公司的协助下,Dana-Farber癌症研究所发现了挖掘海量的病人数据集合、以更好地理解人类癌症的方法。  相似文献   

10.
挖掘数据     
不管数据来源何处,像贝叶斯建模之类的统计数据挖掘方法都能够有效的从中提取出药物安全性信息。  相似文献   

11.
ADME数据     
随着平行合成技术的兴起以及生物分析方法的改进,各种各样的体外吸收、分布、代谢和排泄(ADME)芯片筛选试验和方法得到越来越广泛的应用。这促进了对有效候选药物的选择和对化合物ADME及物化性质的优化。在辉瑞公司的药代动力学、动力学和新陈代谢(PDM)部门内,研究者们从数据中分析出药物ADME性质的知识,但他们面临着一个困境:  相似文献   

12.
我国新时代十年是生态环境保护认识最深、力度最大、举措最实、推进最快、成效最显著的十年。生态环境治理取得成效的同时,管理措施也逐步成熟和规范化,相关生态管理知识成果的文本、视频、照片等多模态数据也日益丰厚。采用先进的知识图谱理念创新我国生态环境保护工作,对未来助力打赢污染防治攻坚战,构建现代环境治理体系具有重要意义。聚焦我国美丽中国和生态文明建设工程领域,将典型污染防治攻坚战、生态恢复工程多模态素材作为数据源,通过数据整合、知识抽取、知识融合后形成标准知识表述,构建生态管理知识图谱体系。具体包括(1)定量分析深圳市"散乱污"企业整治成功案例数据,抽取管理主体、管理对象等实体,挖掘其空间特征、污染特征、治理效果关系;(2)关联分析企业驻点、污染物热点和城市空间相互关系;(3)通过我国典型生态环境损害赔偿案件中的"实施行为-破坏对象-损害功能"特定关系分析,抽取"生态治理行为--受影响环境要素--生态服务提升程度"生态环境管理知识图谱;(4)最终形成了整合"散乱污"治理、生态环境治理行为的综合性生态管理知识图谱,构建了包含12类本体、82个实体,4类、201条关系的图数据库。研究表明,通过污染防治攻坚战成功案例、生态恢复工程成效的多模态数据构建我国生态管理知识图谱,能够形成贴近现实需求的知识体系,有助于依法治污、科学治污和精准治污全过程;也有助于生态环境损害鉴定评估工作中的"多因一果"和"一因多果"分析。建议未来加大生态管理知识图谱的应用,精准识别管理对象、实现科学分析与智能决策,促进公众参与生态管理和加快生态产品价值实现。  相似文献   

13.
随着高通量测序技术的迅速发展和食品微生物研究的逐步深入,产生了大量的数据和知识,且以不同的数据格式分布在各种数据库中。为了更好地支持食品微生物的相关研究,从各种分布式、异构的数据和知识中,进行数据提取与转换,并形成一个整合的数据平台显得尤为重要。FoodMicrobes数据库利用语义网技术,建立了一个食品微生物的整合型数据平台。该平台从各种开放的公共数据库,提取了与食品微生物相关的基因、基因组、基因功能、蛋白质序列与结构、代谢途径、文献、专利等信息,利用RDF的方法,对数据进行转换,并建立了数据之间的关联,实现了数据整合,是目前在食品微生物领域以语义网方式建立的第一个数据库。在该平台中,实现了将食品微生物的物种、菌株层面的宏观信息与基因组、蛋白质、代谢与功能等微观层面信息的贯通,并通过友好的数据检索界面,为用户进行食品微生物研究提供了重要的工具。  相似文献   

14.
根据一定试验设计进行田间试验,经过一定观察记载,就可取得一些数据。由于这些数据是对于有限样本的观察得到的,它们通常具有变异性、局部性和偶然性。也就是说,从表面上看这些原始数据是杂乱无章的,必须对它们加以适当整理分析,才能发现其内在的规律,以便能根据试验结果得出科学性结论。数据分组如果数据较为复杂,通常采用分组的方法研究事物的分布及总体结构,同时还能简化运算程序。数据类型不同,分组的方法也不同。易于  相似文献   

15.
【目的】近年来,通过电子商务平台获取境外珍贵的多肉物种资源已成为一种重要渠道,大量濒危物种通过第三方物流方式非法流入我国。甄别濒危物种并梳理出多肉物种资源重点查验名单,能够为物种资源查验尤其是植物多肉类濒危物种查验提供参考。【方法】以跨境多肉物种资源交易的热门平台"多肉之家"为研究对象,基于网络爬虫技术平台,获取电商多肉植物926条种类数据,并对数据进行筛选和归类分析。【结果】"多肉之家"平台上交易的多肉植物共涉及23科878种,其中包含18种CITES附录Ⅰ以及120种CITES附录Ⅱ濒危物种,约占16%。进一步对濒危植物进行归类分析发现,濒危植物中仙人掌科和大戟科多肉植物种类最多,分别为66和36种,两者占总计濒危植物种类的74%。【结论】网络爬虫技术在获取电商类平台的交易植物的种类数据上具有较好的实用性。  相似文献   

16.
刘山林 《生物多样性》2019,27(5):526-367
近年来DNA条形码技术迅速发展, 产生的条形码的数量及其应用范围都呈指数性增长, 现已广泛用于物种鉴定、食性分析、生物多样性评估等方面。本文重点总结并讨论了构建条形码参考数据库和序列聚类相关的信息分析的技术和方法, 包括: 基于高通量测序(high throughput sequencing, HTS)平台以高效并较低的成本获取条形码序列的方法; 同时还介绍了从原始测序序列到分类操作单元(operational taxonomic units, OTUs)过程中的一些计算逻辑以及被广泛采用的软件和技术。这是一个较新并快速发展的领域, 我们希望本文能为读者提供一个梗概, 了解DNA条形码技术在生物多样性研究应用中的方法和手段。  相似文献   

17.
揭示生物体内在的调控机制是生物信息学的一项重要研究内容.各种高通量生物数据的涌现,为从基因组的尺度上重构基因调控网络提供了可能.由于单数据源仅能提供关于调控关系的片面信息且存在噪声,因此整合多种生物学数据的方法有望得到可靠性较高的调控网络.提出了一种综合ChIP-chip数据、knock out (敲除)数据和各种条件下的表达谱数据来推断调控关系的新方法.ChIP-chip数据和knock out 数据能分别提供转录因子和目标基因对关系的直接物理结合和功能关系的证据,这两类数据的整合有望获得较高的识别准确率.但这两类数据的重合性通常较低,基于共调控的基因通常具有较高的表达相似性这一假设,在一定程度上降低了这两类数据重合性较低所带来的影响.算法所识别的大部分调控关系都被YEASTRACT,高质量ChIP-chip数据和文献所验证,从而证明了该方法在调控关系的预测上具有较高的准确性.与其他方法的比较,也表明了该方法具有较高的预测性能.  相似文献   

18.
提出了一种蛋白质相互作用的相似性度量,将其与基因表达数据的相似性度量相结合,定义了一种融合的距离度量,并且将这种融合的距离度量用于改进现有的K—means聚类方法。经过实际数据的检验,改进后的K—means方法比常用的其它几种聚类方法具有更好的效果,说明结合蛋白质相互作用数据可以使得基因表达聚类的结果更有生物意义。  相似文献   

19.
1 细胞 成年人 ,整个身体总细胞数约为 1.8× 10 7亿个 ;水分 ,占体重 60 %。2 皮肤 表面积 1.4~ 1.6m2 ,占体重 16% ;汗孔 2 0 0万个 ;每平方厘米有痛点 10 0~ 2 0 0个 ,触点 2 5个 ,冷点12~ 13个 ,热点 1~ 2个 ;p H=5 .5 ,能再生。3 毛发 成人头发 8万~ 10万根 ,每天脱落 30~ 12 0根 ,每天生长 0 .4 mm,寿命 2~ 4年 ,每天分泌皮脂 15~4 0 g;指甲每天生长 0 .1mm,3~ 5个月更换一次。4 牙齿 由牙冠、牙颈、牙根三部分组成 ;有切牙 (门牙 )、尖牙 (犬齿 )、磨牙 (臼齿 ) 3种类型 ;人一生长 2次牙 ,乳牙 2 0颗 ,恒牙 2 8~ …  相似文献   

20.
作为解决生命领域复杂科学问题的关键要素以及驱动科学发现与决策的基础资源,微生物科学数据资源已成为国家的重要战略资源。国家微生物科学数据中心(https://nmdc.cn/)的建设使得海量微生物数据资源可以得到有效的整理整合和开放共享,这对于微生物资源的研究、利用和可持续发展都起着至关重要的作用。本文从核心资源、服务内容、功能特色等多方面总结了国家微生物科学数据中心平台的建设进展,并提出了面向微生物领域科研及产业用户的应用实践。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号