首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
分子生物学数据库及相关软件的开发利用   总被引:1,自引:0,他引:1  
李兵  罗静初  潘卫  唐汶  顾孝诚 《遗传》1999,21(4):52-53
生物大分子序列和结构测定技术的完善和应用,使核酸及蛋白质序列数据库及蛋白质结构数据库迅速增长.面对不断增长的分子生物信息,很多生物学工作者又在此基础上构建了具有特殊生物学意义和专门用途的二次数据库,使得数据库的内容和种类更加丰富和具体,为生物学各个领域的深入研究提供了坚实的信息基础.  相似文献   

2.
分子生物学数据库及相关软件的开发利用   总被引:4,自引:0,他引:4  
生物大分子序列和结构测定技术的完善和应用,使核酸及蛋白质序列数据库及蛋白质结构数据库迅速增长。面对不断增长的分子生物信息,很多生物学工作者又在此基础上构建了具有特殊生物学意义和专门用途的二次数据库,使得数据库的内容和种类更加丰富和具体,为生物学各个领域的深入研究提供了坚实的信息基础。由法国生物信息研究中心Infobiogen提供的生物数据库目录dbcat〔1〕可以使用户对目前世界各地提供的分子生物信息数据库有一个详尽的了解。dbcat本身也是一个具有一定数据格式的数据库,按DNA、RNA、蛋白质…  相似文献   

3.
介绍"实用生物信息技术"研究生课程的5个教学实例。以血红蛋白序列和结构为例,介绍常用生物信息技术和分析方法,包括蛋白质和核酸序列相似性比对、蛋白质和核酸序列数据库检索、Blast数据库相似性搜索、分子系统发生树构建,以及蛋白质结构比较分析等。  相似文献   

4.
以NCBI维护的一级数据库为数据源建立植物激素相关核酸和蛋白质二级数据库。将该二级数据库设计为基因、蛋白质和文献三部分,编写软件从上述数据源中采集数据,并以XML作为中间格式保存,通过解析提交到二级数据库中并集成部分生物信息学工具软件,初步实现了数据检索、统计分析、基于Web的本地化BLAST同源序列检索、序列的自动拼接以及蛋白质结构和功能位点的分析等功能。该二级数据库的构建为植物激素作用分子机理研究提供了高针对性的植物激素数据源和生物信息学辅助工具。  相似文献   

5.
以NCBI维护的一级数据库为数据源建立植物激素相关核酸和蛋白质二级数据库。将该二级数据库设计为基因、蛋白质和文献三部分, 编写软件从上述数据源中采集数据, 并以XML作为中间格式保存, 通过解析提交到二级数据库中并集成部分生物信息学工具软件, 初步实现了数据检索、统计分析、基于Web的本地化BLAST同源序列检索、序列的自动拼接以及蛋白质结构和功能位点的分析等功能。该二级数据库的构建为植物激素作用分子机理研究提供了高针对性的植物激素数据源和生物信息学辅助工具。  相似文献   

6.
微生物基因组注释系统MGAP   总被引:6,自引:0,他引:6  
利用生物信息学方法和工具开发了微生物基因组注释系统(Microbial genome annotation package, MGAP),并用于蓝细菌PCC7002的基因组注释。该系统由基因组注释系统和基于Web的用户接口程序两部分组成。基因组注释系统整合多个基因识别、功能预测和序列分析软件;以及蛋白质序列数据库、蛋白质资源信息系统和直系同源蛋白质家族数据库等。用户接口程序包括基因组环状图展示、基因和开放读码框在染色体上的分布图,以及注释信息检索工具。该系统基于PC微机和Linux操作系统,用MySQL作数据库管理系统、用Apache作Web服务器程序,用Perl脚本语言编写应用程序接口,上述软件均可免费获得。  相似文献   

7.
随着蛋白质数据库、基因组序列数据库和自动化技术的迅速发展,结构基因组学作为新的预测蛋白质结构的技术显得越发重要。本文对结构基因组学的产生发展进行概述,分别介绍结构基因组技术的功能、实验流程、蛋白质功能的预测方法,并对该学科发展进行了展望。  相似文献   

8.
蛋白质的序列、结构和功能多种多样。大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结构具有一定的影响。本文提出一种新的基于5-mer氨基酸扭转角统计偏好的蛋白质结构类型预测方法,该方法通过PDB数据库中5-mer中间氨基酸的扭转角统计偏好来进行结构类型的预测。新方法可以通过计算机仿真实现对新蛋白质序列结构类型的快速预测,并通过两组随机抽取的CATH数据验证了新方法的有效性。  相似文献   

9.
AANA是一个根据蛋白质的氨基酸组成快速鉴别蛋白质的计算机程序.其基本原理是通过统计蛋白质序列数据库中每个蛋白质序列的氨基酸组成,生成一个含蛋白质长度、组成和分子量的数据库,将靶蛋白的组成和分子量等数据与该数据库中的数据进行对比,从中检出与这接近的蛋白质,从而对该蛋白进行初步的鉴别。在有些情况下,甚至能相当准确地确定靶蛋白与数据库的某个(些)蛋白质相关  相似文献   

10.
UniProt蛋白质数据库简介   总被引:1,自引:0,他引:1  
罗静初 《生物信息学》2019,17(3):131-144
UniProt(https://www.uniprot.org/)是国际知名蛋白质数据库,主要包括UniProtKB知识库、UniParc归档库和UniRef参考序列集三部分。UniProtKB知识库是UniProt的核心,除蛋白质序列数据外,还包括大量注释信息。UniProtKB知识库分Swiss-Prot和TrEMBL两个子库。Swiss-Prot子库中50多万条序列均由人工审阅和注释,而TrEMBL子库中1.4亿多条序列是由核酸序列数据库EMBL中的蛋白质编码序列翻译所得,并由计算机根据一定规则进行注释。UniParc归档库将存放于不同数据库中的同一个蛋白质归并到一个记录中以避免冗余,并赋予序列唯一性特定标识符。UniRef参考序列集按相似性程度将UniProtKB和UniParc中的序列分为UniRef100、UniRef90和UniRef50三个数据集。UniProt网站为用户提供了高效实用的高级检索系统和大量帮助文档。UniProt数据库每4周发布新版的同时也发布统计报表,用户可通过统计报表了解该数据库的数据量及更新情况、数据类别和物种分布等基本信息,查看常规注释信息、序列特征注释信息和数据库交叉链接等统计数据。UniProt是目前国际上序列数据最完整、注释信息最丰富的非冗余蛋白质序列数据库,自本世纪初创建以来,为生命科学领域提供了宝贵资源。  相似文献   

11.
经过两年多的努力 ,军事医学科学院基础医学研究所计算生物学中心成功研发了辅助分子生物学实验设计的软件系统BioSun ,该系统主要功能有 :可视化的序列编辑器、完善的序列数据库管理系统、多种方式的序列比较、蛋白质基本性质分析 (MW、PI、… )、蛋白质功能位点及模式特异性分析、多种方式的抗原表位预测、基于随机肽库实验数据的抗原识别、蛋白质二级结构预测、基于一定字长的蛋白质与DNA组成分析、DNA模式分析、PCR实验辅助设计、转录因子结合位点预测、酶切位点分析及酶切图谱制作、基于多种算法的RNA二级结构预测、原核系统外…  相似文献   

12.
本文对来自PDB (Protein Data Bank)数据库的蛋白质-RNA复合物结构构建了非冗余非核糖体数据库(694个结构),并对此数据库统计了蛋白质和RNA序列及二级结构的界面偏好性.结果发现,蛋白质β折叠、3_(10)-helix和RNA未配对核苷酸,尤其是未配对中空间排列不规整的核苷酸,具有显著的界面偏好性.据此,对二级结构进行归类,建立了考虑序列和二级结构信息的60×12氨基酸-核苷酸成对偏好势,并将其作为打分函数用于蛋白质-RNA对接中近天然结构的筛选.结果表明,该60×12统计势的打分成功率为65.77%,优于考虑蛋白质或RNA二级结构信息的统计势,及我们小组之前在251个结构上构建的60×8~*统计势.该工作有助于加深对蛋白质-RNA特异性识别的理解,可推动复合物结构预测的进展.  相似文献   

13.
蛋白质三维结构叠加面临的主要问题是,参与叠加的目标蛋白质的氨基酸残基存在某些缺失,但是多结构叠加方法却大多数需要完整的氨基酸序列,而目前通用的方法是直接删去缺失的氨基酸序列,导致叠加结果不准确。由于同源蛋白质间结构的相似性,因此,一个蛋白质结构中缺失的某个区域,可能存在于另一个同源蛋白质结构中。基于此,本文提出一种新的、简单、有效的缺失数据下的蛋白质结构叠加方法(ITEMDM)。该方法采用缺失数据的迭代思想计算蛋白质的结构叠加,采用优化的最小二乘算法结合矩阵SVD分解方法,求旋转矩阵和平移向量。用该方法成功叠加了细胞色素C家族的蛋白质和标准Fischer’s 数据库的蛋白质(67对蛋白质),并且与其他方法进行了比较。数值实验表明,本算法有如下优点:①与THESEUS算法相比较,运行时间快,迭代次数少;②与PSSM算法相比较,结果准确,运算时间少。结果表明,该方法可以更好地叠加缺失数据的蛋白质三维结构。  相似文献   

14.
利用蛋白质主链的极性分数及主链二面角为参量,构建了一种基于蛋白质结构数据库的势函数。将该势函数应用于蛋白质反向折叠研究中,发现该函数可成功地将蛋白质分子的天然构象从构建的构象库中识别出来;将一目标序列与构象库的每一可能的构象匹配,并用该势函数计算相应的能量,结果表明对绝大多数蛋白质分子来说,天然的构象的能量值总是最低。此外,该函数还将一些序列相似性较低,而结构相似性较高的蛋白质分子识别出来。我们认  相似文献   

15.
序列比对是生物信息学研究的一个重要工具,它在序列拼接、蛋白质结构预测、蛋白质结构功能分析、系统进化分析、数据库检索以及引物设计等问题的研究中被广泛使用。本文详细介绍了在生物信息学中常用的一些序列比对算法,比较了这些算法所需的计算复杂度,优缺点,讨论了各自的使用范围,并指出今后序列比对研究的发展方向。  相似文献   

16.
根据铁蛋白基因的保守序列,搜索GenBank数据库中华鲟的EST数据库得到一条同源序列。通过RT-PCR的方法对该序列进行扩增,修改其测序错误,获得中华鲟铁蛋白亚基cDNA全长,经过注释提交GenBank数据库,获取序列登录号EU348782。该cDNA长度为896 bp,包含531bp的完整编码区,推测编码的蛋白质为176 aa,分子量为20339.9 Mr,理论等电点为5.66。它和大西洋鲑鱼铁蛋白序列同源性最高,达到82.9%。该基因在中华鲟肝脏、胰脏、肌肉、脑、心脏、鳃和胃粘膜等多种组织表达,在胰脏和心脏中表达量较高,在肌肉组织中表达较低。根据同源模建的方法得到该蛋白质三维结构,其包括5个α螺旋和10个转角结构,和人、蛙和细菌的铁蛋白均能很好的叠合,表现了很高的相似性,表明该蛋白结构和功能在基因进化中的高度保守性。  相似文献   

17.
梁启浩  李阳  唐旭清 《病毒学报》2017,33(3):313-319
基于经典HP模型,本文采用离散傅里叶变换获取蛋白质特征,利用分层聚类方法进行蛋白质序列的结构分析。其目的是将自动信号频谱分析技术与层次聚类方法相结合,并应用到蛋白质序列结构分析中。通过流感病毒HA和NA蛋白质序列的实验结果表明:应用该方法可得到非常好的分类结果。这些研究为基于大数据的蛋白质序列的自动信息提取和结构分析提供基础。  相似文献   

18.
本文介绍我们发展的蛋白质和DNA数据库及其计算机管理系统。系统从6个不同途径对数据库检索,也提供多种输出信息的方式,使用方便,并具有丰富的序列数据处理软件,可按不同需要处理所检索的序列数据。  相似文献   

19.
根据铁蛋白基因的保守序列,搜索GenBank数据库中华鲟的EST数据库得到一条同源序列.通过RT-PCR的方法对该序列进行扩增,修改其测序错误,获得中华鲟铁蛋白亚基cDNA全长,经过注释提交GenBank数据库,获取序列登录号EU348782.该cDNA长度为896bp,包含531bp的完整编码区,推测编码的蛋白质为176aa,分子量为20339.9Mr,理论等电点为5.66.它和大两洋鲑鱼铁蛋白序列同源性最高,达到82.9%.该基闪在中华鲟肝脏、胰脏、肌肉、脑、心脏、鳃和胃粘膜等多种组织表达,在胰脏和心脏中表达量较高,在肌肉组织中表达较低.根据同源模建的方法得到该蛋白质三维结构,其包括5个α螺旋和10个转角结构,和人、蛙和细菌的铁蛋白均能很好的叠合,表现了很高的相似性,表明该蛋白结构和功能在基因进化中的高度保守性.  相似文献   

20.
利用SWISS-PROT网上获取生物信息学资源   总被引:3,自引:0,他引:3  
生物信息学是是采用数学、统计学和计算机方法对生物学数据信息进行采集、存储、传播、分析、归类、解释的科学[1].Internet网络是信息传输、检索、获取、交流的重要手段.当前,在Internet网上可以查询到大量的生物信息学数据库,其中SWISS-PROT蛋白质序列数据库是网上生物信息学最核心的3个数据库之一.通过该数据库,可以较完整地获得生物大分子的序列信息.同时,研究者也可以将测定的序列信息通过该数据库予以认定、发表、交流.本文主要探讨SWISS-PROT蛋白质序列数据库的特点、检索方法及利用Internet获取蛋白质序列信息.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号