利用C++ Builder,Microsoft SQL Server 2000数据库和ADO控件构建了肿瘤遗传信息的查询系统。先在数据库中建立肿瘤的生物信息表,通过C++ Builder编写代码,添加ADO控件及其属性设置实现数据库的访问和信息查询。  相似文献   

随着新一代测序技术的发展,高通量测序技术的应用越来越广泛,其产生的海量数据的存储、查询需要专门的数据库辅助,NCBI的SRA(Sequence Read Archive)数据库是高通量测序存储的代表,本文对SRA数据库的组织架构,数据形态作了综述分析,并对其存贮的数据进行了总结。  相似文献   

对于亚洲的一些国家,水稻是最重要的粮食作物,然而其产量却遭受数百种害虫的危害.尽管目前已存在许多控制虫害的策略,但是损失依然非常严重.RNA干涉被认为在农业害虫防控领域具有良好的应用前景,但是遗传信息的匮乏严重限制了该技术的应用.水稻害虫转录组数据库是一个综合性的数据库,其数据来源于8种最重要的水稻害虫的新一代测序结果.本数据库致力于为昆虫功能基因组学研究、昆虫治理及其他领域提供一个有条理的遗传信息平台,以满足上述研究领域的需要.另外,本数据库通过进化树的构建揭示出这些昆虫的进化关系.  相似文献   

生命现象是一个十分复杂的过程。它需要许多生物大分子(如核酸、蛋白质、脂类和多糖)、小分子有机化合物以及无机盐类等的协同作用。Crick用他修改过的中心法则高度概括了生命现象的根本规律。中心法则不仅指出了遗传信息的流向并且认为DNA、RNA和蛋白质是生命规律的核心。DNA储存遗传信息并决定物种的遗传和变异。RNA不仅可以储存遗传信息并在遗传信息的表达过程中表现功能。蛋白质表现遗传性状。由此可见DNA、RNA和蛋白质都是非常重要。要深入了解生命规律必须全面研究三者的结构与功能以及它们之间的相互关系。任何偏废都是有害的。近年来发现RNA还具有酶的催化功能。这就从根本上改变了所有的酶都是蛋白质的传  相似文献   

随着生命科学的迅猛发展,生物信息量的急剧增加,大量基因芯片的实验数据是公开发布在Internet网上的,尤其是学术机构在发表论文时所使用的实验数据都可以免费提供给研究人员下载使用。如何能有效地、正确地利用这些数据资源,特别是在利用数据验证算法、训练模型等问题的研究中,查询和使用基因芯片数据库网上资源便显得非常重要。对与乳腺癌基因芯片有关的数据库的数据查询及使用进行研究和探讨。  相似文献   

系统发育信息学是近年来形成的新的学科方向,是系统学研究领域的一个新兴生长点。系统发育信息学是存贮、管理、注释、开发和加工系统树及其相关生物学信息的交叉学科。它的方法是基于计算机和网络技术,包括大型系统树及其相关生物学数据库的建立,系统树数据库网络的构架,系统树的可视化显示,小系统树的联合与超树的建立、用户查询、搜索和下载等,最终目的是要建立一个囊括地球上所有生物的系统树及其相关信息的数据库,将各种生物在树上精确定位,并进一步通过对系统发育信息的查询、搜索、联合与分析,从中获取生命进化的知识和进行生物学的预测。目前可用的系统发育网络资源主要有CIPRes和系统发育软件(PhylogenyPrograms)网站,已建立的系统发育信息学数据库包括TreeBASE,TreeofLife,Species2000,NCBITaxonomy数据库等。  相似文献   

我国参与全球人类基因组计划王钦南(国家自然科学基金委员会生命科学部100083)人类基因组计划的目标是破译人类遗传信息,建立完整的遗传信息数据库,它是科学家长期以来梦寐以求的"圣餐",将成为21世纪生命科学的资源宝库,并将促进生物学不同领域如神经生物学、细胞生物学、发育生物学等的发展;医学也将从中获得极大好处,5千多种遗传性疾病和危害人类的恶性肿瘤、心血管病和其它遗传易感性多因子疾病可能由此得到预测、预防、早诊和治疗。由基因组计划发展起来的新技术、新策略也适于农业、工业和环境科学。  相似文献   

随着农作物种质资源数量的不断增加,种质资源交流的日益频繁以及种质资源利用的逐步深入,农作物种质资源数据库的建设对农作物的应用研究和基础性研究至关重要。上海市农业生物基因中心借助于本中心保存的近21万份种质资源的信息,开发了一套上海农作物种质资源数据库,本文主要阐述了该数据库设计和构建的目的、原则和数据库的架构、运行环境以及主要功能模块。上海农作物种质资源数据库采用了B/S结构,平台系统利用多层逻辑架构实现了对农作物种质资源数据信息的收集、存储、查询、统计分析等功能。外部用户通过浏览器即可访问平台系统,浏览查询种质资源信息。内部管理员可使用平台的受限功能,需要认证成功后才可使用后台管理功能,实现对整个平台数据的管理。注册用户还可通过基因资源数据库提交引种申请,管理员结合管理信息系统实现对外供种全流程的网络化,借此可提高工作效率,增加工作流程的透明度。  相似文献   

宏蛋白质组学是一门新型科学,它运用质谱技术规模化地采集自然界微生物种群的蛋白质信息,并结合多种组学数据,开展微生物种群的遗传特征及其生物功能的研究.宏蛋白质组学的信息分析与传统蛋白质组学方法有较大的不同,亟需拓展新的分析思路.由于宏蛋白质组的研究对象是复杂度极高的微生物样品,因此,需要构建尽可能囊括样本中所含微生物的基因组信息的物种数据库.面对庞大的数据库,必须考虑到分析过程中所消耗的计算资源和鉴定结果的质控标准,因此,需要高度优化库容量、搜库、假阳性控制等参数.鉴于宏蛋白质组数据中广泛存在复杂的同源蛋白质序列,因此,需要充分利用NCBI数据库中的分类信息进行匹配,并运用LCA算法过滤处理才能将蛋白质有效地归组到物种.本文立足于宏蛋白质组学信息分析,从宏蛋白质组的数据库建立、蛋白质归并、生物学意义发掘等几个方面着手,对该领域的发展现状、面临挑战以及未来研究方向进行了评述.  相似文献   

蒙古马是我国重要的地方马品种资源, 它具有耐力强、耐粗饲、抗病性强等优点, 这些优势遗传资源成为对其进行深入研究的动力。遗传多样性能够反映出一个物种或某一品种的所有遗传信息, 即通过遗传标记来反映品种遗传多样性丰富程度, 并确定品种遗传资源独特性程度。文中分别从细胞水平、生化水平以及分子水平对蒙古马的遗传多样性研究进展进行了详细的综述, 重点介绍了蒙古马研究中热点基因的分型及其多态性研究成果。  相似文献   

In addition to maintaining the GenBank(R) nucleic acid sequence database, the National Center for Biotechnology Information (NCBI) provides data analysis and retrieval and resources that operate on the data in GenBank and a variety of other biological data made available through NCBI's Web site. NCBI data retrieval resources include Entrez, PubMed, LocusLink and the Taxonomy Browser. Data analysis resources include BLAST, Electronic PCR, OrfFinder, RefSeq, UniGene, Database of Single Nucleotide Polymorphisms (dbSNP), Human Genome Sequencing pages, GeneMap'99, Davis Human-Mouse Homology Map, Cancer Chromosome Aberration Project (CCAP) pages, Entrez Genomes, Clusters of Orthologous Groups (COGs) database, Retroviral Genotyping Tools, Cancer Genome Anatomy Project (CGAP) pages, SAGEmap, Online Mendelian Inheritance in Man (OMIM) and the Molecular Modeling Database (MMDB). Augmenting many of the Web applications are custom implementations of the BLAST program optimized to search specialized data sets. All of the resources can be accessed through the NCBI home page at: http://www.ncbi.nlm.nih. gov  相似文献   

The aim of this study is to design a biological information retrieval and analysis system (BIRAS) based on the Internet. Using the specific network protocol, BIRAS system could send and receive information from the Entrez search and retrieval system maintained by National Center for Biotechnology Information (NCBI) in USA. The literatures, nucleotide sequence, protein sequences, and other resources according to the user-defined term could then be retrieved and sent to the user by pop up message or by E-mail informing automatically using BIRAS system. All the information retrieving and analyzing processes are done in real-time. As a robust system for intelligently and dynamically retrieving and analyzing on the user-defined information, it is believed that BIRAS would be extensively used to retrieve specific information from large amount of biological databases in now days. The program is available on request from the corresponding author.  相似文献   

以NCBI维护的一级数据库为数据源建立植物激素相关核酸和蛋白质二级数据库。将该二级数据库设计为基因、蛋白质和文献三部分, 编写软件从上述数据源中采集数据, 并以XML作为中间格式保存, 通过解析提交到二级数据库中并集成部分生物信息学工具软件, 初步实现了数据检索、统计分析、基于Web的本地化BLAST同源序列检索、序列的自动拼接以及蛋白质结构和功能位点的分析等功能。该二级数据库的构建为植物激素作用分子机理研究提供了高针对性的植物激素数据源和生物信息学辅助工具。  相似文献   

以NCBI维护的一级数据库为数据源建立植物激素相关核酸和蛋白质二级数据库。将该二级数据库设计为基因、蛋白质和文献三部分,编写软件从上述数据源中采集数据,并以XML作为中间格式保存,通过解析提交到二级数据库中并集成部分生物信息学工具软件,初步实现了数据检索、统计分析、基于Web的本地化BLAST同源序列检索、序列的自动拼接以及蛋白质结构和功能位点的分析等功能。该二级数据库的构建为植物激素作用分子机理研究提供了高针对性的植物激素数据源和生物信息学辅助工具。  相似文献   

The GenBank (Registered Trademark symbol) sequence database incorporates DNA sequences from all available public sources, primarily through the direct submission of sequence data from individual laboratories and from large-scale sequencing projects. Most submitters use the BankIt (Web) or Sequin programs to format and send sequence data. Data exchange with the EMBL Data Library and the DNA Data Bank of Japan helps ensure comprehensive worldwide coverage. GenBank data is accessible through NCBI's integrated retrieval system, Entrez, which integrates data from the major DNA and protein sequence databases along with taxonomy, genome and protein structure information. MEDLINE (Registered Trademark symbol) s from published articles describing the sequences are included as an additional source of biological annotation through the PubMed search system. Sequence similarity searching is offered through the BLAST series of database search programs. In addition to FTP, Email, and server/client versions of Entrez and BLAST, NCBI offers a wide range of World Wide Web retrieval and analysis services based on GenBank data. The GenBank database and related resources are freely accessible via the URL: http://www.ncbi.nlm.nih.gov  相似文献   

The National Center for Biotechnology Information (NCBI) integrates data from more than 20 biological databases through a flexible search and retrieval system called Entrez. A core Entrez database, Entrez Nucleotide, includes GenBank and is tightly linked to the NCBI Taxonomy database, the Entrez Protein database, and the scientific literature in PubMed. A suite of more specialized databases for genomes, genes, gene families, gene expression, gene variation, and protein domains dovetails with the core databases to make Entrez a powerful system for genomic research. Linked to the full range of Entrez databases is the NCBI Map Viewer, which displays aligned genetic, physical, and sequence maps for eukaryotic genomes including those of many plants. A specialized plant query page allow maps from all plant genomes covered by the Map Viewer to be searched in tandem to produce a display of aligned maps from several species. PlantBLAST searches against the sequences shown in the Map Viewer allow BLAST alignments to be viewed within a genomic context. In addition, precomputed sequence similarities, such as those for proteins offered by BLAST Link, enable fluid navigation from unannotated to annotated sequences, quickening the pace of discovery. NCBI Web pages for plants, such as Plant Genome Central, complete the system by providing centralized access to NCBI's genomic resources as well as links to organism-specific Web pages beyond NCBI.  相似文献   

