首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
当前二代测序数据的处理广泛使用基于标准版本的Linux操作系统分析方法。这一系统专业性强,成本较高,操作界面不够友好,严重限制了大多数科研人员对数据的自主分析。本文创建了一个基于微软Windows操作系统的全功能二代测序数据的生物信息学分析系统,利用该系统经优选实现当前多种高通量测序数据的主流标准化分析流程。通过RNA-Seq的代表性案例,演算实测数据与传统Linux系统驱动的数据分析结果相比较,结果显示,本系统的组件和流程在常用的数据分析过程中,可以基本取代目前主流的Linux服务器或云计算平台,在运行效率相近的情况下,其操作极为简便且成本大大降低。本系统与所配附的编译软件及流程脚本,不仅为测序数据的生物信息学分析实操演练提供全面的解决方案,而且可以直接应用于专业的测序数据分析中。  相似文献   

2.
微生物组数据分析需要掌握Linux系统操作,这对缺乏计算机知识的生物研究人员是一个很大的障碍。为此我们设计了一套在Windows的Linux子系统(WSL)下分析16S rRNA基因扩增子高通量测序数据的简易流程。本流程整合常用的开源软件VSEARCH与QIIME等,能对16S rRNA测序数据进行质量控制、OTU聚类、多样性分析及结果可视化呈现。以唾液微生物组分析为例,详细介绍从原始数据到多样性统计分析过程的参数和命令,及结果解读。教学实践证明,此流程易于学习,并有助于掌握微生物组的基本概念与方法。利用Windows系统最新的WSL功能,本流程方便Windows用户使用大量在Linux上运行的生物信息工具,有助于促进微生物组研究的发展。流程的安装程序与测序数据可从网址(http://www. ligene. cn/win16s/)免费下载使用。  相似文献   

3.
差异表达基因的检测与分析已成为研究具有差异的生物学表型的常规策略.对通过实验所获得的差异基因片段进行生物信息学分析,主要包括基于国际互联网的序列相似性分析、片段重叠群分析和全长cDNA序列分析,以及如何构建局域网并采用本地服务器进行规模化的数据分析,从而为研究人员提供可参考的生物信息学数据分析方案.  相似文献   

4.
核苷酸序列是生物体遗传信息的载体,是现代生物学和生态学的基础数据。随着测序技术的进步,大量核苷酸序列被提取并存储在公共数据平台中,其中Gen Bank(http://www.ncbi.nlm.nih.gov/genbank/)是目前最大的核苷酸序列数据平台之一。截至2015年2月,该平台收录核苷酸序列总数已超过1.8亿条、覆盖全球超过30万个物种。但如何从如此海量的数据中准确、快速查找并下载所需数据已成为限制基因数据广泛使用的障碍之一。为此,我们开发了一款可高效、准确下载Gen Bank数据的生物信息学软件NCBIminer。NCBIminer可根据用户提供的核苷酸序列名称、数据类型、一或多条初始化参考序列,查找并下载用户指定的多个物种或类群的特定基因序列数据。该软件下载地址为https://github.com/greengirl/NCBIminer/releases/,可在Windows、Linux和MAC操作系统下免费使用;同时,其操作简单,用户无需生物信息学背景。为方便该软件的使用,本文将介绍该软件的工作流程与算法、安装及使用过程中的参数设置等。  相似文献   

5.
SeqHunter:序列搜索与分析的生物信息学软件包   总被引:1,自引:0,他引:1  
叶文武  王源超  窦道龙 《生物信息学》2010,8(4):364-367,377
利用Microsoft Visual Basic 6.0脚本,开发了一个在Windows平台下使用的生物信息学软件包SeqHunter;该软件包以简便的图形界面操作方式,可以实现本地化Blast,序列提取、比对与分析,序列数据库建立和管理等多种常用功能,为基因功能分析与大规模基因组数据挖掘提供了一个实用工具。  相似文献   

6.
【背景】随着测序费用的降低,越来越多的科学家选择利用高通量测序技术研究噬菌体的基因组序列。通过对这些基因组数据的分析和研究,一些科学家也开发出了判断dsDNA噬菌体末端序列的方法,但这些方法是基于Linux系统下的命令,并没有在Windows操作系统下的软件。【目的】在Windows平台下开发一款免费的、可以在高通量测序获得的庞大序列文件中找到dsDNA噬菌体基因组末端序列的软件PhageGT。【方法】使用Visual Studio 2019开发一个基于对话框的微软基础类库(Microsoft Foundation Classes,MFC)应用程序。软件使用C++语言开发,逐行读取序列文件中的每条Reads,并设计相应的算法进行统计、计算。【结果】软件PhageGT可在高通量测序文件中提取出不同序列出现的频率、排序,并利用提取序列的最高频率和序列平均频率的比值(R值)判断噬菌体基因组是否存在末端序列。【结论】软件PhageGT的使用比较方便、简单。软件PhageGT和本文所利用的所有测试数据均可从https://zenodo.org/record/4674231#.YHADb-gzZxc免费获得。  相似文献   

7.
生物信息学数据库调查分析及其利用研究   总被引:5,自引:0,他引:5  
从生物信息学数据库利用的角度调查分析生物信息学数据库的现状,为我国科研人员利用网上生物信息学数据库以及生物信息中心的开发提供科学依据和参考价值。研究采用网上调查的方法,对法国生物信息中心Infobiogen建立维护的生物信息学数据库目录DBcat中收录的511个数据库进行调查统计,分析其类型分布、国家分布、更新频率和获取方式;在此基础上。进一步利用欧洲分子生物学信息网(EMBnet)中30个成员国节点对生物信息学数据库利用现状进行统计分析。  相似文献   

8.
生物信息学是一门计算机辅助的数据管理科学。它帮助人们收集、分析和提供这种信息 ,以便了解在健康和疾病状态下的生命过程 ,以及发现新的和更好的药物。目前 ,世界上科技界、企业界和国家 /国际研究机构都在从事生物信息学的研究和发展。生物信息学被认为是现代和未来生物技术的基石。1 历史透视生物信息学一般涉及基因和蛋白质序列以及结构 -功能信息的大规模数据库 ,它存储新的序列 ;当任何序列需要与已知序列作比较时可通过远程计算机存取进行检索。生物信息学是一个相当年轻的领域。它是自动化蛋白质和DNA测序从 70年代中期起成为…  相似文献   

9.
利用共词分析和可视化方法对生物信息学的关键词进行聚类分析,探讨该研究领域的学科分类和热点内容.以中国知网、中华医学会数据库中期刊论文为统计来源,对1998~2013年间的5 707篇生物信息学相关文献进行计量分析,提取出40个高频关键词.利用ROST软件得到关键词共词矩阵,在此基础上利用SPSS进行因子分析、聚类分析和多维尺度分析.结合因子分析和聚类分析将生物信息学领域主要研究内容分为7类,结合多维尺度分析对研究热点及变化趋势进行了初步探讨.研究结果较为客观地反映了当前生物信息学领域的学科分类和研究热点,为科研人员进行生物信息学研究提供一些思路.  相似文献   

10.
有毒动物可产生大量的药学活性成分。当前,NCBI等数据库中已汇集了大量的毒素序列和结构数据,但关于功能方面的介绍却非常少。新的毒素数据的增长对数据管理提出了更高的要求,毒素生物信息学作为一种辅助手段,可显著降低实验的工作量,其利用系统的生物信息学方法将整理过的毒素数据归类储存在各数据库中,并整合进可对毒素进行结构和功能分析的生物信息学工具。以海螺、蝎子和蛇等来源的蛋白类毒素为例,对生物信息学在毒素数据管理和构效关系研究等方面的应用进行了综述。  相似文献   

11.
SUMMARY: GeneSyn is a software tool that allows automatic detection of conserved gene order from annotated genomes. AVAILABILITY: Available free of charge for Unix/Linux/Cygwin platforms at ftp://159.149.110.11/pub/GeneSyn_1.0/ SUPPLEMENTARY INFORMATION: ftp://159.149.110.11/pub/GeneSyn_1.0/  相似文献   

12.
Open source clustering software   总被引:20,自引:0,他引:20  
  相似文献   

13.
Ligand Depot: a data warehouse for ligands bound to macromolecules   总被引:1,自引:0,他引:1  
Ligand Depot is an integrated data resource for finding information about small molecules bound to proteins and nucleic acids. The initial release (version 1.0, November, 2003) focuses on providing chemical and structural information for small molecules found as part of the structures deposited in the Protein Data Bank. Ligand Depot accepts keyword-based queries and also provides a graphical interface for performing chemical substructure searches. A wide variety of web resources that contain information on small molecules may also be accessed through Ligand Depot. AVAILABILITY: Ligand Depot is available at http://ligand-depot.rutgers.edu/. Version 1.0 supports multiple operating systems including Windows, Unix, Linux and the Macintosh operating system. The current drawing tool works in Internet Explorer, Netscape and Mozilla on Windows, Unix and Linux.  相似文献   

14.
15.
SUMMARY: BMapBuilder builds maps of pairwise linkage disequilibrium (LD) in either two or three dimensions. The optimized resolution allows for graphical display of LD for single nucleotide polymorphisms (SNPs) in a whole chromosome. AVAILABILITY: The program is coded in Java, which runs on all relevant operating systems, including Windows, Mac and Unix/Linux, and is available from http://bios.ugr.es/BMapBuilder.  相似文献   

16.
PCP: a program for supervised classification of gene expression profiles   总被引:1,自引:0,他引:1  
PCP (Pattern Classification Program) is an open-source machine learning program for supervised classification of patterns (vectors of measurements). The principal use of PCP in bioinformatics is design and evaluation of classifiers for use in clinical diagnostic tests based on measurements of gene expression. PCP implements leading pattern classification and gene selection algorithms and incorporates cross-validation estimation of classifier performance. Importantly, the implementation integrates gene selection and class prediction stages, which is vital for computing reliable performance estimates in small-sample scenarios. Additionally, the program includes automated and efficient model selection (optimization of parameters) for support vector machine (SVM) classifier. The distribution includes Linux and Windows/Cygwin binaries. The program can easily be ported to other platforms. AVAILABILITY: Free download at http://pcp.sourceforge.net  相似文献   

17.
SUMMARY: ACGT (a comparative genomics tool) is a genomic DNA sequence comparison viewer and analyzer. It can read a pair of DNA sequences in GenBank, Embl or Fasta formats, with or without a comparison file, and provide users with many options to view and analyze the similarities between the input sequences. It is written in Java and can be run on Unix, Linux and Windows platforms. AVAILABILITY: The ACGT program is freely available with documentation and examples at website: http://db.systemsbiology.net/projects/local/mhc/acgt/  相似文献   

18.
Clustal W and Clustal X version 2.0   总被引:70,自引:0,他引:70  
SUMMARY: The Clustal W and Clustal X multiple sequence alignment programs have been completely rewritten in C++. This will facilitate the further development of the alignment algorithms in the future and has allowed proper porting of the programs to the latest versions of Linux, Macintosh and Windows operating systems. AVAILABILITY: The programs can be run on-line from the EBI web server: http://www.ebi.ac.uk/tools/clustalw2. The source code and executables for Windows, Linux and Macintosh computers are available from the EBI ftp site ftp://ftp.ebi.ac.uk/pub/software/clustalw2/  相似文献   

19.
Increasingly, data on shape are analysed in combination with molecular genetic or ecological information, so that tools for geometric morphometric analysis are required. Morphometric studies most often use the arrangements of morphological landmarks as the data source and extract shape information from them by Procrustes superimposition. The MorphoJ software combines this approach with a wide range of methods for shape analysis in different biological contexts. The program offers an integrated and user-friendly environment for standard multivariate analyses such as principal components, discriminant analysis and multivariate regression as well as specialized applications including phylogenetics, quantitative genetics and analyses of modularity in shape data. MorphoJ is written in Java and versions for the Windows, Macintosh and Unix/Linux platforms are freely available from http://www.flywings.org.uk/MorphoJ_page.htm.  相似文献   

20.
BLMT     
Statistical analysis of amino acid and nucleotide sequences, especially sequence alignment, is one of the most commonly performed tasks in modern molecular biology. However, for many tasks in bioinformatics, the requirement for the features in an alignment to be consecutive is restrictive and "n-grams" (aka k-tuples) have been used as features instead. N-grams are usually short nucleotide or amino acid sequences of length n, but the unit for a gram may be chosen arbitrarily. The n-gram concept is borrowed from language technologies where n-grams of words form the fundamental units in statistical language models. Despite the demonstrated utility of n-gram statistics for the biology domain, there is currently no publicly accessible generic tool for the efficient calculation of such statistics. Most sequence analysis tools will disregard matches because of the lack of statistical significance in finding short sequences. This article presents the integrated Biological Language Modeling Toolkit (BLMT) that allows efficient calculation of n-gram statistics for arbitrary sequence datasets. AVAILABILITY: BLMT can be downloaded from http://www.cs.cmu.edu/~blmt/source and installed for standalone use on any Unix platform or Unix shell emulation such as Cygwin on the Windows platform. Specific tools and usage details are described in a "readme" file. The n-gram computations carried out by the BLMT are part of a broader set of tools borrowed from language technologies and modified for statistical analysis of biological sequences; these are available at http://flan.blm.cs.cmu.edu/.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号