首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
宋东光 《生物信息学》2015,13(2):96-102
EST序列代表了组织基因表达的转录信号,本研究尝试开发简单高效的大规模EST分析方法,从NCBI下载水稻(Oryza sativa)的所有EST序列并进行分析以获取水稻发育过程基因表达的重要信息。通过进行blast比对和phrap拼接分析,及利用Unix文本过滤方法,从EST序列拼接获得了3万多个重叠群序列。进一步将重叠群序列与NCBI核酸数据库进行比对获得了各个序列的注释信息。从重叠群的组织表达初步挖掘中发现花药的表达数量最多,为下一步探讨水稻发育器官特异表达基因调控打下了重要基础。  相似文献   

2.
充分利用EST数据库资源   总被引:11,自引:2,他引:9  
表达序列标签(EST)数据库作为一种重要的基因组数据库,已成为新基因的发现、基因表达及重组蛋白表达等研究的有力分子生物学工具.介绍了如何充分利用EST数据库.  相似文献   

3.
基于EST的新基因克隆策略   总被引:1,自引:0,他引:1  
刘媛  蔡嘉斌  蒋国松  童强松 《遗传》2008,30(3):257-262
表达序列标签(expressed sequence tags, EST) 是从随机选择的cDNA 克隆进行单向测序获得的短的cDNA序列, 代表一个完整基因的一部分。随着生物信息学和基因定位的迅猛发展, EST已成为基因定位、基因克隆、基因表达分析的有力工具。近年来, 由于EST数据库的迅速扩张, 运用EST来克隆和定位基因, 使得新基因克隆的策略发生了革命性变革。尽管存在一些不足, 实践证明EST可大大加速新基因的发现与研究。本文将就EST技术尤其是它在新基因克隆中的应用策略作详细介绍。  相似文献   

4.
以火炬松热胁迫cDNA文库的EST序列为材料,对EST序列进行聚类、拼接等处理后,再进行Blast同源比对以及基因GO注释分析。研究结果如下:从Forest TreeDB数据库中下载了火炬松热胁迫cDNA文库的所有EST序列,共4 283条。EST序列经CAP3拼接后,获得2 062个UniGene,其中934个Contig,1 128个Singletons。对UniGene进行同源检索,按照GO的分子功能、生物过程和细胞组分三个不同分类角度分类,被赋予功能的基因数累计达4 661个,但365个(17.7%)的序列与核酸和蛋白数据库无序列同源性,即17.7%为新发现的基因。经对所有具有功能的基因研究发现,受外界胁迫表达的抗逆相关基因含量较高。上述研究结果对于研究火炬松热胁迫基因表达特征与抗逆分子机制具有一定的借鉴价值,以及开发火炬松新分子标记与开展分子辅助育种具有一定的指导意义。  相似文献   

5.
对蛋白质质谱数据进行数据库比对和鉴定是蛋白质组学研究技术中的一个重要步骤。由于公共数据库蛋白质数据信息不全,有些蛋白质质谱数据无法得到有效的鉴定。而利用相关物种的EST序列构建专门的质谱数据库则可以增加鉴定未知蛋白的几率。本文介绍了利用EST序列构建Mascot本地数据库的具体方法和步骤,扩展了Mascot检索引擎对蛋白质质谱数据的鉴定范围,从数据库层面提高了对未知蛋白的鉴别几率,为蛋白质组学研究提供了一种较为实用的生物信息学分析技术。  相似文献   

6.
口蹄疫是一种烈性传染病,其广泛流行给社会造成了巨大经济损失。为了研究口蹄疫灭活疫苗免疫的分子机制,同时也为抗口蹄疫病毒药物的研制奠定基础,本研究应用mRNA差异显示技术,以PK-15细胞为材料,系统比较了口蹄疫疫苗刺激组(A组)和正常的PK-15细胞(B组)的基因表达情况,回收差异片段,经二次扩增并纯化后,得到30条ESTs。将30条ESTs采用以地高辛标记的反向Northern点杂交鉴定,将阳性条带克隆测序,筛选出8条ESTs,编号E1~E8,应用BLASTn工具将8条ESTs对核酸数据库nr和dbEST中所有序列进行了同源性分析,其中E1,E2分别与猪的热休克蛋白基因、猪的MHCⅠ类基因同源,序列相似性都达到100%。E3,E4,E5,E7分别与已有核酸数据库中的基因克隆或EST具有较高同源性,为已知的EST,但功能未知;E6,E8在数据库中没有发现与其相似性较高的序列,为新的EST。应用数据库资源将E5、E7进行电子延伸后,将延伸序列进行开放阅读框分析,又经TBLASTx分析发现E7蛋白质序列与猪的精氨酸酶Ⅰ类蛋白序列有很高同源性。将E1、E2、E4、E5序列进行了基因表达谱分析,对E6、E8用BLASTx工具对非冗余蛋白质数据库nr进行了相似性搜索,在其他物种中找到了相似的基因序列。本研究筛选出的热休克蛋白基因、MHCⅠ类基因、精氨酸酶Ⅰ类基因和其他未知功能基因可以作为抗口蹄疫病毒研究中的侯选基因,其具体的功能有待今后进一步研究。  相似文献   

7.
用基因本体论(Cene Ontology,GO)中的相关的规范术语和BLAST分析结果来对球毛壳菌EST及CONTIG序列信息进行注释,利用GO的语义模型构建不同物种数据库之间的语义联接,在此基础上建立球毛壳菌EST生物信息分析数据库,在概念和联系层面上有效地解决了不同物种生物信息的整合问题,实现了对球毛壳菌生物信息学数据智能化的多重、复合和交叉检索。为球毛壳菌生物信息学的进一步研究奠定了坚实的基础。文中详细论述了基于GO的球毛壳菌EST生物信息学数据库的研究背景、建立过程、查询功能及其维护。  相似文献   

8.
植物基因组表达序列标签(EST)计划研究进展   总被引:62,自引:0,他引:62  
植物表达序列标签(EST)计划是随机挑选cDNA克隆,并对其3′或5′端进行大规模一次性测序,将得到的150~500 bp长度的DNA片段与数据库中的序列进行比较,获得对基因组结构、组织、表达等认识的基因组研究策略.就近年来国际植物EST计划的实施情况、植物EST计划的研究范围、生物信息学在EST研究中的应用、EST数据库及查询、植物EST研究中遇到的问题等方面内容进行了综述.  相似文献   

9.
EST(expressed sequence tag,表达序列标签)是对cDNA克隆进行测序时得到的序列,一般位于该克隆的一端,序列为单次测序所得到的。现在EST已成为一个非常大的数据库,并被广泛运用于基因家族新成员的寻找,也可作为人染色体上的标志来寻找多态性位点,还可以用来比较某基因在不同组织和病理状态中的表达模式。在EST数据库中,  相似文献   

10.
表达序列标签(EST)是由大量随机取出的cDNA库克隆经测序得到的组织或细胞基因组的一段cDNA序列,一个EST代表生物体某种组织某一时期的一个表达基因。综述了EST分析技术在鸡基因组研究中的应用。如用于鉴定、发现和预测鸡的新基因,用于基因图谱的绘制,用于筛选基因的单核苷酸多态性(SNP)位点,用于基因表达分析和基因芯片制作等。EST数据库和生物信息学的联合分析技术在推动家鸡后基因组的研究中发挥着重要的作用。  相似文献   

11.
12.
生物信息学中,发现、鉴别新基因是承上启下的一步,它既承接了过往如“基因组测序”的工作,又是未来“后基因时代”研究的基石.“基因电脑克隆”是利用计算手段发现、鉴别新基因的方法,SiClone软件实现了“基因电脑克隆”功能.本文对SiClone软件操作的数据库提出并行处理方案,并详述了基于MPI(message passing interface)平台实现的并行优化版本PSiClone.根据已得到的EST数据库,展示了软件并行版PSiClone的运行性能,试验数据库EST序列条数仅仅是NCBI(The National Center for Biotechnology Information)dbEST庞大数据库的很小部分,这也暗示我们软件的并行工作对于大数据库的比较和运算将更有应用前景.  相似文献   

13.
To understand genetic information carried in a unicellular green alga, Chlamydomonas reinhardtii, normalized and size-selected cDNA libraries were constructed from cells at photoautotrophic growth, and a total of 11,571 5'-end sequence tags were established. These sequences were grouped into 3433 independent EST species. Similarity search against the public non-redundant protein database indicated that 817 groups showed significant similarity to registered sequences, of which 140 were of previously identified C. reinhardtii genes, but the remaining 2616 species were novel sequences. The coverage of full-length protein coding regions was estimated to be over 60%. These cDNA clones and EST sequence information will provide a powerful source for the future genome-wide functional analysis of uncharacterized genes.  相似文献   

14.
目的:利用基因芯片数据,探讨宫颈癌在分子水平上的发病机制,挖掘肿瘤相关基因EST片段,探索恶性肿瘤标志物,为肿瘤防治找到新的有效手段。方法:从基因芯片数据库GEO(gene expression omnibus)中获得GSM99077基因芯片数据,利用该数据筛选出宫颈癌相关基因的EST片段;然后通过NCBI中的在线BLAST软件找到与之相匹配的同源序列,对这些同源序列进行生物学功能分析,找到与肿瘤的相关性。结果:共发现宫颈癌组织与正常宫颈组织差异表达EST共127条,其中上调的106条,下调的11条,这些差异表达EST的同源序列的转录产物参与转录、翻译、细胞增殖分裂及细胞信号传导等过程。结论:基因芯片能有效、高通量地获取生物内在信息,通过对基因芯片数据再挖掘,可发现宫颈癌的发生涉及多个基因共同作用。  相似文献   

15.
以拟南芥糖代谢相关酶基因序列作为探针,对葡萄EST数据库进行同源检索筛选,获得相应的同源EST序列,并以葡萄果实cDNA为模板,通过PCR反应,对葡萄糖代谢途径相关基因进行了分析。进一步预测了葡萄糖代谢途径相关酶编码基因个数,分别位于1、4、5、6、7、8、11、12、13、16、17、18、19号染色体,另有3条序列未能定位到染色体,并对编码基因表达强弱进行了分析,为深入了解葡萄果实内糖代谢的机理提供一定的工作基础,也可以为如何调控果实糖代谢以及提高葡萄果实品质提供理论依据。  相似文献   

16.
陆地棉EST长度多态性与其SSR分布特征相关性分析   总被引:2,自引:1,他引:1  
目的:分析陆地棉EST长度多态性与其SSR分布特征的相关性。方法:从NCBI公共数据库下载陆地棉EST序列,应用SSRIT搜索SSR,分析20 000条无冗余的EST序列。结果:在剔除低质量和冗余的序列后,得到全长为7 363.878kb的无冗余EST序列7 322条,其中含有SSR位点的EST序列数520条,占被分析EST比例的2.60%。长度在400bp以下的EST序列含SSR的比例为1.46%;长度在400bp以上的EST序列含SSR的比例为8.94%。在1~6bp的重复基元中,二核苷酸重复基元的SSR重复频率最高,占总数的63.46%,其次是三核苷酸,占总数的34.04%。二核苷酸类型(AG)n、(AT)n和三核苷酸类型(AAG)n、(ACC)n、(ACT)n、(AAT)n是SSR的主要重复基元。结论:棉花EST-SSR可用于棉花分子标记,为有针对性设计陆地棉EST-SSR引物奠定基础。  相似文献   

17.
For comprehensive analysis of genes expressed in a model legume, Lotus japonicus, a total of 22,983 5' end expressed sequence tags (ESTs) were accumulated from normalized and size-selected cDNA libraries constructed from young (2 weeks old) plants. The EST sequences were clustered into 7137 non-redundant groups. Similarity search against public non-redundant protein database indicated that 3302 groups showed similarity to genes of known function, 1143 groups to hypothetical genes, and 2692 were novel sequences. Homologues of 5 nodule-specific genes which have been reported in other legume species were contained in the collected ESTs, suggesting that the EST source generated in this study will become a useful tool for identification of genes related to legume-specific biological processes. The sequence data of individual ESTs are available at the web site: http://www.kazusa.or.jp/en/plant/lotus/EST/.  相似文献   

18.
Simple Sequence Repeats (SSRs) developed from Expressed Sequence Tags (ESTs), known as EST-SSRs are most widely used and potentially valuable source of gene based markers for their high levels of crosstaxon portability, rapid and less expensive development. The EST sequence information in the publicly available databases is increasing in a faster rate. The emerging computational approach provides a better alternative process of development of SSR markers from the ESTs than the conventional methods. In the present study, 12,851 EST sequences of Camellia sinensis, downloaded from National Center for Biotechnology Information (NCBI) were mined for the development of Microsatellites. 6148 (4779 singletons and 1369 contigs) non redundant EST sequences were found after preprocessing and assembly of these sequences using various computational tools. Out of total 3822.68 kb sequence examined, 1636 (26.61%) EST sequences containing 2371 SSRs were detected with a density of 1 SSR/1.61 kb leading to development of 245 primer pairs. These mined EST-SSR markers will help further in the study of variability, mapping, evolutionary relationship in Camellia sinensis. In addition, these developed SSRs can also be applied for various studies across species.  相似文献   

19.
Peanut (Arachis hypogaea L.) ranks fifth among the world oil crops and is widely grown in India and neighbouring countries. Due to its large and unknown genome size, studies on genomics and genetic modification of peanut are still scanty as compared to other model crops like Arabidopsis, rice, cotton and soybean. Because of its favourable cultivation in semi-arid regions, study on abiotic stress responsive genes and its regulation in peanut is very much important. Therefore, we aim to identify and annotate the abiotic stress responsive candidate genes in peanut ESTs. Expression data of drought stress responsive corresponding genes and EST sequences were screened from dot blot experiments shown as heat maps and supplementary tables, respectively as reported by Govind et al. (2009). Some of the screened genes having no information about their ESTs in above mentioned supplementary tables were retrieved from NCBI. A phylogenetic analysis was performed to find a group of utmost similar ESTs for each selected gene. Individual EST of the said group were further searched in peanut ESTs (1,78,490 whole EST sequences) using stand alone BLAST. For the prediction as well as annotation of abiotic stress responsive selected genes, various tools (like Vec-Screen, Repeat Masker, EST-Trimmer, DNA Baser, WISE2 and I-TASSER) were used. Here we report the predicted result of Contigs, domain as well as 3D structure for HSP 17.3KDa protein, DnaJ protein and Type 2 Metallothionein protein.  相似文献   

20.
稻瘟菌Magnaporthe oryzae P-ATPases基因家族分析   总被引:1,自引:0,他引:1  
利用TCDB(Transporter Classification Database)网站数据库中的P-ATPases氨基酸序列对稻瘟菌全基因组表达序列(Coding Sequence,CDS)数据库进行搜索和分析,共发现23个P-ATPases基因,进化树分析表明这23个基因分属于4个家族和7个亚家族。构建了本地ESTs数据库,通过P-ATPases基因CDS序列与EST序列比对分析发现,在这些基因中有20个存在EST同源体,另外3个基因没有发现EST同源体,因此这20个基因是真实P-ATPases基因的可能性更高。运用MEME程序分析了这些P-ATPases蛋白结构域的基序,有6种基序在90%以上的基因氨基酸序列中出现,属保守基序。对这23个P-ATPases基因GC含量的分析表明,它们的平均GC含量在0.519-0.628之间,稍高于稻瘟菌整个基因组GC平均含量(0.516),同时这些基因内各区段GC含量变化不大,没有明显的梯度变化。本文结果为下一步深入研究稻瘟菌中P-ATPases基因家族的功能奠定了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号