首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
张菁晶  冯晶  朱英国  李阳生 《遗传》2006,28(10):1299-1306
运用隐马尔可夫模型, 利用Perl编程, 以几种模式生物的蛋白质数据库为基础, 构建了目标基因的全基因组预测的新方法。该方法具有高通量, 准确度高且操作简易等优点, 特别在多结构域蛋白家族预测上更显优势。应用该方法对几种模式生物的全基因组PPR和TPR蛋白家族进行了预测, 其中粳稻日本晴中含有536个PPR蛋白、199个TPR蛋白; 籼稻9311中含有519个PPR蛋白、177个TPR蛋白; 拟南芥中含有735个PPR蛋白、292个TPR蛋白; 红藻中6个PPR蛋白、32个TPR蛋白; 蓝细菌以及古细菌中没有PPR蛋白, 但蓝细菌含有10个TPR蛋白, 古细菌有4个TPR蛋白, 并对所得结果进行了进一步生物信息学分析。  相似文献   

2.
【目的】识别原核生物全基因组中的16S rRNA基因。【方法】本文依据基因序列的GC碱基含量、碱基3-周期性和马尔可夫链3个方面的特性,构建了识别原核生物全基因组中16S rRNA基因的三层过滤模型。【结果】经检验,模型的特异性、敏感性和马修斯相关系数分别为99.58%、91.60%和91.49%。【结论】结果表明,本文所提出的方法可以高效、准确地识别出16S rRNA基因。  相似文献   

3.
为了研究导致致病性大肠杆菌致病力差异的主要因素,本试验以分离自仔猪腹泻样的五株致病性大肠杆菌(P211、P555、P32、P444和P111)和两株参考大肠杆菌(S10670、E24190)为实验材料,通过小鼠感染试验鉴别菌株的致病力,并对菌株进行全基因组测序,分析菌株基因组.结果显示,强毒株S10670和E24190...  相似文献   

4.
利用基因组数据和生物信息学分析方法,快速鉴定耐药基因并预测耐药表型,为细菌耐药状况监测提供了有力辅助手段。目前,已有的数十个耐药数据库及其相关分析工具这些资源为细菌耐药基因的识别以及耐药表型的预测提供了数据信息和技术手段。随着细菌基因组数据的持续增加以及耐药表型数据的不断积累,大数据和机器学习能够更好地建立耐药表型与基因组信息之间的相关性,因此,构建高效的耐药表型预测模型成为研究热点。本文围绕细菌耐药基因的识别和耐药表型的预测,针对耐药相关数据库、耐药特征识别理论与方法、耐药数据的机器学习与表型预测等方面展开讨论,以期为细菌耐药的相关研究提供手段和思路。  相似文献   

5.
棉花YABBY基因家族的全基因组分析   总被引:1,自引:0,他引:1  
YABBY基因家族属于锌指蛋白超家族(Zinc finger super-family)的亚家族,在调控植物叶和花器官发育过程中起着重要的作用。从陆地棉标准系TM-1(Gossypium hirsutum L.acc.TM-1)基因组中鉴定到23个YABBY基因家族成员,具有不同的亚细胞定位;这些基因分布在16条染色体和1条Scaffold上,且有9对共线性基因;棉花的YABBY基因家族分为4个亚组,每个亚组都有与拟南芥同源的基因,且每个亚组成员间具有相似的基序类型和排列顺序;组织表达分析表明,TM-1全基因组中的23个YABBY基因家族成员具有较为广泛的组织表达类型。所有YABBY基因家族成员在花、蕾和茎端分生组织中表达。  相似文献   

6.
水稻NBS-LRR基因选择性剪接的全基因组检测及分析   总被引:1,自引:0,他引:1  
顾连峰  郭荣发 《遗传学报》2007,34(3):247-257
选择性剪接是促进基因组复杂性和蛋白质组多样性的一种主要机制,但是对水稻NBS-LRR序列选择性剪接的全基因组分析却未见报道。通过隐马尔柯夫模型搜索,从TIGR数据库里得到了855条编码NBS-LRR基序的序列。利用这些序列在KOME、TIGR基因索引及UniProt三个数据库中进行同源搜索,获得同源的完整cDNA序列、假设一致性序列和蛋白质序列。再利用Spidey和SIM4程序把完整cDNA序列和假设一致性序列联配到相应的BAC序列上来预测选择性剪接。蛋白质序列和基因组序列之间的联配使用tBLASTn。在这875个NBS-LRR基因中,119个基因具有选择性剪接现象,其中包括71内含子保留,20个外显子跳跃,25个选择性起始,16个选择性终止,12个5′端的选择性剪接和16个3′端选择性剪接。大多数选择性剪接都为两个和多个转录本所支持。可以通过访问http://www.bioinfor.org查询这些数据。进而通过生物信息学分析剪接边界发现外显子跳跃和内含子保留的‘GT…AG’的规则不如组成型的保守。这暗示了它们是通过不同的调控机制来指导剪接变构体的形成。通过分析内含子保留对蛋白质的影响,发现选择性剪接的蛋白更倾向于改变其C端氨基酸序列。最后对选择性剪接的组织分布和蛋白质定位进行分析,结果表明选择性剪接的最大类的组织分布是根和愈伤组织。超过1/3剪接变构体的蛋白质定位是质膜和细胞质。这些选择性剪接蛋白可能在抗病信号转导中起到重要作用。  相似文献   

7.
生长调控因子(growth regulating factor,GRF)是植物特有的转录因子家族,在植物生长发育过程中起重要调控作用。该研究利用生物信息学的方法,从茶树基因组中鉴定获得11个CsGRF转录因子家族成员,且均具有完整的特征结构域QLQ和WRC。CsGRF家族成员含有3~6个外显子,基于系统进化关系将CsGRF家族分为6组,且与葡萄及猕猴桃GRF家族的亲缘关系更为接近。不同组织转录组数据分析结果表明,该家族在生长活跃的茶树嫩梢部位高表达。上游启动子区域分析发现大量与植物发育、激素及胁迫响应密切相关的顺式作用元件。荧光定量检测发现,分别有10个和2个CsGRF成员在低温和干旱胁迫处理后呈现显著上调表达,其中CsGRF8和CsGRF11对2种非生物胁迫均有响应;并发现受ABA、MeJA和GA激素处理诱导分别有9个、3个和6个CsGRF基因的表达水平差异显著。研究表明,CsGRF基因家族在茶树生长发育过程及应激反应中起作用,推测CsGRF基因可能通过各种激素信号转导途径参与胁迫响应过程。  相似文献   

8.
该研究利用生物信息学方法,在橡胶草(Taraxacum kok-saghyz)全基因组中鉴定出7个TkAPXs基因家族成员,进一步分析发现7个成员中有1对是复制基因(TkAPX4/TkAPX6)。进化分析结果显示,7个基因可分为4个亚组;染色体定位分析表明,TkAPX基因家族成员分布广泛,7个TkAPXs基因位于7条不同的染色体上;亚细胞定位结果表明,TkAPX1、TkAPX3、TkAPX5和TkAPX7定位于细胞质,TkAPX4和TkAPX6定位于质膜,TkAPX2定位于叶绿体。启动子区域顺式作用元件分析结果显示,橡胶草APX基因含有大量的应激反应元件,推测APX基因可能对各种外界刺激和胁迫存在灵敏的应激反应机制。实时荧光定量PCR分析表明,橡胶草7个TkAPXs基因家族成员在花萼、花瓣、花梗中表达量均较低,大多数TkAPXs在根茎叶中的表达水平大于花及胶乳,其中TkAPX1在根和茎中的表达水平最高,推测TkAPX1基因可能在橡胶草生长发育过程中起重要作用。进一步对TkAPXs基因家族在逆境胁迫(冷、热、盐、旱)和激素(乙烯、茉莉酸甲酯)处理下的表达分析显示,TkAPX3在根及叶中的表达水平均较对照有大幅度升高,推测TkAPX3基因可能在橡胶草应答逆境胁迫和激素处理反应过程中起重要作用。  相似文献   

9.
苯丙氨酸酶(phenylalanine enzyme,PAL)是催化苯丙烷次级代谢过程中的重要限速酶,对植物生长发育意义重大。为进一步探讨水稻OsPAL基因的功能,利用生物信息学的方法,在水稻全基因组水平上对OsPAL基因家族进行了进化树、基因结构、染色体定位等方面的分析。数据表明,水稻基因组中共存在9个PAL基因,命名为OsPAL1~Os PAL9,编码681~719个氨基酸,都含有一个保守性很高的Lyase aromatic结构域,集中分布于第2、4、5、11和12号染色体上。进化树的分析表明,9个Os PAL基因可分为三类亚家族:Ⅰ类(Os PAL2-4,OsPAL6-7),Ⅱ类(OsPAL8-9)和Ⅲ类(OsPAL1,OsPAL5),3类比较明显的区别是蛋白N端的前30个氨基酸。荧光定量q RT-PCR分析表明,除Os PAL8外,其它8个基因的表达至少受干旱、低温、Na Cl和ABA等4种胁迫中的一种响应。  相似文献   

10.
LBD(lateral organ boundaries domain)蛋白是一类植物所特有的转录因子,在调控植物生长发育、营养代谢以及逆境胁迫的响应等方面发挥重要作用。然而,在基因组水平上对毛果杨LBD基因家族的研究还未曾有过报道。本研究利用生物信息学方法,从毛果杨基因组中鉴定出57个LBD基因并预测其分子量和等电点,这些基因分布于毛果杨18条染色体和Scaffold_65、Scaffold_86上。该家族成员基因结构简单,内含子数目不超过2个。进化关系分析显示毛果杨LBD基因可分为ClassⅠ和ClassⅡ两大类,细分为Ⅰa、Ⅰb、Ⅰc、Ⅰd、Ⅰe、Ⅱa和Ⅱb等7个亚类。分析基因表达模式发现,该家族成员的表达具有一定时空特异性,并响应氮素胁迫处理。本研究为深入研究毛果杨LBD基因的功能奠定了基础。  相似文献   

11.
钾离子通道四聚化结构域(KCTD)蛋白基因家族是一个保守的基因家族,该家族成员的共同特征是具有一个含有BTB保守结构域的N-末端和一个可变的C-末端。KCTD基因的突变或不正常调控与人类多种疾病相关。七鳃鳗是现存最原始的脊椎动物,作为联系无脊椎动物和脊椎动物之间的桥梁,在生物进化研究中占有重要地位。本研究通过对海七鳃鳗(Petromyzon marinus)和日本七鳃鳗(Lethenteron japonicum)基因组和转录组数据分析,全面系统地鉴定了海七鳃鳗和日本七鳃鳗KCTD基因家族成员,并对其基因结构特征、蛋白保守基序和基因表达模式进行了分析。在海七鳃鳗和日本七鳃鳗中分别鉴定出13个和14个KCTD基因,基因长度和外显子数目在不同KCTD基因间变化很大,KCTD蛋白中4个基序保守性显著,大多数KCTD基因呈泛表达模式,并且在胚胎发育时期明显高表达。除七鳃鳗外,对12个无脊椎动物和脊椎动物代表物种KCTD基因家族成员进行了鉴定,并对KCTD基因家族成员的进化关系进行了分析。根据进化树聚类情况,将KCTD基因家族成员分为11个亚家族。进化分析结果显示,KCTD基因家族从低等的无脊椎动物线虫和果蝇到高等的人类都存在;线虫中仅有5个成员,果蝇中有8个成员,随着物种进化程度由低到高,KCTD家族成员数目呈现增加的趋势;从爬行类开始,脊椎动物KCTD基因数目稳定在24个左右。硬骨鱼类特有的全基因组复制事件影响鱼类KCTD基因数目。本研究结果不仅丰富了七鳃鳗KCTD基因家族信息,同时也对KCTD家族基因间的进化关系进行了探究,为深入研究该家族基因功能提供了一定的依据。  相似文献   

12.
纪剑辉  周颖君  吴贺贺  杨立明 《遗传》2015,37(12):1228-1241
Trihelix转录因子家族在植物生长发育以及响应逆境胁迫等方面发挥着重要作用,但目前基于水稻全基因组水平鉴定和分析该基因家族的研究尚未见相关报道。本文利用生物信息学方法在水稻基因组数据库中鉴定到Trihelix家族成员31个,序列聚类和功能结构域分析发现该家族均含有高度保守的、特征性的Trihelix结构域;根据亲缘关系远近和结构域特点,将其分为5个亚家族(Ⅰ~Ⅴ)。通过与拟南芥、二穗短炳草和高粱中Trihelix家族的聚类分析发现,这4个物种中Trihelix家族的分类相一致,但每个物种均含有不同亚家族的成员,表明该基因家族的分化早于物种的分化。基于MEME程序分析水稻Trihelix转录因子家族的保守基序与聚类分析结果具有较高的一致性。染色体区段复制分析表明,部分Trihelix家族成员在水稻以及水稻与其他物种之间存在种内和种间的染色体区段复制;生物芯片数据分析发现,Trihelix基因家族在水稻不同组织中、以及对6种不同植物激素的响应呈现多样化的表达谱。采用RiceFREND在线数据库分析发现,水稻Trihelix转录因子家族的20个成员与其他蛋白存在互作关系。本研究结果初步明确了水稻Trihelix转录因子家族的进化特点、染色体分布、染色体区段复制关系、组织表达、激素应答,以及该家族蛋白与其他蛋白质的互作情况,为进一步揭示Trihelix转录因子家族的分子进化规律和生物学功能奠定了基础。  相似文献   

13.
14.
以基因组中的SNP为线索,GWAS使人的多样性凸显出来。 制药企业期待GWAS对药物副作用的防止和新靶点的探索做出贡献。 受到研究经费和DNA微列阵的限制,今后的研究将怎么开展。  相似文献   

15.
FMDV OH99株基因组全序列的测定及其基因特征研究   总被引:3,自引:0,他引:3  
采用RT-PCR方法对FMDV OH99株基因组全序列进行了分子克隆与测序.结果表明OH99株基因组全基因组序列长8040nt,其中5'NCR长1026nt,前导蛋白(L)编码区长603nt.该毒株结构蛋白与非结构蛋白编码区的核苷酸序列为6318nt,3'NCR长93nt,其后是poly(A)尾巴,测序结果表明该结构至少含有56个A.应用分子生物学软件,将OH99株与其它参考毒株进行了序列比较,并对其基因特征、推导的氨基酸序列进行了研究分析.结果显示,在分类地位上OH99株归属于O型FMDV,与OTY TW/97具有较高的同源性,而与其他参考毒株的差异性比较大,而且在基因组功能未知区域和3A编码区域具有两处明显的基因片段缺失现象,其中3A编码区缺失30nt,与OTY TW/97株相同,但功能未知区域的缺失状况与OTY TW/97稍有差异.根据VP1基因序列,对OH99株与参考毒株进行了系统发生树分析,分析结果表明OH99株与OTY TW/97株在同一基因型内,其遗传关系最近,而与其毒株遗传关系较远.  相似文献   

16.
为了克隆到全长的人促红细胞生成素基因,从而在真核系统中及转基因动物乳腺中进行表达,从一个中国人的血细胞中提取基因组DNA,构建了不完全基因组噬菌体文库,文库效价为5×104.这种文库的构建方法是用BamHⅠ对基因组DNA进行完全酶切,回收10.5kb左右的酶切片段,插入到λ-噬菌体EMBL3载体中.筛选文库所使用的探针是用PCR方法从基因组DNA模板中扩增的556bp的EPO基因片段.从该文库中筛选到了一个含有完整EPO基因的插入片段长度为12.5kb的阳性克隆.经全序列分析证实,所克隆的EPO基因编码正确,但在5′-侧翼及第一内含子处与国外发表的序列相比较,发现两处核苷酸差异,这两个核苷酸的差异改变了5′-调控区的两个小的开放阅读框——ORF1和ORF3,其在基因表达调探方面的作用值得进一步探讨.  相似文献   

17.
4-香豆酸辅酶A连接酶(4CL)是茶树苯丙烷代谢途径的核心酶,是类黄酮和木质素生物合成的关键酶,对茶树抗胁迫及茶叶品质形成有重要作用。研究通过生物信息学分析,从‘黄棪’和‘铁观音’茶树中分别鉴定出8个和9个4CL基因家族成员,命名为HD-Cs4CL1~8和TGY-Cs4CL1~9。系统发育分析将其分为A和B两组,A组中第Ⅰ亚家族的HD-Cs4CL3、HD-Cs4CL7、TGY-Cs4CL2和第Ⅱ亚家族的HD-Cs4CL2、TGY-Cs4CL5可能分别参与木质素和类黄酮合成。启动子顺式元件分析表明4CL基因中存在大量与植物发育、激素和胁迫响应相关的顺式作用元件。不同组织转录组数据分析表明,Cs4CL基因在茶树特定发育时期具有重要作用。实时荧光定量检测表明,HD-Cs4CL6和HD-Cs4CL8在GA、MeJA、ABA、低温和干旱处理下表达量均显著上调;HD-Cs4CL7在ABA处理和干旱处理下表达量上调,HD-Cs4CL2和HD-Cs4CL3在ABA处理下表达量上调。研究为进一步探究茶树4CL基因家族参与响应多种环境的生物学机制提供参考。  相似文献   

18.
采用RT-PCR方法对FMDV OH99株基因组全序列进行了分子克隆与测序。结果表明OH99株基因组全基因组序列长8040nt,其中5’NCR长1026nt,前导蛋白(L)编码区长603nt。该毒株结构蛋白与非结构蛋白编码区的核苷酸序列为6318nt,3’NCR长93nt,其后是poly(A)尾巴,测序结果表明该结构至少含有56个A。应用分子生物学软件,将OH99株与其它参考毒株进行了序列比较,并对其基因特征、推导的氨基酸序列进行了研究分析。结果显示,在分类地位上OH99株归属于O型FMDV,与OTY TW/97具有较高的同源性,而与其他参考毒株的差异性比较大,而且在基因组功能未知区域和3A编码区域具有两处明显的基因片段缺失现象,其中3A编码区缺失30nt,与OTY TW/97株相同,但功能未知区域的缺失状况与OTY TW/97稍有差异。根据VP1基因序列,对OH99株与参考毒株进行了系统发生树分析,分析结果表明OH99株与0TY TW/97株在同一基因型内,其遗传关系最近,而与其毒株遗传关系较远。  相似文献   

19.
西洋梨水孔蛋白基因家族的全基因组鉴定及表达分析   总被引:1,自引:0,他引:1  
水孔蛋白(AQPs,aquaporins)是高效转运水分子的膜内在蛋白,具有丰富的多样性,在调控植物的水分关系中有重要作用。本研究利用西洋梨(Pyrus communis L.‘Bartlett’)基因组数据库,通过生物信息学手段鉴定西洋梨PcAQPs基因家族成员;并利用MEGA 6.0.5软件,采用邻接法构建系统发育树;利用GSDS 2.0软件进行基因结构分析,MEME程序进行Motif分析,AgBase v2.00程序进行GO分析;采用半定量RT-PCR技术研究PcAQPs基因组织表达情况。结果表明,西洋梨基因组中共有54个PcAQPs家族成员,均含有AQP特征结构域和保守的Motif基序,根据基因结构及系统进化分析可分为PIP、TIP、NIP和SIP等4个亚家族。不同基因间结构差别较大,但聚类关系较近的基因其结构类似。GO分析发现,多数PcAQPs基因具有转运蛋白活性,参与物质转运、应激反应、发育和代谢等生物学过程,但不同亚家族成员构成的细胞组分及参与的生物学过程具有明显差异。半定量结果表明,大多数PcAQPs基因在根、茎、叶和果实中均有表达,而且不同基因家族、不同基因间的组织表达模式存在差异。该研究为今后西洋梨PcAQPs基因的克隆和功能分析奠定了基础。  相似文献   

20.
全基因组基因-基因相互作用研究现状   总被引:2,自引:0,他引:2  
沈佳薇  胡晓菡  师咏勇 《遗传》2011,33(8):820-828
复杂疾病目前正在全球范围流行, 极大地影响人类的健康。研究发现, 复杂疾病的性状受到多个位点的相互作用影响。目前的全基因组关联分析(Genome-wide association study, GWAS)仅仅解析单个SNP位点对疾病易感性的贡献, 单纯依靠这一种策略并不能在寻找复杂疾病的病因上得到根本性的突破。基因-基因相互作用可能是复杂疾病致病的主要因素之一。针对这一点, 科学家已经提出了一些检验基因相互作用的算法, 包括惩罚logistic回归模型、多因子降维(Multifactor dimensional reduction)、集合关联法(Set-association approach)、贝叶斯网络(Bayesian networks)、随机森林法等。文章首先对目前这些方法做了综述, 并指出了其中的不足, 包括计算复杂度太高、假设驱动、数据会过度拟合、对低维数据不敏感等, 进而简述了一种由笔者所在实验室开发的基于GPU的研究基因相互作用的算法, 该算法复杂度低, 不需要任何假设, 没有边际效应, 有很好的稳定性, 速度快, 适用于进行全基因组范围内的基因-基因相互作用计算。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号