排序方式: 共有1条查询结果,搜索用时 0 毫秒
1
1.
动物线粒体基因组发生局部串联复制后,涉及区域具有多基因拷贝、假基因化、大量插入缺失的特点,难以排序和构建基因树。而不依赖排序的聚类方法理论上可用来归纳和展示这类序列的差异,但未见相关评估和运用。本研究选取棘腹蛙Quasipaa boulengeri 19号个体,以3类常用的基于特定长度(k)子序列集的非排序算法,依次设k值为4、6、8……20,对其轻链复制起点邻近复制区域583~695 bp的序列进行聚类。构建相同个体线粒体1 518 bp蛋白编码序列最大似然树为参照,计算和考查两者间拓扑结构距离和差异。所评估的28种算法中,半数可在主要为8的特定k值下产生和最大似然树拓扑结构相差仅2个节点(11.8%)的聚类树,部分算法在不同k值下均表现不佳,较小的k值(4)适合解析差异程度相对较高的序列间关系。这些结果例证了动物线粒体重复序列非排序聚类的可行性,其中的算法、k值理想组合可能适合类似系统。建议对其他类型的复制重排系统进行类似评估。 相似文献
1