Clustal是一款广泛使用的
生物信息学计算机程序,用于多重序列比对。Clustal系列包括多种版本,随着算法的发展,这些工具的名称也随之变化。Clustal工具及其算法在各自类别中都有详细分析。在侧边栏中列出的操作系统并非所有Clustal工具的完全支持,但Clustal Omega具有最多的操作系统支持。
软件简介
Clustal系列软件是生物信息学中用于多序列比对的重要工具。它可以用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列的二级结构与三级结构,确定PCR引物,以及在分子进化分析方面均有很大帮助。Clustal包括ClustalX和ClustalW(前者是图形化界面版本,后者是命令界面),是
生物信息学常用的多序列比对工具。
Clustal系列软件的历史始于1988年,由Des Higgins创建了最初的Clustal程序。随后,ClustalV、ClustalW、ClustalX、Clustal2和Clustal Omega等版本相继发布,每个版本都在算法的准确性、效率和用户界面上进行了改进。Clustal Omega是Clustal家族的最新补充,提供了显著增长的可扩展性,使数以十万计的序列能够在几个小时内排列,并且支持多处理器使用。此外,从流行的衡量基准角度看,其质量比以前的版本有巨大的改善。
Clustal软件的所有变体都使用一种渐进构建多序列比对的启发式方法。这种方法通过整体分析序列,然后利用UPGMA/Neighbor-joining方法生成距离矩阵,从矩阵中的序列得分计算引导树,然后逐渐根据相似性顺序对序列进行比对,从而生成多序列比对。Clustal通过三个主要步骤创建多序列比对:使用渐进比对方法进行成对比对、创建引导树(或使用用户定义的树)、使用引导树进行多序列比对。
Clustal程序接受多种输入格式,包括NBRF/PIR、FASTA、EMBL/Swiss-Prot、Clustal、GCC/MSF、GCG9 RSF和GDE。输出格式可以是以下之一或多个:Clustal、NBRF/PIR、GCG/MSF、PHYLIP、GDE或NEXUS。
脱氧核糖核酸/
核糖核酸比对和
蛋白质比对显示相同的符号,因此*(星号)符号对两者都有用,其他一致性符号应在DNA/RNA比对中忽略。
可以调整许多设置以适应不同的情况。主要参数是间隙开启惩罚和间隙延伸惩罚。ClustalW和ClustalX的第2版,即Clustal2,是这些工具的更新和改进版本,预编译为多种操作系统,如
Linux、Mac OS X和
Windows(XP和Vista),设计旨在使网站更有组织和用户友好,同时更新源代码到最新版本。
CLUSTALW:命令行接口,使用渐进比对方法,首先对最相似的序列进行比对,然后逐渐对最不相似的序列进行比对,直到创建全局比对。ClustalW是基于矩阵的算法,而T-Coffee和Dialign等工具是基于一致性的。ClustalW具有相当高效的算法,与其他软件竞争力强。
ClustalX:一个图形用户界面,提供了直观的操作方式,使用户能够更容易地进行序列比对和分析。
Clustal Omega:Clustal Omega 是Clustal家族的最新补充。在以前的版本基础上,它提供了一个显着增长的可扩展性,使数以十万计的序列在只有几个小时内排列。它也将使用多个处理器包含其中。此外,从流行的衡量基准角度,其品质比以前的版本有巨大的改善。
描述Clustal软件的论文被引用非常多,其中两篇是有史以来被引用最多的论文之一。该软件的最新版本适用于
Windows、Mac OS和
unix/
Linux。它也常通过其主页上的网页界面或由
欧洲生物信息学研究所托管来使用。
发展历程
Clustal 软件有许多变体,所有这些变体如下:
名称由来
初始程序中的引导树是通过UPGMA聚类 分析成对比对构建的,因此命名为 CLUSTAL。1988 年的前四个版本使用阿拉伯数字(1 至 4),而第五个版本Des Higgins在 1992 年改用罗马数字 V。1994年和1997年,在接下来的两个版本中,使用了字母V后面的字母,并使其对应于加权的W和X窗口的X。选择
欧米茄这个名称是为了标志着与之前名称的变化。
参考资料
Warning: Invalid argument supplied for foreach() in
/www/wwwroot/newbaike1.com/id.php on line
362