分析。评估一个次优化的似然值对于最优化模型中的正规的误差分布极为重要。在理想情况下,误差曲线被假定为一个chi-平方分布,因此实验统计值应该是最优化数值和实验数值之差的两倍,而其自由度则是不同的参数的数目。
应用chi�平方实验来选择系统发育进化树存在不少问题,尤其是因为“参数空间的不规则性”(Z.Yang et al., 1995),但是如果取代模型之间的参数数目已知的话,这个方法可以用来评估取代模型的最优性。一旦我们用上述最大似然程序评估了一个取代模型和进化树,我们就可以用较少的参数对这个进化树进行评估(比方说,把位点内的速率设置为相同:图9.7)。
Kishino�Hasegawa实验
如果给定了伴随着决定进化树误差的不确定性,另外一个方法就可以决定与比对中每一个位点相联系的取样误差(Kishino and Hasegawa, 1989)。这个程序在PAUP中执行,可以用来测试一个特定的次优化的ML或者MP拓扑结构同最优化的拓扑结构相比是否显著不同,当然必须假定用来产生最优化的进化树的模型是正确的。这个方法不能被用来评估任意选择的拓扑结构:因为不同的拓扑结构可能会拥有不同的似然功能,在某个模型下,一个统计学意义较差的进化树在另一种模型下,其统计学意义可能会变得很好。可以把本方法同带参数的自引导方法结合起来(模型和进化树已经预先最优化了),以避免这个问题(见Sullivan et al., in press)。
约束进化树搜寻
评估进化树的一个最有效的方法是比较无约束搜索和有约束的搜索,约束条件是必须搜索同一个特殊拓扑结构相联系的最优化进化树。除了比较简单分值外,还可以把约束进化树同排列实验、似然比例实验、Kishino�Hasegawa实验以及带参数的自引导评估方法结合起来。
上一篇:多序列比对的实际应用 下一篇:利用蛋白质序列的预测方法
共45页: 上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] 21 [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] 下一页