11/28/2006

11.7.1多重變數比較

11.7.1Multiple Comparisons

有些時候光比較眾處理之間有無差異仍然不足,有時必須知道那一對有顯著的差異。當然此時也可以藉助一連串的t-test逐對比較,但這種方式仍有缺點。在做t-test時,通常會先計算t的過程中與一特定值比較。此值之選定通常是認為各處理之均值超過此值很小(例如5%)。當均值有顯著差異時,統計的數據超過該值的機率反而變大,容易造成誤判。利用MULTCOMPARE指令可以解決此問題,並可執行平均值之多重比較。其語法如下:

COMPARISON = MULTCOMPARE(stats)

參數stats為統計資料,可以直接得自 anova1, anova2, anovan, aoctool等函數之輸出值,其輸出參數COMPARISON則是一個矩陣,每一列中具有五行,第 1-2行是被比較之兩樣本編號,第 3-5 則分別為其差異之最低值、估計值及最高值。

>>COMPARISON = MULTCOMPARE(stats)
COMPARISON =
1 2 2.4953 10.5 18.505
1 3 4.1619 12.167 20.171
1 4 6.6619 14.667 22.671
1 5 -2.0047 6 14.005
2 3 -6.3381 1.6667 9.6714
2 4 -3.8381 4.1667 12.171
2 5 -12.505 -4.5 3.5047
3 4 -5.5047 2.5 10.505
3 5 -14.171 -6.1667 1.8381
4 5 -16.671 -8.6667 -0.66193



以第二列為例,其值為 [ 1  3  4.1619  12.167  20.171],表示第一組之平均減去第三組之平均為12.167,而在95%信任水準下,其上下差距為[4.1619  20.171]。這個區間不包括零,故可以認定這兩組之平均有顯著差異。實際上由圖比較,可以更清楚分辨。由圖所示第一組與第二、三、四組有非常明顯的差別,若比較第四組與第五組,其差異也相當明顯。其他組之間則沒有太顯著的差異。在實際圖的應用上,若用滑鼠點上某一組,則具有顯著差異的會顯示出來,不顯著者則呈灰色,如此可以清楚分辨。

除上述之stats參數外,實際上後面亦可依需要另外附加,其格式如下:

COMPARISON = MULTCOMPARE(STATS, 'PARAM1',val1, 'PARAM2',val2,...)

其後添加之'PARAM1'及val1等參數可以是如下之設定:

'alpha' :顯著水準(預設值0.05)
'displayopt':估計圖顯示開關 'on' (預設)或 'off'。
'ctype' :使用之臨界值,如: 'tukey-kramer' (預設), 'dunn-sidak', 'bonferroni','scheffe'等,可以輸入兩個以上,以空白分隔。
'dimension' 預設值1。如 [1 3]為第1及第3之預測值。
'estimate' 選擇估計法進行比較。如:
anova1: 比較類別均值
anova2: 'column' (預設)或 'row' 平均。
anovan: 比較樣本邊界平均值。
aoctool: 'slope'(預設), 'intercept',或 'pmm' 。
kruskalwallis: 欄位平均值。
friedman: 欄位均值。

輸出參數:

[COMPARISON,MEANS,H] = MULTCOMPARE(...)

左邊除前述之comparison參數外,可加入 MEANS,等於欄位估計量及標準差,屬矩陣型式,其後 H則為圖握把。