静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

Excel VBAで分析ツールの分散分析に等分散の検定とグラフも足してみた1

前々回までに、エクセルExcel分析ツールの一元配置分散分析にTukey–Kramer法による多重比較をちょい足ししたわけですが、
Excel VBAで分析ツールの分散分析に多重比較をちょい足ししてみた1
Excel VBAで分析ツールの分散分析に多重比較をちょい足ししてみた2
各種統計ソフトには、等分散の検定結果やグラフが出力されるものが多いようですので、私も作ってみることにしました。

 

と、その前に、

自分が作った多重比較のプログラムが正しく計算できているか気になったので、で検証してみました。

やり方は以下の記事を参考にさせていただきました。

で、での計算結果は以下のとおり。*1

Rcmdr> vx=c(80,75,80,90,95,80,80,85,85,80,90,80,75,90,85,85,90,90,85,80,75,70,80,85,90,75,85,80,80,75,80,75,70,85,80,75,80,80,90,80,80,80,80,90,95,85,95,90,85,90,95,85,98,95,85,85,90,90,85,85)

Rcmdr> fx=factor(rep(c("A", "B", "C"), c(20, 20, 20)))

Rcmdr> TukeyHSD(aov(vx~fx))
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = vx ~ fx)

$fx
     diff         lwr        upr     p adj
B-A -4.50 -8.71114131 -0.2888587 0.0336261
C-A  4.15 -0.06114131  8.3611413 0.0542391
C-B  8.65  4.43885869 12.8611413 0.0000210

私のプログラムの計算結果がこちら。
f:id:cyclo-commuter:20180111095451j:plain
のTukeyHSD関数はp値を返しています。
ワクワク(A)-モグモグ(B) 5%有意
ワクワク(A)-パクパク(C) 5%に近い値で有意差なし
モグモグ(B)-パクパク(C) 1%有意

うん、大丈夫そうですね、ホッ。

 

等分散性の検定

2群の等分散性の検定は2群の分散の比でF検定するわけですが、3群以上の場合は、各群のうち最大の分散と最小の分散の比Fmaxを求めて検定する由。*2
Excelの関数で作成すると、こうですね。
f:id:cyclo-commuter:20180111160731j:plain
自由度は繰り返しの数-1だから、こう。
f:id:cyclo-commuter:20180111160842j:plain
もう一つの自由度は、=INDEX(B5:B7,MATCH(MIN(E5:E7),E5:E7,0))-1 になります。

で、任意の有意水準αとp=F.DIST.RT(Fmax , 自由度1, 自由度2)を比較して、帰無仮説「2群の母分散は等しい」が棄却されなければ、分散分析も有効とみなします。

ただ、多くのWebサイトでこの手順(等分散の検定→分散分析)が説明されていますが、それに異を唱える方もおられます*3。その方によると、分散分析の前に等分散の検定をするのは理論的に間違い(!)だが、する場合は、有意水準αを0.1~0.5の範囲に引き上げるべき、なのだそうです。サンプルデータ*4のp値は0.46でしたから、有意水準を0.5とすると等分散の帰無仮説は棄却されてしまいますね。うーむ。

ま、今回は 棄却されなかったということで、ひとつ・・・

*1:私はR Studio と Rコマンダーを使ってます。

*2:http://www2.hak.hokkyodai.ac.jp/fukuda/lecture/SocialLinguistics/html/09anova.html

*3:http://www.hs.hirosaki-u.ac.jp/~pteiki/research/stat/qa/qadiff.htmlのA6

*4:引き続き『統計学がわかる』第6章から拝借しています。