
avona分析基础知识(日文).docx
10页分散分析 (analysis of variance: ANOVA)ANOVA とはANOVA とは、多群の比較に使用する検定法である例えば A,B,C の3群について比較するのに、AB 間、AC 間、BC 間をそれぞれ二標本 t 検定するのでなく、3群まとめて検定するのであるなぜ、多群において全ての組み合わせで t 検定をしてはいけないか例えば3群の比較では、3通りの組み合わせがあるが、それぞれに危険率 5%で二標本 t 検定を行った場合、「少なくとも一つたまたま有意差あり」となる確率は 1-(1-0.05)*(1-0.05)*(1-0.05)で計算され、危険率は 14%となってしまう5%の危険率のつもりが、実際には危険率が上昇してしまっているのであるこの対処法のひとつは、多重比較法を用いることであるたとえば、Bonferroni 法は有意差水準を 0.05/3=0.017 にして検定するBonferroni 法は多重比較法のひとつであるが、その他にもいくつかの多重比較法がある多重比較の項参照もうひとつは、まず3群間に有意差があるかどうか検定(ANOVA)し、もし差があった場合にはどの群間に差があるかを多重比較する.「分散分析の帰無仮説は”各群の平均値は全て等しい”」であるが、医学統計ではどの群とどの群の間に有意差があるかを知りたい場合が多い。
その場合には、分散分析を用いず直接群間の比較を行う多重比較法を用いた方がいいように思われるたとえば、コントロール群と A 薬、B 薬、C 薬投与群を比較する場合であるANOVA の検定法分散分析の検定法は、群間変動と郡内変動の比を検定することになるたとえばA群、B群、C群について ANOVA を使用するとすると、各群間の分散値(総平均と各群の平均より求める)と群内変動の分散値(それぞれの群間の平均値と測定値から求める)を求め、その比で検定する例)A,B,C3群間に有意差があるかどうかを一元配置分散分析(One-factre ANOVA)で検定するA B C15 20 3020 25 3520 24 308 18 3320 18 20通常、ANOVA を施行すると分散分析表が表示される例えば Stat View では下記のような表が作成される変動要因平方和 自由度 分散 分散比 p 値群間変動437.2 2 218.6 9.1 0.0039郡内変動 288.4 12 24.0分散比 17.3 は,群間変動の分散値 273.1 と郡内変動の分散値 15.7 の比であり、これを F 分布表より検定することになる。
ここで P 値0.004 で有意差がみられたわけであるが、ではどの群とどの群に有意差があるかどうかは多重比較(ポストホックテスト)を行わなければならないこれは、一元配置分散分析の分散分析表であるが、二元配置分散分析表は当然、異なったものになるこれは3群間の一元配置分散分析をおこなった例であるが、群間の比較は post hoc テストが必要になる例えば Fisher の PLSD では下記のようになり、AC 間と BC 間に有意差があることがわかる多群の比較に用いられる検定法にはどのようなものがあるか(なお、ノンパラメトリック法の Kruskal-Wallis 検定、Friedman 検定は分散分析ではない)1)一元配置分散分析(対応なし)One-way Factorial ANOVA2)一元配置分散分析(対応あり)One-Way Repeated-Measures ANOVA3)Kruskal-Wallis 検定4)Friedman 検定5)二元配置分散分析(対応のない因子と対応のない因子)Two-way Factorial ANOVA6)二元配置分散分析(対応のある因子と対応のない因子)Two-way Repeated-Measures ANOVA7)二元配置分散分析(対応のある因子と対応のある因子)8)繰り返しのない二元配置分散分析9)共分散分析10)多変量分散分析こんなに複雑ではなかなか理解するのは難しい。
実際には、スタディする前にどういう検定が必要か決めておき、データを入力する段階でその検定にあったデータ入力をするようにしなければならない入力法をまちがえると、後から全部入力しなおさなければならなくなることはよくあるよく使う分散分析について簡単に解説しておく(以下の例は,架空のデータで,症例数はかなり少なくしてある)1)One-way Factorial ANOVA と Kruskal-Wallis 検定例えば、3つの地域で出生した児の臍帯血のヘモグロビン値に差があるかどうかを検定したい場合には、対応のない一元配置分散分析を施行する対応なしとは、A地域、B地域、C地域の間に対応がないということであるノンパラメトリック法では Kruskal-Wallis 検定を行うA地域 B地域 C地域15.6 16.4 16.214.6 15.4 16.116.9 17.0 15.213.9 17.6 14.816.3 15.4 12.3この検定で、もし有意差があった場合にどの群間に有意差があるかどうかは多重比較(post-hoc test)を行う最初から多重比較を行う場合には、Bonferroni 法か Tukey 法を用いる。
ノンパラメトリック法は Bonferroni 法か Steel-Dwass 法を用いる2)One-Way Repeated-Measures ANOVA と Friedman 検定エリスロポエチンを投与した場合にヘモグロビンに変化があるかを検定したい場合、対応のある一元配置分散分析を施行するノンパラメトリック法では Friedman 検定対応があるとは、つまり前値と1週目、2週目の値が同一人物で繰り返し測定されているということである対応のない一元配置分散分析より有意差がでやすくなる前 1週目 2週目A 8.5 9.5 10.0B 7.0 7.8 9.0C 6.8 7.5 8.0D 6.8 6.9 7.5E 7.0 7.8 8.5注)3群を3つの組み合わせで一標本 t 検定するのは大きな間違い(Bonferroni 法で補正すればよい) また、同一人の測定値が1週目や2週目に複数入っていたりするデータを one-way Factorial ANOVA で検定するのも誤りこの場合の多重比較はすべての組み合わせによる多重比較をやってもあまり意味がないところで、この One-Way Repeated-Measures ANOVA は、教科書によれば繰り返しのない2元配置分散分析に分類されていることがある(例えば、「バイオサイエンスの統計学」。
このふたつの統計法は同じあるから、どちらで検定してもよいこういった、時系列データについては、実際にはコントロールと各時点をt検定で比較している場合が多いようであるいつから有意差が出てくるかという傾向がわかればいいということであろうか3)Two-way Repeated-Measures ANOVA上の例で、コントロールをたててスタディするとより正確な結果が得られるつまり対応のある因子と対応のない因子の二元配置分散分析であるりこの検定では、投与群と非投与群でヘモグロビンに有意差があるとでても、エリスロポエチン投与がヘモグロビンの変化に影響を与えたとはいえない両者は最初から平行関係にあったかもしれないからであるこの場合には、エリスロポエチン投与によりヘモグロビン値の変化のパターンが異なることを示さなければならないつまりエリスロポエチン投与とヘモグロビン値の変化の間に交互作用があるかどうかが問題になるこのパターンのデータに ANOVA を使用するかというと、実際にはあまり使われない各時点でt検定を行い、どの時点からどの時点まで有意差が出現するかわかった方が理解しやすいためだと思われる多重性の問題が起こるが、むしろどういう傾向があるかを知ることの方が有用な情報になるからと思われる。
なお、この例で投与群と非投与群の対象を同一人で行うと対応のある因子と対応のある因子の二元配置分散分析となるつまり下表のような場合であるエリスロポエチン 前 1週目 2週目投与 A 8.5 9.5 10.0投与 B 7.0 7.8 9.0投与 C 6.8 7.5 8.0投与 D 6.8 6.9 7.5投与 E 7.0 7.8 8.5非投与 A 7.0 7.2 7.1非投与 B 7.5 7.4 7.9非投与 C 6.8 6.9 7.0非投与 D 7.5 7.2 7.3非投与 E 7.2 7.6 7.2対応ありとは、反復測定(repeated mesure)のような因子をいう反復測定とは、同じ人で時間をずらして何回か測定すること繰り返しなしとは、例えば異なる4人に対して一回ずつ測定する場合例えば、3)の例は繰り返しなしである繰り返しありとは、例えば異なる4人に対して2回以上測定する場合Kruskal-Wallis 検定は一元配置分散分析(対応なし)のノンパラメトリック版Friedman 検定は、一元配置分散分析(対応あり)とのノンパラメトリック版と考えてよい(nonparametric Two-Way ANOVA として使われることもある)。
パラメトリックとノンパラメトリックで分類するとノンパラメトリックテストには1)独立2群の比較 Mann-Whitney U-test2)独立3群以上の比較 Kruskal-Wallis test3)対応のある2群の比較 Wilcoxon signed rank test4)対応のある3群以上の比較 Friedman testパラメトリックテストには1)母集団の平均値との比較 One Sample t-test2)対応のない2群の比較 Unpaired t-test3)対応のある2群の比較 Paired t-test4)一元配置分散分析(対応なし) One-way Factorial ANOVA5)一元配置分散分析(対応あり) One-Way Repeated-Measures ANOVA6)二元配置分散分析(対応のない因子と対応のない因子)Two-way Factorial ANOVA7)二元配置分散分析(対応のある因子と対応のない因子)Two-way Repeated-Measures ANOVA。












