[吉田ホーム>生物統計学]
以下は「生物統計学」の演習ノートです.農学や生物学の大学院程度までの学生に
とって必要かつほぼ充分な内容になっており,理屈はともかく,本テキストに従え
ば当面直面する問題の処理ができるはずです(多変量解析は除く).

各課題の最後に練習問題を付けてあります.独学する人は必ず解いて下さい.将来
は統計ソフトを利用するようになるでしょうが,一度は手計算をして下さい.
学生用練習問題はこちら.

内容は特に記す以外,“スネデカー 統計的方法 改訂版,畑村又好・奥野忠一・
津村善郎訳,岩波書店(1966),pp.478”に主によっている.
 

生物統計学目次

A.処理による差,標本間に差があるか? 1.2群の間の比較(t検定を行う)   課題番号 1)対になっているデータの差の検定・・・・・・・・・・・・・・・・ 有意差とは  2)対になってない (1)群内個体数が等しい2群の比較・・・・・・・・・・・・・・・・ (2)群内個体数が異なる・・・・・・・・・・・・・・・・・・・・・ 2.3処理以上の比較(分散分析と平均値間の多重検定) 1)反復がブロック化されていない (1)反復数が等しい・・・・・・・・・・・・・・・・・・・・・・・ 多重検定法 (2)反復数が異なる   ・・・・・ (説明はあり) 2)反復がブロック化されている(乱塊法) ・・・・・・・・・・・・ 3.2種類の処理条件を同時に比較する(二元配置.分散分析と多重検定) 1)反復がない・・・・・・・・・・・・・・・・・・・・・・・・・・ 2)反復がある(交互作用の検定ができる) (1)反復がブロック化されていない・・・・・・・・・・・・・・・・ (2)反復がブロック化されている・・・・・・・・・・・・・・・・・ 交互作用 4.複雑な反復をする 1)ラテン方格法(各列と行に処理を配置) ・・・・・・・・・・・・ 2)分割区法(主処理区と副処理区に分割)  ・・・・・・・・・・・10 B.2変数の間の関連性を表す(回帰と相関)・・・・・・・・・・11 正規分布 高度の有意と密接 C.観察度数が理論度数に適合するか?(カイ平方χ^2検定) ・・12    ──────────────────────────────      (以上でとりあえずは充分であろう. 以下課題はナシ) D.追加   ・・・・・・・・・・・・・・・・・・・・・・・・・13 1)年次含む二元配置  ・・・・・・・・・・・・・・・・・・・・・1) 2)3元配置分散分析  ・・・・・・・・・・・・・・・・・・・・・2) 3)ノンパラメトリック法  (1)2処理の順位による検定(符号検定) ・・・・・・・・3)−(1)  (2)対になった差の順位検定(Wilcoxonの順位検定)・・・・3)−(2) (3)対でない測定値の順位検定(Mann-Whitneyの方法)・・・3)−(3) (4)Spearman による順位相関   ・・・・・・・・・・・・3)−(4) 4)世論調査誤差の推定  ・・・・・・・・・・・・・・・・・・・−4) 5)乱塊法で欠測値の処理        (1)1つのとき  ・・・・・・・・・・・・・・・・・・・5)−(1)  (2)2つのとき  ・・・・・・・・・・・・・・・・・・・5)−(2) 6)分散均一性の検定 ・・・・・・・・・・・・・・・・・・・・・・6) 7)分布の正規性検定 ・・・・・・・・・・・・・・・・・・・・・・7) 8)データの変換   ・・・・・・・・・・・・・・・・・・・・・・8)  E.その他    ・・・・・・・・・・・・・・・・・・・・・・・1410%水準 分散分析図解 表計算ソフト利用法 σ/レンジから有意差検出  重回帰(多変量解析)極概論 同じ誕生日の話
☆いくつかの重要な母数  標本平均 M (Mean) = 狽/ n  平方和 SS = 煤ix−M)^2= 狽^2−(狽)^2/ n = 狽録2−CF (平均からの偏差の平方和)    ここで,CF = (狽)^2/ n (CF;補正項)  平均平方 MS = 煤ix−M)^2 / (n −1) ;母分散 σ^2の推定値    ここで n - 1;自由度 df   標本標準偏差 S = √(ms) ;標準偏差 σの推定値  平均値の標準偏差 SM = √(ms / n) = S /√n ;標準誤差 σ/√nの推定値 ☆その他 1)以後本テキストでの √ は頭だけでも後まであるとする.^2 は二乗. 2)例題の表計算ファイルをリンクしてます(本文中ではExcelに).   答の確認に使ってください.ファイル一覧はここで,ExcelとCalcがある. 3)本文中では,t値,F値,相関係数の有意水準,χ^2 値などは抜粋したのを   載せている.表示以外を調べるのはここで.

課題1.対になった2群のデータの差の検定(t−検定)

1枚の葉の半分ずつに病菌1と病菌2の接種試験をして,その結果の病斑の数  を8個体でみた.病菌の間で発病に差があるか.  帰無仮説;差がないM=0   帰無仮説とは,ある判断をするために立てられた仮説

──────────────────────────────  個体番号   1 2 3 4 5 6 7 8  和  平均 ──────────────────────────────   病菌1 9 17 31 18 7 8 20 10 120 15   病菌2   10 11 18 14 6 7 17 5  88 11   差(1-2):x -1 6 13 4 1 1 3 5 32 4 ──────────────────────────────

<差(病菌1-2)>の; 平均値 M = 4 平方和 ss = (x- M)^2 = 狽録2-(狽)^2 / n       = (-1)^2 + 6^2 + ・・・ + 5^2 - 32^2 / 8 = 130 平均平方 ms = 平方和 / (n - 1) = 130 / 7 = 18.57 (n-1=7;自由度,df) 平均値の標準偏差(標準誤差) SM = √(ms/n) = √(18.57 / 8) = 1.52 検定のためにt値を以下のように計算する        t = M / SM = 4 / 1.52 = 2.63   t表の通常5%(又は1%)での値で判断する. 自由度df = n - 1 = 7で,t0.05=2.365 < t=2.63

t表抜粋 ──────────────────────────────── df 1 2 3 4 5 6 7 8 9 10 ──────────────────────────────── 5% 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 1% 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.25 3.169 ────────────────────────────────

☆つまり,これより大きいtの値を得る確率は 0.05 以下で,「観測値が M = 0 の帰無仮説をもうけた母集団から任意抽出されたものとしては稀にしかあらわれ ず,この帰無仮説を棄却しても,誤る確率は5%以下である」. または, ☆「2処理の平均値間に差があるとして,誤る確率は5%以下である」.  通常の表現は,計算したt値が別表の5%水準t値より大きければ, ☆「2処理の平均値間に5%水準(有意水準,危険率)で有意差がある」.  1%水準t値より大きければ「1%水準で有意である」.  計算したt値が別表の5%水準t値より小さければ,5%水準での有意差は ない,とする(差がないときは,1%水準ではないとの判断は通常しない). 問題1 3 3 5 5 7 7 6 5 3 5 4 4 3 1 2 4 答え;Xm,SS,MS,Sxm,t値 = 1.88, 46.88, 6.70, 0.91, 2.049 計算したt値< df=7のt値2.365で,有意差なし. 問題2 7 5 7 4 6 3 6 7 1 5 1 5 3 2 4 3  ;t値= 2.84 .5%水準で有意差あり. 問題3 6 7 5 5 4 6 6 7 4 4 3 1 3 2 2 4 1 2 4 4  答えなし  対になった2群t検定のエクセルファイル

[数値例] 差 x が,1, 2, -1, 0, 3, 2, 1, 1, 2 だったとする.頻度分布は;  * +   * * * * * * *   ───────────X -1 0 1 2 3 4    M = 1.222,ms = 1.44 t = 3.050 * (5%水準で有意) 2処理間の差は有意である. 1.実験誤差(分散)が大きくなると(2の + を4に移動する), * * * * * * * * + ───────────   -1 0 1 2 3 4   M = 1.444,ms = 2.27  t = 2.871 *  差の平均値は大きくなってもt値は下がる 2.誤差がもっと大きくなると,    *       * *     * * * * * + ────────∬──  -1 0 1 2 3 4  8 M = 1.888,ms = 6.61 t = 2.203 ns (not significant) 差は有意でなくなる.  3.上と同じ精度でもデータ数が倍になれば,   *   *     * *      * *        * * * * *    *     * * * * *    *    ─────────∬── -1 0 1 2 3    8       M = 1.888,ms = 6.22 t = 3.212 ** (1%水準で有意)    同じ平均値でも自由度多いと差が有意となる.  4.データが少ないと,     * *   + * * * *  ───────────   -1 0 1 2 3 4    M = 1.142,ms = 1.80   t = 2.247 ns     自由度少なく有意な差とならない.  5.どれ位なら有意になるか,             + * *      * * * * ───────────   -1 0 1 2 3 4    M = 1.285,ms = 1.23 t = 3.057 * 6.さらに誤差が小さいと,       + * * * * * * ────────── -1 0 1 2 3 4 M = 1.285,ms = 0.57 t = 4.5 *** > t0.005=4.317 差は非常に高度に有意(0.5%水準)となる.

このように,同じ平均値の差でも誤差(ばらつき)の大きさやデータ数で有意 性は違ってくる.

有意差;significant difference

“有意な”とは,差がホントであるかどうかを判断するとき,感覚的な判断でな く,ある種の(ここでは統計的な)論理から判断して言える,の意味である.  t値は分子が差,分母がデータのばらつきであった.差が大きいとき,ばらつき が小さいとき計算したt値(後ででてくるF値も)は大きくなる.その値がある基 準値(t表の値)より大きくなれば,その差は有意であると判断してもよかろう, というわけである. それら基準値をどう割り出したかは気にする必要はない.まあ,信じてよろしい. データ数(自由度)でその基準値は違っていて,データ数が多くなれば基準値は 小さくなり,有意差を検出しやすくなる. なお,危険率の5%という値は一見大きいようにも見えるかもしれないが(事実, 多分医薬関係ではもっと低い値を使っているであろう),農業実験では古くから 使われてきた値で,おおかたの合意を得ており,経験的にも妥当な値と思う.
始めに戻る

課題2.対になってない,大きさの等しい2群の比較 (t検定)

 ランダム(無作為)に選んだ11羽ずつのヒナに,一方は飼料 A,もう一方は  飼料 B を与え,この2組を同じ囲いに一緒に入れ後日体重を測った.  飼料間に差があるか.

───────────────────────────────────── 飼料(処理) ヒナの数(n) 体重                和 ─────────────────────────────────────   A  11    57 120 101 137 119 117 104 73 53 68 118 1067   B  11   89 30 82 50 39 22 57 32 96 31 88   616 ───────────────────────────────────── ────────────────────────   飼料   ヒナの数 自由度 平均体重 平方和  ────────────────────────     A   11   10    97   8472      B    11   10    56   7748             和 20  差 41 和 16220 ────────────────────────

平方和 A = 57^2 + 120^2 +・・・+ 68^2 + 118^2 - 1067^2 / 11 = 8472 平方和 B = 89^2 + 30^2 +・・・+ 31^2 + 88^2 - 616^2/ 11 = 7748 こみにした平均平方 ms = 平方和の和 / (2×(n-1)) = 16220 / 20 = 811 平均値の差の標準偏差 SM = √(2×ms / n) =√(2×811 / 11) = √147.5 = 12.14 t表から,t値は t = (M1-M2) / SM= 41 / 12.14 = 3.38 df=20で   t = 3.38 > t0.01= 2.845 すなわち,「飼料A,Bの平均値間の差41は1%水準で有意である」 (勿論,t = 3.38 > t0.05 = 2.086 であり,5%水準でも有意である) 問題1 6 6 10 9 14 14 11 6 10 8 7 6 1 3 ; t値= 2.44 * 問題2 12 14 9 14 8 12 6 12 14 2 1 9 2 9 6 4 8 5 ; No answer  計算エクセルファイルは課題3の大きさの異なる2群比較のを使用可 始めに戻る

課題3.対になってない,大きさの異なる2群の比較 (t−検定)

 大きさをそろえるのは時に困難である.2.と同様な処理で,以下の表のよう  に個体数が異なる場合,処理間に差があるか.

──────────────────────────────────────  飼料  ヒナの数  体重           和 ──────────────────────────────────────   A  n1=12 134 146 104 119 124 161 107 83 113 129 97 123 1440   B  n2= 7 70 118 101 85 107 132 94 707 ────────────────────────────────────── ────────────────────────   飼料   ヒナの数 自由度 平均体重 平方和   ────────────────────────     A   12   11   120    5032       B     7    6   101    2552             和 17 差  19 和 7584 ────────────────────────

平方和 A = 134^2 + 146^2 +・・・+ 97^2 + 123^2 - 1440^2 / 12 = 5032 平方和 B = 70^2 + 118^2 +・・・+ 132^2 + 94^2 - 707^2 / 7 = 2552 こみにした平均平方 ms = 平方和の和 / (n1 - 1 + n2 - 1) = 7584 / 17 = 446.12 平均値の差の標準偏差 SM = √[ms×(n1+n2) / (n1×n2)]         = √[446.12×(12+7) / 12×7] = 10.04 t表でのt値 t = (M1-M2) / SM = 19 / 10.04 = 1.89       t = 1.89 < t0.05 = 2.110 ( df = 17 ) すなわち,差がないという帰無仮説は棄却されない.差があるとはいえない. 「飼料 A,B の平均値間に5%水準での有意差がない」 問題1 4 7 4 10 7 ; 6 3 4 7 4 7 0 5; 込みのMS = 5.7455 t値 = 1.390 問題2 7 8 4 10 3 6 ; 7 7 0 2 6 5 4 1 2 No answer  大きさの異なる2群比較の計算エクセルファイル 始めに戻る

課題4.3つ以上の処理の比較(分散分析) (反復はブロック化していないとき)

4種の濃度のホルモン(処理)がカルス形成量に及ぼす効果を各6個の培地上 で測定した.又は,4種の飼料を各6頭の牛(牛は無作為に選び,牛相互間で 干渉がないように配置する)に給餌して体重増を計った.処理間に差があるか? 帰無仮説;処理間(飼料間)に差がない: M1 = M2 = M3 = M4 (全部一緒)

 ───────────────────────── 濃度(mg/L) 反復   | iΣxij 平均 Mj ───────────────────────── 0.5 64 72 68 77 56 95 | 432 72 0.1 78 91 97 82 85 77 | 510 85 0.05 75 93 78 71 63 76 | 456 76 0.01 55 66 49 64 70 68 | 372 62 ────────────────────────── 全実験 | 1770 73.75 ──────────────────────────

全体の平方和 = ΣΣ(xij−M..)^2       (i:反復,j:処理)        = ΣΣxij^2 -(ΣΣxij)^2 / N (N:処理数×反復数)        = ΣΣxij^2 - CF CF(補正項) = (ΣΣxij)^2 / N 処理の平方和 = jΣ(iΣxij)^2 / n - CF (n:反復数)     誤差 = 全体 − 処理 平均平方 = 平方和/自由度 F値 = 処理の平均平方/誤差の平均平方 で計算したF値をF表の('処理'の自由度f1と'誤差'の自由度f2)の値と比較. 上記の数値例では; 自由度;全体 = 4×6 - 1 = 23     処理(f1) = 4 - 1 = 3     誤差(f2) = 全体 − 処理 = 23 - 3 = 20 全測定値の和 = 64 + 72 +・・・・+ 68 = 1770 補正項(CF) = (1770)^2 / 24 = 130537.5 全体の平方和 = 64^2 + 72^2 +・・+ 68^2 - CF = 134192 - 130537.5 = 3654.5 処理の平方和 = [(432^2 + 510^2 + 456^2 + 372^2) / 6] - CF   = 132174 - 130537.5 = 1636.5 誤差の平方和 = 3654.5 - 1636.5 = 2018 処理の平均平方 = 1636.5 / 3 = 545.5 誤差の平均平方 = 2018 / 20 = 100.9 F値   = 545.5 / 100.9 = 5.41   以上を以下の分散分析表 ( Analysis of variance, ANOVA ) にまとめる.

─────────────────────── 変動因  自由度  平方和  平均平方 F値 ─────────────────────── 全体    23 3654.5 処理     3 1636.5 545.5 5.41** 誤差    20 2018.0 100.9 ───────────────────────

f1 = 3(処理),f2 = 20(誤差)でのF表の1%値の4.94よりF値は大きいので, 「処理平均値間の差は1%水準(**)で有意である」(5%水準なら*) 全部が一緒ではない,どこかの平均値は違う. 有意でなかったら,NS(Not Significant)を付ける.

F表抜粋 (5%) ─────────────────────────────────────────── f1 (大きい方の平均平方に対する自由度) f2 1 2 3 4 5 6 7 8 9 ─────────────────────────────────────────── 1 161.4 199.5 215.7 224.6 230.2 234 236.8 238.9 240.5 2 18.51 19 19.16 19.25 19.3 19.33 19.35 19.37 19.38 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.1 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 8 5.32 4.46 4.07 3.84 3.69 3.58 3.5 3.44 3.39 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 10 4.96 4.1 3.71 3.48 3.33 3.22 3.14 3.07 3.02 11 4.84 3.98 3.59 3.36 3.2 3.09 3.01 2.95 2.9 12 4.75 3.89 3.49 3.26 3.11 3 2.91 2.85 2.8 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 14 4.6 3.74 3.34 3.11 2.96 2.85 2.76 2.7 2.65 15 4.54 3.68 3.29 3.06 2.9 2.79 2.71 2.64 2.59 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 17 4.45 3.59 3.2 2.96 2.81 2.7 2.61 2.55 2.49 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 19 4.38 3.52 3.13 2.9 2.74 2.63 2.54 2.48 2.42 20 4.35 3.49 3.1 2.87 2.71 2.6 2.51 2.45 2.39 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 ─────────────────────────────────────────── (1%) f1 f2 1 2 3 4 5 6 7 8 9 ─────────────────────────────────────────── 1 4052 4999 5403 5625 5764 5859 5928 5981 6022 2 98.5 99 99.17 99.25 99.3 99.33 99.36 99.37 99.39 3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 4 21.2 18 16.69 15.98 15.52 15.21 14.98 14.8 14.66 5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.1 7.98 7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 9 10.56 8.02 6.99 6.42 6.06 5.8 5.61 5.47 5.35 10 10.04 7.56 6.55 5.99 5.64 5.39 5.2 5.06 4.94 11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.5 4.39 13 9.07 6.7 5.74 5.21 4.86 4.62 4.44 4.3 4.19 14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4 3.89 16 8.53 6.23 5.29 4.77 4.44 4.2 4.03 3.89 3.78 17 8.4 6.11 5.18 4.67 4.34 4.1 3.93 3.79 3.68 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.6 19 8.18 5.93 5.01 4.5 4.17 3.94 3.77 3.63 3.52 20 8.1 5.85 4.94 4.43 4.1 3.87 3.7 3.56 3.46 21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.4 ───────────────────────────────────────────

計算のエクセルファイルは異反復数分散分析ので可

多重検定

処理で効果があることがわかった.次はどの平均値間に差があるかが知りたい.  平均値間のあらゆる差の検定(多重検定)をするには; 1.最小有意差(lsd)をあてはめる.通常5%水準で行う.  lsd:least significant difference t値と SM (処理平均値の標準偏差) = √(誤差の平均平方/反復数)値  から  lsd = t(0.05,誤差項の自由度) × SM × √2 を求め,これより大きければ差が有意とする. 上の例題では, SM = √(100.9 / 6) = 4.101 t(0.05,f20) = 2.086 lsd = 2.086 × 4.101 ×√2= 12.10  ただしlsdの使用は3処理以上の比較には不適とされる.  そのため,ある種のファクターを乗じた値を用いて比較するのが次の方法. 2.Duncanの多重検定  (Duncan's multiple range test)   (スネデカーではTukeyの方法)  処理平均値の標準偏差: SM = √(100.9 / 6) = 4.101 と  Dp,fの表の値から (Dp,f;Duncan の多重検定のための有意性基準値(注1)) p(注2) :  2  3  4 Dp,20 : 2.950  3.097  3.190 (誤差の自由度20の欄をみよ.注3) Dp,20×SM : 12.10 12.70 13.08 (この値より大きければ * とする)

Dp,fの表 Duncanの多重検定基準値抜粋(5%水準)  ──────────────────────── df p=2 3 4 5 6 ──────────────────────── 1 17.97 17.97 17.97 17.97 17.97 2 6.085 6.085 6.085 6.085 6.085 3 4.501 4.516 4.516 4.516 4.516 4 3.927 4.013 4.033 4.033 4.033 5 3.635 3.749 3.797 3.814 3.814 6 3.461 3.587 3.649 3.680 3.694 7 3.344 3.477 3.548 3.588 3.611 8 3.261 3.399 3.475 3.521 3.549 9 3.199 3.339 3.420 3.470 3.502 10 3.151 3.293 3.376 3.430 3.465 11 3.113 3.256 3.342 3.397 3.435 12 3.082 3.225 3.313 3.370 3.410 13 3.055 3.200 3.289 3.348 3.389 14 3.033 3.178 3.268 3.329 3.372 15 3.014 3.160 3.250 3.312 3.356 16 2.998 3.144 3.235 3.298 3.343 17 2.984 3.130 3.222 3.285 3.331 18 2.971 3.118 3.210 3.274 3.321 19 2.960 3.107 3.199 3.264 3.311 20 2.950 3.097 3.190 3.255 3.303 ──────────────────────── 米澤勝衛・佐々木義之・今西茂・藤井宏一,生物統計学, P.197,朝倉書店(1988),より.

 平均値の順に並べて(注4),以下の検定をする           引き算  差 Dp,f×SM 有意性          1位 − 4位 = 85 - 62 = 23 > 13.08  *   (p=4で比較) 1位 − 3位 = 85 - 72 = 13 > 12.70   *   (p=3 〃)  1位 − 2位 = 85 - 76 = 9 < 12.10  NS   (p=2 〃) 2位 − 4位 = 76 - 62 = 14 > 12.70  *   (p=3 〃)  2位 − 3位 = 76 - 72 = 4 < 12.10  NS   (p=2 〃)  3位 − 4位 = 72 - 62 = 10 < 12.10  NS   (p=2 〃)

とりまとめの表 ───────────────────────────────── 順位 (処理) 平均   有意差   縦線間は差なし  注 ───────────────────────────────── 1  0.1 85 対1位        │      a   a 2  0.05 76  NS 対2位     ││ → ab  → ab   3   0.5 72   *   NS 対3位  ││ bc bc 4  0.01 62  *  * NS   │ c c ───────────────────────────────── 注)Duncan の多重検定結果で,同一記号のついた平均値間には5%水準で   有意差がないことを示す.

(注1)Duncan や後述の Tukey の検定は5%水準である. (注2)p=2 は隣同士の比較で lsd に一致.p=3,4 は 2,3 階級離れた値比較. (注3)誤差の自由度 df が表にない時は一番近くて少ない df の欄をみよ. (注4)同順位があったら,どちらでもいいからとりあえず順にならべる. 縦線のかわりに記号を使うと平均値順に並べなくともよくなる.aa は 1〜2 位 間の縦棒,bb は 2〜3 位間の縦棒,cc は 3〜4 位間の縦棒の代わりである. “縦線間は差なし”だから,“同一記号間は差がない”と注に記すべきであり, “異記号間は差がある”ではない.

☆記号のつけかたの練習   例1           例2        例3 ─────────── ──────── ─────────── 1 │   a 1 │ a 1 ナ a ←つ 2 N ││ ab 2 N ││ a 2 * シ│ b け 3 * N │ナ b 3 N N │││ ab 3 * N ││ b る 4 * * *  シ │ c 4 * * N  │ b 4 * N N ││ナ b 5 * * * N │ c ──────── 5 * * * * シ c ←同 ───────────  ↑不要 ─────────── 注意:極希に N の↑→ 方向が * となることがあるが,それは N とする. 縦線がだぶった部分は不要. 縦線のかからない平均値には異記号をつける.

☆Duncan の方法でもやや甘く(有意差がでやすく)判定される.Duncan の方法で  検定し,方法にクレイムがついたら,Tukey(例;スネデカー表10.6.1)の方法 をとる.表が違うだけでやり方は同じ. Duncan にクレイムを付けて,lsd や標準偏差で有意差を言うことを許容してい る場合があるが,それはおかしい.もし前者がいけないと言うなら,lsd や標準 偏差ではさらに不適となる.  Tukey でもクレイムついたら,別のソフトを探すか,lsd を付記して,“有意差”  の表現は避け,○と○間の差○○は lsd より大きかった,といえばよかろう.  この手計算による多重検定の記号の付け方を習熟したら大いに自慢してよろしい.  なぜなら,多重検定の記号は通常コンピュータ任せで,内容を理解しながらして  いる人は少数派であるから.   Duncan や Tukey による記号の付け方のエクセルファイル. 問題1 No1 ; 6 5 7 7 No. 2 ; 5 4 3 4 No. 3 ; 8 6 10 8 No. 4 ; 6 8 8 7 ANOVA FACTOR DF SS MS F TOTAL 15.00 51.75 TREATMENT 3.00 36.25 12.08 9.35 ERROR 12.00 15.50 1.29 SXB= .568258 lsd= 1.75113 sowa= 102 平均値間の星取り表 NS NS NS * * *  各自,NS間に縦線を引き,平均値に記号を付けよ. 問題2 No. 1 ; 7 8 6 7 4 6 No. 2 ; 5 4 4 4 4 5 No. 3 ; 8 10 10 8 8 6 No. 4 ; 6 8 7 8 8 5 No. 5 ; 10 9 11 11 9 11 lsd= 1.40 sowa= 217 問題3 No. 1 ; 6 4 7 5 No. 2 ; 5 6 3 3 No. 3 ; 9 8 9 8 No. 4 ; 8 8 7 7 No. 5 ; 9 9 9 9 lsd= 1.44 sowa= 139 始めに戻る
☆ 反復数が等しくない場合の分散分析  処理の平方和 =[jΣ(iΣ xij)^2/nj]− CF(njは各処理での反復数)  反復数の代表値 n0 は n0 =[1/(a-1)]×(Σnj −Σnj^2/Σnj)となる.  aは処理数.  SM = √(誤差の平均平方 / n0)として分散分析や多重検定をする. 上記例で濃度 0.5 の最後の値 95 がないとする. 自由度; 全体 = 23 - 1 = 22      処理(f1) = 4 - 1 = 3      誤差(f2) = 全体 − 処理 = 22 - 3 = 19 全測定値の和 = 64 + 72 +・・・・+ 68 = 1675 補正項(CF) = (1675)2 / 23 = 121983.69 全体の平方和 = 64^2 + 72^2 +・・+ 68^2 - CF = 125167 - 121983.69 = 3183.31 処理の平方和 = (337^2 / 5 + 510^2 / 6 + 456^2 / 6 + 372^2 / 6) - CF   = 123783.8 - 121983.69 = 1800.11 誤差の平方和 = 3183.31 - 1800.11 = 1383.2 処理の平均平方 = 1800.11 / 3 = 600.04 誤差の平均平方 = 1383.2 / 19 = 72.8 F値   = 600.04 / 72.8 = 8.24** 反復数の代表値 n0 = 1/(4-1) × [23-(25 +36+ 36+36)/23 ] = 5.739 SM = √(72.8 / 5.739) 以下各自計算せよ. 異反復数分散分析計算のエクセルファイル 始めに戻る

課題5.乱塊法(任意配列ブロック法)(Randomized block design)

誤差を少なくするため反復をブロック化する.当然,反復数は等しい. →方向に地力の勾配があったとする.ブロック化することで地力の誤差 を消去できる.ブロック内の品種(A - D)は勿論無作為に配置する.

    肥沃   → そうでもない     ┌―――――――――――――――┐    │ A│ A │ D│ B │ A │    │ B│ C │ B│ A │ C │   │ C│ B │ C│ D │ D │   │ D│ D │ A│ C │ B │    └―――――――――――――――┘ ブロック1 同2 同3 同4 同5  品種A〜Dを5反復(ブロック化した)で収量をみた.品種間差があるか? ──────────────────────── 処理 ────反復───── (品種) 1 2 3 4 5 計  平均  ──────────────────────── A 5 2 6 9 3 25 5.0     B 12 6 10 9 7 44 8.8 C 12 9 11 8 13 53 10.6 D 5 6 8 7 14 40 8.0 計 34 23 35 33 37 162 ────────────────────────

ブロック(反復)に対する平方和を計算し,それを全体から引いて誤差をだす. 誤差 = 全体 − 処理 − 反復 全体の和 = 5 + 2 +・・・・+ 14 = 162 補正項 = CF = 162^2 / 20 = 1312.2 全体の平方和   = 5^2 + 2^2 +・・・・+ 14^2 - CF = 201.8 反復に対する平方和 = (34^2 + 23^2 +・・+ 37^2) / 4 - CF = 29.8 処理に対する平方和 = (25^2 + 44^2 +・・+ 40^2) / 5 - CF = 81.8 誤差に対する平方和 = 201.8 - 29.8 - 81.8 = 90.2

      分散分析表 ────────────────────────     要因  自由度  平方和  平均平方   F  ──────────────────────── 全体   19 201.8 反復   4 29.8 7.45 0.99NS 処理   3 81.8 27.27 3.63* 誤差   12 90.2 7.52 ────────────────────────

f1 = 3,f2 = 12でのF表の5%点は3.49であり,計算したF値はこれより  大きいので,「品種(処理)平均値間には5%水準で有意な差がある.反復平均値  間には5%水準での有意差はない」   (1%水準値を超えていれば勿論**)   乱塊法の計算エクセルファイル  乱塊法で欠測値があるとき ☆ 平均値の間の差の検定 ここで求めたSMを使って前と同様に行う.誤差の自由度は12. 処理平均値の標準偏差: SM=√(7.52 / 5)=1.226 (5は処理内反復数)   lsd=t(0.05,f12)×SM×√2=2.179×1.226×√2=3.778   Dp,fの表から p  :    2 3 4  Dp,12:    3.082  3.225  3.313 Dp,12×SM: 3.778 3.954 4.062  検定 C - A = 5.6 > 4.062 * C - D = 2.6 < 3.954 NS  以下略 B - A = 3.8 < 3.954 NS  以下略 (回答では略さない) D - A = 3.0 < 3.779 NS

とりまとめの表 ──────────────────────  処理 平均    縦線間に差なし 注 ──────────────────────   C 10.6 │    a     a  B 8.8 N ││  a b ab    D 8.0 N N │││ a b c ab  A 5.0 * N N ││  b c   b ────────────────────── 注)Duncanの多重検定の結果,同一記号のついた平 均値間には5%水準で有意差がないことを示す.   反復間は不要.

問題1 処理1; 6 6 6 6 3 処理2; 6 4 2 4 3 処理3; 6 8 6 6 6 処理4; 7 8 5 4 5 処理5; 9 9 8 8 8 lsd= 1.31 sowa= 149 ANOVA 要因   自由度 平均平方 F 全体 24 処理 4 13.94 14.45** ブロック 4 3.94 4.08* 誤差 16 0.97 * * NS * NS NS * * * * 問題2 Tr. 1; 6 4 4 5 6 3 Tr. 2; 5 6 3 3 2 3 Tr. 3; 8 6 5 6 7 7 Tr. 4; 8 6 6 6 5 5 lsd= 1.26 sowa= 125 問題3 Tr. 1; 6 6 5 5 3 Tr. 2; 4 3 3 2 4 Tr. 3; 6 8 7 7 7 Tr. 4; 6 6 6 5 7 Tr. 5; 8 8 10 10 7 lsd= 1.44 sowa= 149 始めに戻る

課題6.2元配置(2種の条件を同時に比較する)

2処理,例えば5施肥条件(A)で4品種(B)を比較する(但し無反復). 施肥(A処理)間,品種(B処理)間に差があるか?

────────────────────────    A1 A2 A3 A4 A5   計 ──────────────────────── B1 5 2 6 9 3 25 B2 12 6 10 9 7 44 A1B1〜A5B4は B3 12 9 11 8 13 53 無作為に圃場に B4 5 6 8 7 14 40 配置する. 計 34 23 35 33 37 162 ──────────────────────── 全体の和 = 5 + 2 +・・・・+ 14 = 162 補正項 (CF)   = 162^2 / 20 = 1312.2 全体の平方和 = 5^2 + 2^2+・・・・+ 14^2 - CF = 201.8 Aに対する平方和 = (34^2 + 23^2 +・・+ 37^2) / 4 - CF = 29.8 Bに対する平方和 = (25^2 + 44^2 +・・+ 40^2) / 5 - CF = 81.8 誤差平方和 = 201.8 - 29.8 - 81.8 = 90.2 分散分析表 ────────────────────────       要因  自由度 平方和 平均平方  F  ────────────────────────   全体  19 201.8   A(施肥)  4 29.8 7.45 0.99NS f4,12(0.05)=3.26  B(品種) 3 81.8 27.27 3.63+   f3,12(0.05)=3.49   誤差  12 90.2 7.52 ────────────────────────

f1 = 4,f2 = 12でのF表の5%点は3.26であり,Aについて計算したF値 はこれより小さい.f1 = 3,f2 = 12でのF表の5%点は3.49であり,Bにつ いて計算したF値はこれより大きい.従って,「A処理平均値間に5%水準での有意 差はない.B処理平均値間差は5%水準で有意である」  計算エクセルファイルは乱塊法の計算の反復をB処理とみなす ☆ 平均値の間の差の検定 (1)A処理(施肥)平均値については有意差なしだから不要 (2)B処理(品種)平均値については   品種平均値の標準偏差: SM=√(7.52 / 5) = 1.226(5はB処理内のA数)    Dp,fの表から  p  :    2     3    4  Dp,12:   3.082  3.225  3.313 Dp,12×SM: 3.779 3.954 4.062   検定 B3 - B1 = 5.6 > 4.062 * B3 - B4 = 2.6 < 3.954 NS  以下略 B2 - B1 = 3.8 < 3.954 NS  以下略 B4 - B1 = 3.0 < 3.779 NS

  とりまとめの表 ──────────────────────────  処理 平均    縦線間に差なし   注 ──────────────────────────   B3 10.6 │ a a  B2 8.8 N ││ a b ab    B4 8.0 N N │││ a b c ab  B1 5.0 * N N ││ b c b ────────────────────────── 注) Duncanの多重検定の結果,同一記号のついた平均値間     には5%水準で有意差がないことを示す.

(3)A1B1〜A5B4間を検定するときは   標準偏差: SM=√(7.52/1) = 2.742   Dp,fの表から  p  :    2 3 4 ・ ・  19 20 Dp,12:   3.082  3.225  3.313 ・ ・ 3.499  3.499 Dp,12×SM: 8.451 8.843 9.084 ・ ・ 9.594 9.594  検定 A5B4 - A2B1 = 12 > 9.594 * A5B4 - A5B1 = 11 > 9.594 * ・ ・ ・

  とりまとめの表 (通常はしない) ─────────────────────────  処理 平均    縦線間に差なし 注 ─────────────────────────  A5B4 14 a │ a A5B3 13 N ab ││ a   A1B2 12 NN abc │││ ab   A1B3 12 NNN abcd │││・ ab ・・ NN de・ │││・ abc   ・・ ・ NN ・ e・ │││ ・   ・・ ・ ・ │││   A2B4 6 N ab │││ abc   A1B1 5 N ab │││ abc   A1B4 5 NN ab │││ abc   A5B1 3 **NN cde │ bc A2B1 2 ****N e・・ c ────────────────────────── 注) Duncanの多重検定の結果,同一記号のついた     平均値間には5%水準で有意差がないことを示す.

問題1 A1 A2 A3 A4 A5 B1; 6 8 8 7 4 B2; 5 5 6 4 5 B3; 9 9 9 8 8 B4; 7 9 7 8 7 B5; 10 11 11 11 10 B: lsd= 1.08 A: lsd= 1.08 sowa= 192 ANOVA Factor DF MS F Total 24 B 4 22.16 33.58** A 4 2.06 3.12* Error 16 0.66 for B mean * * NS * * NS * * * * for A mean NS NS NS NS NS NS * * NS NS 問題2 B1; 8 8 5 4 4 4 B2; 4 4 4 5 6 3 B3; 8 8 6 8 6 9 B4; 9 7 5 6 6 7 B: lsd= 1.67 A: lsd= 2.04 sowa= 144 問題3 B1; 7 4 7 7 4 6 B2; 5 5 5 6 6 3 B3; 9 9 8 7 6 9 B4; 6 7 5 7 5 7 B: lsd= 1.54 A: lsd= 1.89 sowa= 150 始めに戻る

課題7.反復つきの2元配置(交互作用の検出) (1)反復はブロック化していない場合

A1〜A5 処理,B1〜B4 処理の組合せを各々2反復して以下の データを得た.全試験区は無作為に配置されている. A 処理間,B 処理間に差があるか? また,異なる A 処理下で,B 処理の反応は違ってこないか?

────────────────────────     A1 A2 A3 A4 A5 ──────────────────────── B1 7,8 8,8 10,8 13,14 9,10 B2 19,17 8,10 16,14 14,13 10,11 B3 14,16 12,15 13,10 13,11 20,19 B4 8,7 11,7 13,11 9,12 21,21 ────────────────────────

  まず A5 水準,B4 水準との計20水準を AB 因子の2回反復として   1元配置の分析をする

────────────────────── A1B1 A1B2 A1B3 ・・・・ A5B4 ──────────────────────    反 7 19 14 21    復 8 17 16 21 ──────────────────────  計 15 36 30 42 総計 490 ───────────────────────

補正項 (CF) = 490^2 / 40 = 6002.5 全体の平方和 = 7^2 + 8^2 +・・・・+ 21^2 - CF = 621.5 処理ABの平方和 =(15^2 + 36^2 +・・+ 42^2) / 2 - CF = 582.5 誤差の平方和 = 全体の平方和 − 処理ABに対する平方和 = 39.0 次に AB を分解するには,A1B1,A1B2 ・・・・ A5B4 の2つの測定値の合計を, 下の表のように A と B との2元配置型の表に書きかえる.

───────────────────────── A1 A2 A3 A4 A5 計 ───────────────────────── B1 15 16 18 27 19 95 B2 36 18 30 27 21 132 B3 30 27 23 24 39 143 B4 15 18 24 21 42 120  計 96 79 95 99 121 490 ─────────────────────────

処理 AB に対する平方和:計算済み = 582.5 処理 Aに対する平方和 = (96^2 + 79^2 +・・+ 121^2) / (4×2) - CF = 113.0 処理 Bに対する平方和 = (95^2 + 132^2 +・・+ 120^2) / (5×2) - CF = 127.3 A×B の交互作用  = 582.5 - 113.0 - 127.3 = 342.2 ☆交互作用 (Interaction);効果が加法的でない,つまりB1水準とB2水準で  (A1-A2)が異なる程度を表し,交互作用項の有意性として検出される.  交互作用のより詳細な解説は下の課題8にあり.

        分散分析表 ─────────────────────────   要因   自由度  平方和  平均平方  F (自由度) ───────────────────────── 全体 39 621.5 5x4x2-1   処理AB 19 582.5 5x4-1 A 4 113.0 28.25 14.49**  5-1  B 3 127.3 42.43 21.76**  4-1   A×B 12 342.2 28.52 14.62** 19-4-3 (4x3) 誤差 20 39.0 1.95 39-19 ─────────────────────────

「A,Bの処理平均値間差,およびA×Bの交互作用は1%水準で有意である」 ☆ 平均値の間の差の検定 (1)A処理(施肥)平均値については   施肥平均値の標準偏差:SM = √(1.95 / 8) = 0.494 (8=4品種×2反復) (2)B処理(品種)平均値については   品種平均値の標準偏差:SM = √(1.95 / 10) = 0.442 (10=5施肥×2反復) (3)AB処理平均値については   標準偏差: SM = √(1.95 / 2) = 0.987 (2=反復数) として6同様にする. 全部を無作為に配置するのは大変だし,環境変動を少なくするため反復はブロック 化したほうがいいので,演習問題は課題7にはなし.次の課題8をせよ.  非ブロック化二元配置計算のエクセルファイル 始めに戻る

課題8.反復つきの2元配置 (2)反復がブロック化してある場合

 データは上と同じで,前の値が第1反復,後が第2反復とする.

反復1 反復2 ─────────────── ─────────────── A1 A2 A3 A4 A5 A1 A2 A3 A4 A5 ─────────────── ─────────────── B1 7 8 10 13 9 B1 8 8 8 14 10 B2 19 8 16 14 10 B2 17 10 14 13 11 B3 14 12 13 13 20 B3 16 15 10 11 19 B4 8 11 13 9 21 B4 7 7 11 12 21 ─────────────── ───────────────

 まず A5 水準,B4 水準との計 20水準を AB 因子の2回反復として  1元配置の分析をする.反復の平方和が計算される.

────────────────────────────    A1B1 A1B2 A1B3 ・・ A5B4   計 ────────────────────────────   第1反復   7 19 14 21 248   第2反復   8 17 16 21 242 ──────────────────────────── 計    15 36 30 42 総計 490 ────────────────────────────

補正項 CF = 490^2 / 40 = 6002.5 全体の平方和 = 7^2 + 8^2 +・・・・+ 21^2 - CF = 621.5 処理ABの平方和 = (15^2 + 36^2 +・・+ 42^2) / 2 - CF = 582.5 反復の平方和 = (248^2 + 242^2) / 20 - CF = 0.9 誤差の平方和 = 全体平方和−処理ABの平方和 - 反復の平方和 = 38.1 

    ここまでの分散分析表は ───────────────────────    要因   自由度  平方和  平均平方    (自由度) ───────────────────────   全体  39 621.5 5x4x2-1=39 処理AB 19 582.5 5x4-1=19   反復   1 0.9 0.9 2-1=1    誤差   19 38.1 2.01 39-19-1=19 ───────────────────────

次にABを分解する.前と同様,A1B1,A1B2 ・・ A5B4 の2つの測定 値の合計を,下の表のようにAとBとの2元配置型の表に書きかえる.

────────────────────────   A1 A2 A3 A4 A5 計 ──────────────────────── B1 15 16 18 27 19 95 B2 36 18 30 27 21 132 B3 30 27 23 24 39 143 B4 15 18 24 21 42 120 計 96 79 95 99 121 490 ────────────────────────

処理ABの平方和 = 582.5 処理Aの平方和 = (96^2 +・・+ 121^2) / (4×2) - CF = 113.0 処理Bの平方和 = (95^2 +・・+ 120^2) / (5×2) - CF = 127.3 A×Bの交互作用  = 582.5 - 113.0 - 127.3 = 342.2

    最終的な分散分析表 ────────────────────────  要因   自由度  平方和 平均平方   F 参考 (自由度) ──────────────────────── 全体 39 621.5 5(A)x4(B)x2(反復)-1 = 39 処理AB 19 582.5 5(A)x4(B)-1 = 19   A 4 113.0 28.25 14.09 **  5-1 ; 5施肥) B 3 127.3 42.43 21.16 **  4-1 ; 4品種) A×B 12 342.2 28.52 14.22 ** 19(A×B)-4-3 又は 4x3 反復   1 0.9 0.9 NS 2-1 ; 2反復  誤差   19 38.1 2.01 39(全体)-19(処理)-1 ────────────────────────

処理 AB の自由度 19 は Aの4,Bの3,A×B の 12に分解される. f1=4,f2=19 でのF値は 4.50,f1=3,f2=19でのF値は 5.01,f1=12,f2=19での F値は3.30であり(いずれも1%水準),A,B,A×Bについて計算したF値は これより大きい.従って,「A処理平均値間の差,B処理平均値間の差はともに 1%水準で有意である.またAとBの間の交互作用も1%水準で有意である.」   この多重検定のエクセルファイル. ☆ 平均値の間の差の検定 (1)A処理(施肥)平均値については   施肥平均値の標準偏差: SM = √(2.01 / 8)= 0.501 (8=4品種×2反復)   lsd=t(0.05,f19)×SM×√2 = 2.093×0.501×√2 = 1.482   Dp,fの表から (注:f=19は誤差の自由度) p  :    2 3 4 5 Dp,19:   2.960  3.107  3.199 3.264 Dp,19×SM 1.482 1.556 1.602 1.634  検定   A5 - A2 = 121 / 8 - 79 / 8 = 5.25 > 1.634 *   A5 - A3 = 121 / 8 - 95 / 8 = 3.25 > 1.602 * ・ ・ ・(演習では略さない)

 とりまとめの表 ───────────────────────   処理 平均値   縦線間に差なし  注 ───────────────────────   A5   15.1    a   a   A4   12.4   * │ b   b   A1  12.0  * N ││ bc b   A3  11.9  * N N ││ bc   b  A2  9.9  * * * * d c ─────────────────────── 注)Duncanの多重検定で同一記号のついた平均値間   には5%水準で有意差がないことを示す.

(2)B処理(品種)平均値については  品種平均値の標準偏差: SM = √(2.01 / 10) = 0.448 (10=5施肥×2反復) lsd = t(0.05,f19)×SM×√2=2.093×0.448×√2 = 1.326 (f19:誤差の自由度)   Dp,fの表から  p  :    2 3 4 Dp,19:   2.960  3.107  3.199 Dp,19×SM 1.326 1.391 1.433  検定   B3−B1 = 143/10 - 95/10 = 4.8 > 1.433 *   B3−B4 = 143/10 - 120/10 = 2.3 > 1.391 * ・ ・ ・

 とりまとめの表 ───────────────────────   処理 平均値  縦線間に差なし 注 ───────────────────────   B3  14.3 │ a a   B2  13.2  N ││ ab ab   B4   12.0  * N │ b b   B1  9.5  * * * c c ─────────────────────── 注)Duncan の多重検定で同一記号のついた平均値間   には5%水準で有意差がないことを示す.

☆下のような図を書いてみよ.B1,B2〜を1,2(kg/a)〜の施肥量として  横軸,各A1〜ごとの平均値を縦軸にとる.

      (A1,B2)2反復の平均値  ↓ 収 20│  *     │   + B1 量 │ * * +* * B2   10│   + + * B3,B4も書く   │  +   +   └──────────────── 施肥量 A1 A2 A3 A4 A5 (kg)

(3)AB 処理平均値については(通常あまりしない)   標準偏差: SM = √(2.01 / 2) = 1.002 (2=反復数)   lsd = t0.05,f19×SM×√2 = 2.093×1.002×√2 = 2.966 p  :    2 3 4 ・ ・ 18 19 20 Dp,19:   2.960 3.107 3.199 3.472 3.473 3.473 Dp,19×SM 2.966 3.113 3.205 3.479 3.480 3.480  検定 A5B4 - A1B1 = 42 / 2 - 15 / 2 = 13.5 > 3.480 * A5B4 - A1B4 = 42 / 2 - 15 / 2 = 13.5 > 3.480 * A5B4 - A2B1 = 42 / 2 - 16 / 2 = 13 > 3.479 * ・ ・ (以下略) しかし交互作用が有意なら,本当はAB処理についての差をみる必要はあるだろう.

交互作用

交互作用 (Interaction); 効果が加法的でないこと.つまり B 水準の違いで A の反応,つまり A1-A2 など が異なることで,交互作用項の有意性として検出される. 実例

試験1.交互作用なし(収量の品種間差が施肥条件によって変わらない) | + 品種1(+) ↑  収│   +    常にこの差がある  │ + + 品種2(+) ↓ 量│ + +     │ +  │ +  └─────────── 施肥量 試験2.交互作用あり(順位が変わる)  収│  +   +   │   + + 収量の品種間差が施肥条件 量│ によって逆転する.   │   + +  │  +   +   └─────────── 施肥量 試験3.交互作用あり(順位は変わらない) | +  収│   +  + 施肥Aでは大差だがBでは   │   +   差が小さくなる. 量│  +     +      │            │    + │ │ +   └───────────── 施肥量 A B 上図での予想される分散分析表(各2反復とすると) ―――――――――――――――――――― 要因     df −−F値の有意性−−          試験1 試験2 試験3 ―――――――――――――――――――― 全体    15 処理   7 品種   1  *   NS  * 施肥   3  *   NS   * 品種×施肥 3  NS   *    * 誤差 8 ――――――――――――――――――――  

試験1と試験3は品種と施肥平均間に差があり(品種1が品種2より多収,多肥で 多収),試験2は品種1と品種2の平均値間,施肥平均間には差がない.なお, 収量の施肥反応が品種によって変わる,変わらない,ともいえる. 交互作用が有意であるということは,品種間差が環境条件で異なるということで, 例えば標準量の施肥では新品種の収量は旧品種よりそこそこ多収だが多肥ではそう でもない,あるいは逆転する,ということがあることである. 通常は単なる品種間,あるいは施肥の効果をみたいだけでなく,この品種と施肥 (環境条件)との交互作用こそが知りたくて実験しているとも言える.

問題1(各3反復) ――――――――――――――――――――――――――――――――――― | A 1 | A 2 | A 3 | A 4 | A 5 ――――――――――――――――――――――――――――――――――― B 1; | 6 8 8 | 5 5 7 | 8 8 9 | 8 6 7 | 8 8 9 B 2; | 9 6 8 | 5 6 6 | 10 10 8 | 7 10 7 | 9 8 11 B 3; | 8 9 8 | 9 7 9 | 10 7 7 | 8 8 7 | 9 11 9 ――――――――――――――――――――――――――――――――――― sum= 356 ; sum of x^2= 2914 ;A lsd= 1.14 ;B lsd= .890 分散分析表 ――――――――――――――――――――――― 要因  df 平均平方 F値 F0.05 F0.01 ――――――――――――――――――――――― 全体 44 処理 14 4.12 2.90 A 4 8.63 6.09** 2.74 4.16  B 2 4.36 3.07ns 3.36 5.68  A×B 8 1.80 1.27 ブロック 2 0.16 0.11 誤差 28 1.42 ―――――――――――――――――――――――

NS * NS * NS NS * * * NS 表の値を収量,Bを施肥量(1,2,3kg),Aを品種1,2,3として,横軸を 施肥量,縦軸を収量のグラフを品種別に同一グラフに示せ. 交互作用の有無を図からもみよ. 問題2 A 1 A 2 A 3 A 4 B 1; 7 7 8 6 6 6 7 7 6 6 7 6 B 2; 9 9 8 7 6 5 9 7 10 6 8 10 B 3; 9 10 10 6 5 7 10 7 11 7 7 8 B 4; 8 9 9 6 6 7 8 9 11 12 8 8 B 5; 9 8 7 9 10 10 10 10 11 9 11 10 sum= 485 ; sum of x^2= 4097 ;A lsd= .833 ;B lsd= .932 問題3 A 1 A 2 A 3 A 4 B 1; 8 6 6 4 7 4 9 9 9 7 8 8 B 2; 7 7 8 8 7 6 8 7 7 8 7 10 B 3; 7 7 6 5 6 9 9 8 9 10 10 9 B 4; 7 7 9 9 9 6 10 9 8 9 9 9 sum= 371 ; sum of x^2= 2971 ;A lsd= .944 ;B lsd= .944  ブロック化二元配置,交互作用検出の計算エクセルファイル 始めに戻る

課題9.ラテン方格法(各列と行に一度ずつ処理を配置)

     →地力差 ┌──┬──┬──┬──┐ ↓│ A │ B │ C │ D │ A〜Dの4品種比較で,縦横の地力の差を誤差 ├──┼──┼──┼──┤ から除去するため,各列と行に一度ずつ品種 地│ B │ C │ D │ A │ を配置をする.また動物実験で,横が被実験 ├──┼──┼──┼──┤ 個体,縦が実験期間にも使える. 力│ C │ D │ A │ B │ ├──┼──┼──┼──┤ 通常,反復をもうける. 差│ D │ A │ B │ C │ └──┴──┴──┴──┘ V1,V2,V3の3品種を下図のごとく配置し収量を計った.品種間差があるか? ────────────────── ──────────── 1 2 3   計 計  平均 ────────────────── ──────────── 1 V2:23 V1:17 V3:29 69 V1  45  15 2 V1:16 V3:25 V2:16 57 V2 57  19 3 V3:24 V2:18 V1:12 54 V3 78  26   計 63 60   57 180 ──────────── ──────────────────

全体の和 = 23 + 16 +・・・・+ 12 = 180 補正項 CF = 180^2 / 9 = 3600 全体の平方和 = 23^2 + 16^2 +・・・・+ 12^2 - CF = 240 行に対する平方和 = (69^2 + 57^2 + 54^2) / 3 - CF = 42 列に対する平方和 = (63^2 + 60^2 + 57^2) / 3 - CF = 6 品種に対する平方和 = (45^2 + 57^2 + 78^2) / 3 - CF = 186 誤差 = 240 - 42 - 6 - 186 = 6

        分散分析 ────────────────────── 変動因 自由度 平方和 平均平方   F  (自由度) (参考) ────────────────────── 全体 8 240  3x3-1 反復があっ 行   2 42 21 7 NS 3-1 たら分散分 列   2 6 3 1 NS  3-1 析表はどう 処理   2 186 93 31 + 3-1 なるか,考 誤差  2 6 3   8-2-2-2 えよ. ──────────────────────

f1=2,f2=2でのF値は19.00(5%水準)で,処理について計算したF値はこれより大きい. 従って「処理平均値間に5%水準で有意差がある」.行列間に差があったら記す. ☆ 平均値の間のあらゆる差の検定 (行・列間は差が有意でも検定不要) 処理平均値の標準偏差: SM=√(3 / 3) = 1 lsd = t(0.05,f2)×SM×√2 = 4.303×1×√2 = 6.085   Dp,fの表から  p  :     2     3    4  Dp,2:    6.085  6.085  6.085 Dp,2×SM : 6.085  6.085  6.085   検定 V3 - V1 = 11 > 6.085  * V3 - V2 = 7 > 6.085  * V2 - V1 = 4 < 6.085  NS

────────────────────────── 品種  平均値   縦線間に差なし  注 ────────────────────────── V3 26       a a V2 19 * │      b b V1 15 * NS │      b b ────────────────────────── 注)Duncanの多重検定により,同一記号のついた平均値間には5%水準で有意差がないことを示す.

問題1 B: 6 A:2 C:3 ;sowa= 40 A: 1 C:4 B:5 ;sum of x^2= 246 C: 5 B:11 A:3 ;lsd= 3.099 ANOVA df  ms  F  合計 8 処理 2 21.78 28.00* 列 2 3.44 4.43 行 2 8.11 10.43 誤差 2 0.78 * * NS 問題2 B:7 A: 5 C:1 ;sowa= 38 A:3 C: 4 B:4 ;sum of x^2= 226 C:3 B: 10 A:1 ;lsd= 2.342  ラテン方格法計算のエクセルファイル 始めに戻る

課題10.分割区法 (主処理と副処理に分割して試験する)

二元配置の試験区を無作為に配置するのが大変なとき用いる. 例)数品種の牧草を刈取り時期を変えて収穫した.

 ―――――――――   ――――――――― |  | 品 | 刈取1 | |  | 品 | 刈取3 | |  | 種 | 刈取2 | |  | 種 | 刈取2 | |  | 1 | 刈取3 | |  | 2 | 刈取1 | | ブ | ――――――| | ブ | ――――――| | ロ | 品 | 刈取2 | | ロ | 品 | 刈取1 | | ッ | 種 | 刈取1 | | ッ | 種 | 刈取3 | ・・・(反復) | ク | 2 | 刈取3 | | ク | 3 | 刈取2 | | 1 | ――――――| | 2 | ――――――| | | 品 | 刈取3 | | | 品 | 刈取1 | | | 種 | 刈取2 | | | 種 | 刈取2 | | | 3 | 刈取1 | | | 1 | 刈取3 |  ―――――――――   ―――――――――

上図のような3反復の分割区試験法を用いて,品種を主試験区にまとめ, 時期を副試験区として3回刈取り(A,B,C),以下に示す草収量を得た. 品種間差,刈取時期間差,品種×刈取交互作用を検定する.

――――――――――――――― 品種 刈取 ブロック1,2,3 ――――――――――――――― 品種1 A  2 2 2    B  2 4 3    C  5 4 5 計 9 10 10 品種2 A  7 7 6     B 9 8 7     C  10 8 9 計 26 23 22 品種3 A  5 6 4     B  8 4 7     C  5 8 8 計 18 18 19 品種4 A  4 4 7     B  4 7 5     C  7 8 6 計 15 19 18 ブロック計 68 70 69 ――――――――――――――― 品種と刈取のとりまとめ表を作る ―――――――――――――――――――― A B C 品種計 品種平均 ―――――――――――――――――――― 品種1 6 9 14   29  3.22 品種2 20 24 27  71  7.88 品種3 15 19 21  55  6.11 品種4 15 16 21  52  5.77 刈取計 56 68 83  207 刈取平均 4.67 5.67 6.92  5.75 ――――――――――――――――――――

以下の平方和を計算する     df 補正項  CF=207^2/36=1190.25 全体 2^2+2^2+・・+8^2+6^2-CF=168.75 35=36-1 主試験区 (9^2+10^2+・・+19^2+18^2)/3-CF=106.08 11=12-1 品種 (29^2+71^+55^2+52^2)/9-CF=99.86 3=4-1 ブロック (68^2+70^2+69^2)/12-CF=0.16 2=3-1 主試験区誤差 106.08-99.86-0.16=6.06 6=11-3-2 (2x3) 品種-刈取表の副次級 (6^2+9^2+・・+16^2+21^2)/3-CF=132.08 11=12-1 刈取 (56^2+68^2+83^2)/12-CF=30.5 2=3-1 品種×刈取 132.08-99.86-30.5=1.72 6=11-3-2 副試験区誤差 168.75-106.08-30.5-1.72=30.44 16=35-11-2-6

  分散分析表は ―――――――――――――――――――――――― 要因       df 平方和 平均平方  F ―――――――――――――――――――――――― 主試験区  品種 3 99.86 33.29  32.98**  ブロック 2 0.16 0.08   0.08ns  主試験区誤差 6 6.06 1.01 副試験区  刈取   2 30.5 15.25   8.01**  刈取×品種 6 1.72 0.29  0.15ns  副試験区誤差 16 30.44 1.90 ――――――――――――――――――――――――

品種の効果は主試験区の誤差で,刈取と刈取×品種交互作用は 副試験区の誤差で検定する.品種平均値間と刈取時期平均値間 に1%水準で有意差がある.刈取×品種の交互作用はない. 品種平均値間の lsd を主試験区の誤差,その df での t値から t= t(0.05,df=6)×√[2×1.01/(3×3)]= 1.158 と求める.

問題1.(4品種,3刈取時期(A,B,C),3反復) ――――――――――――――――    刈取  ブロック1,2,3 ―――――――――――――――― 品種1  A  3 3 2     B  3 4 2     C  6 3 4 品種2  A  6 5 6     B  6 9 5     C  7 7 9 品種3  A  4 5 4     B  5 6 4     C  5 6 9 品種4  A  6 4 8     B  7 7 4     C  7 8 7 ―――――――――――――――― 分散分析表 ―――――――――――――――――――――― 要因       df 平均平方 F ―――――――――――――――――――――― 主試験区  品種 3 20.08 24.26  ブロック 2 0.19 0.23  主試験区誤差 6 0.86 副試験区  刈取   2 10.78 4.34  刈取×品種 6 0.22 0.09  副試験区誤差 16 2.49 ――――――――――――――――――――――

品種平均値間の lsd=1.07 問題  刈取 ブロック1〜3 V1 A  2 3 3 B  2 3 3   C  6 5 6 V2 A  7 8 4  B  9 6 8 C  7 8 8 V3 A  3 4 5 B  7 7 4  C  5 6 8 V4 A  6 7 6  B  6 6 5 C  5 9 8 Total X,XX= 205,1305 品種間lsd=1.08 分散分析と品種間平均値をlsdを用いて多重検定せよ.  分割区試験法計算のエクセルファイル 始めに戻る

課題11.回帰と相関(変数間の関連性を表す)

1)相関係数 ( Correlation coefficient between A and B)  窒素の施用量と病斑数の関係(多肥料は病気の発生を通常促す),

────────────────────────────    データ 1 2 3 4 5   総和 ──────────────────────────── 窒素の施用量 (X) 3 5 6 7 4   25 病斑数    (Y) 2 3 5 6 4   20   ────────────────────────────

 のときの相関係数 r は,2つの変数を X,Y,データ数を n とすると,X,Yの  共分散をX,Yの分散の幾何平均で割ったものである.  r = (XとYの共分散)/√(X分散・Y分散)   =[(X-Mx)(Y-My)/(n-1)]/{√[(X−Mx)^2/(n-1)×(Y−My)^2/(n-1)]} 上記例では,  r = (3x2 + 5x3 + 6x5 + 7x6 + 4x4 - 25x20 / 5)     / √[(9+25+36+49+16-25^2/5) x (4+9+25+36+16-20^2/5)] = (109-100) / √[(135−125) x (90−80)]   = 9 / √(10x10) - 9 / 10 = 0.9 * (df=3) フリーハンドで X と Y の関係を図上に描いてみよ. 相関の有意性の検定は「相関係数の有意水準」と比較する. 自由度;データ数−2   この場合の自由度は3,計算値の絶対値は5%水準での有意水準 0.878 より大で 「相関係数は5%水準で有意である」. 5%値より小さければ相関は5%水準で有意でないとする.  なお, |r|≦1 ,負値は逆関係を示す. 

相関係数の有意性の表 抜粋 ―――――――――― df  5%水準 ―――――――――― 1 .997 2 .950 3 .878 4 .811 5 .754 6 .707 7 .666 8 .632 9 .602 ――――――――――

この値以上なら5%水準で有意.  10形質相互間の相関行列エクセル計算ファイルはこちら2)回帰(Regression of Y on X)  5組の X,Y の観測値があるとき,

────────────────────────────  データ 1 2 3  4 5 平均 ────────────────────────────   X      3   5   6   7   4 5   Y      2   3   5   6   4 4 ────────────────────────────

X にたいする Y の回帰式は (Y;従属変数,X;独立変数), b を回帰係数として,      Y - (Y 観測値の平均) = b[X - (X 観測値の平均)] である.bは, b =[(XY) - (嚢)(悩) / n]/[嚢^2 - (嚢)^2 / n] と求める. 上記例では, Y - (2+3+5+6+4)/5 = [(2x3+....+4x4-25x20/5)/(9+...+16-25x25/5)](X-25/5) ∴ Y - 20 / 5 = [(109−100) / (135−125)] (X−25/5)  ∴ Y - 4 = 0.9 ( X − 5 ) ( b が r と同じ値だが偶然である) ∴ Y = 0.9 X - 0.5  X と Y の関係の図上に回帰直線をひけ. ☆回帰係数の有意性の検定

───────────────────────────────  データ 1 2 3  4 5 ─────────────────────────────── Yの推定値 2.2  4.0   4.9   5.8   3.1 Y = 0.9X - 0.5から 回帰からの偏差 -0.2 -1.0 0.1 0.2 0.9 和 = 0    偏差平方 0.04 1.0 0.01 0.04 0.81 和 = 1.90 ───────────────────────────────

 偏差平方の和は直線を適合させたときの誤差の推定値の基礎である.  「回帰からの平均偏差平方」S^2yx は S^2yx = 偏差平方の和 / (n - 2) 上記例では,  S^2yx = 1.90 / 3  回帰係数 b の標本標準偏差 Sb は Sb = Syx / √[嚢^2-(嚢)^2 / n] Sb = √(1.90 / 3) / √10 = √(1.90 / 30) から, t = b / Sb df = n - 2 で b = 0 の帰無仮説をt検定する.         t = 0.9×√(30 / 1.90) = 3.58 > t(0.05) = 3.182 (df = 3) 回帰係数の有意性の検定:5%水準のt値より計算値(絶対値)が大きければ有 意である.よって「5%水準でこの回帰係数は有意である」.  回帰式とその有意性検定のエクセルファイル  回帰式を安定性評価に応用した Finlay-Wilkinson 回帰分析のエクセルファイル 3)回帰と相関の関係  Y を従属変数とすると,その X に対する回帰係数 b21 は    b21 = [(XY)-(嚢)×(悩) / n] / [嚢^2-(嚢)^2 / n]  逆に X を従属変数とすると,Y に対する回帰係数 b12 は    b12 = [(XY) - (嚢)×(悩) / n] / [悩^2 - (悩)^2 / n]  よって b21・b12 = r^2 4)偏相関 partial correlation coefficient  3変数があり,内1つの影響を消去した(その変数が一定に保たれているときの) 残り2つの間の相関のことをいう.第1・2間の相関係数を r12,第1・3間を r13, 第2・3間を r23,第3を消去した第1・2間の偏相関係数を r12.3 とすると, r12.3 =(r12−r13 r23)/√[(1−r13^2)(1−r23^2)] である.自由度を(対の数−3)として通常の相関での表を用いて有意性検定を行う. 例;142人の調査で,年齢(A),血圧(B),血液中のコレステロール(C) 相互間の相関係数が rAB = 0.332 ***,rAC = 0.5029 ***,rBC = 0.2495 **であった. 通常 B や C は A と共に増大する.B と C の関係が単に年齢と共通な関連があるためなのか, 年齢の影響を消去して,言い換えれば同一年齢でも B と C に関連があるのかを知りたい. rBC.A = 0.2494 - (0.3332)x(0.5029) / √(1-0.3332^2)x(1-0.5029^2) = 0.1005 ns であり,年齢別のグループに分けると B と C の間には関連がなさそうである.   偏相関係数の計算エクセルファイル 問題1. X 4 10 4 9 7 6 9 6 9 Y 8 13 7 11 7 10 12 8 10 sowa= 150, X^2,Y^2, XY = 496, 860, 644  r= 0.821 問題2 X 6 6 7 7 10 4 5 8 8 4 6 4 Y 11 9 9 9 9 7 9 11 8 6 10 6 sowa= 179, X^2,Y^2, XY = 507, 932, 669 r= 0.555 問題3 X 7 6 8 6 8 5 6 9 6 Y 1 2 -1 1 0 3 2 -2 3 X,Yの関係を図示せよ.回帰直線を図上に式とともに書け.相関係数を計算し, 有意性を検定せよ. ☆回帰や相関係数は(だけでなく,ここでの検定方法の前提は全般そうなのだが),  正規分布をしている母集団からの標本について求められると仮定している.  下図のような場合,

Y 例1 9| + + 8| + + 7| + 6| 5| 4| 3| + + 2| + + Y = 0.863 X** + 0.799 1| + r = 0.895 ** (df=8) ―――――――――――――――――――― X 1 2 3 4 5 6 7 8 9

   計算値は高度に有意だが標本は明かに異なる2つの集団からなっており,相  関や回帰で議論すべきでない.X,Y を別々に tー検定し,集団間の違いを考察  すべき. ☆相関係数が'高度に有意'と,2変数間に'密接な関係がある'とは異なる.

Y | + + + 8│r = 0.330***   + + + + + │   + + + + + + 7│(df=100) + + + + + + + │ + + + + + + + 6│   + + + + + ++ + + + │ + + + + + + ++ + + ++ 例 2 5│ + + + + + + + + │ + + + + + + + + 4│ + + + + ++ + ++ + │ + + + + + + 3│ + + + + + + + │ + + + + + + + 2│ + + + + ─────────────────── X 2 3 4 5 6 7 8 9

 自由度 100 での 0.1% 有意水準の相関係数は 0.321で,値が小さくとも相関は 高度に有意となる.上図で X と Y に関係があるのは非常に確か(0.1%水準)だが, この関係は密接とはいえないであろう. ☆正規分布とは,釣り鐘状の連続分布のことである.例1の X 値についての頻度分  布(例1の図を上からみて,つまり Y を無視して,ある X の値にいくつデータ  があるかの図)は下図であり,不連続であり,釣り鐘状の正規分布とは言い難い.

     頻度 2| +   +          +  +         1| +  +  +        +  +  +            ――――――――――――――――――――X 1 2 3 4 5 6 7 8 9

 一方,例2では(やや省略化している),釣り鐘状の正規分布をしている.

                                           + +                  + + + + +                + + + + + + +               + + + + + + + + + + + + + + + + + + +            + + + + + + + + + + +         + + + + + + + + + + + + +     + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +             ─────────────────── X 2 3 4 5 6 7 8 9         

 正規分布かどうかの検定のエクセルファイル.しかし,常識的な観察でも可. ☆重回帰については付録参照 始めに戻る

課題12.カイ平方(χ^2)検定(観察度数と理論度数の比較)

例1:トウモロコシの2つの劣性型,金色無地(aaBB)と緑色縞(AAbb)を交雑し その F2 世代で4つの異なる型(4つのクラス)を得た.2つは両親と同一(緑色 縞と金色無地),1つは F1 雑種と同じ(緑色無地,A_B_),もう1つは2劣性の 結合した金色縞(aabb)であった. 合計 1301 個体の観測数は,f1 = 773 (緑色無地),f2 = 231 (金色無地),f3 = 238 (緑色縞),f4 = 59 (金色縞),だった. 帰無仮説:この観測値がメンデル遺伝の9:3:3:1の分離比にしたがっている,を検定. このためには, χ^2 = (fi - Fi)^2 / Fi (fiは観測数,Fiは理論数)    i を計算する. ここでは,理論数は: F1 = (9 / 16)×1301 = 731.8      F2 = (3 / 16)×1301 = 243.9      F3 = (3 / 16)×1301 = 243.9      F4 = (1 / 16)×1301 = 81.3 よって, χ^2 = (773 - 731.8)^2 / 731.8         + (231 - 243.9)^2 / 243.9         + (238 - 243.9)^2 / 243.9         + (59 - 81.3)^2 / 81.3         = 2.318 + 0.686 + 0.145 + 6.123 = 9.271 χ^2の表より(自由度は,クラス数 -1 = 3),        χ^2(0.05) = 7.81 < χ^2 = 9.27 である. よって,このχ^2 = 9.25の値は,観測値が9:3:3:1の帰無仮説をもうけた母集団 から任意抽出されたものとしては稀に(5%以下)しかあらわれず,「ここでの 観測値は9:3:3:1の分離比には適合しない」. 例2:トマトの肉食の遺伝実験で,F2世代で赤が3629,黄が1176個体であった. 理論比は3:1として(自由度は1) χ^2 = (3629 - 3603.75)^2 / 3603.75 + (1176 - 1201.25)^2 / 1201.25 = 0.1769 + 0.5307 = 0.7076 < χ^2(0.05) = 3.84  よって,観測値と期待される比との相違は有意でなく,「3:1に適合する」. このように,χ^2の計算値が,別表の5%水準値より大きければ理論度数に適合 しない,小さければ適合する,とする. 例3:同時に5つのサイコロを100回なげて,2の目(ジュース,deuce) のでるサイコロの数の分布が

―――――――――――――――――――― ジュース   f F ―――――――――――――――――――― 5,4,3 8 3.5 (各クラスは少なくとも5以上の 2 18 16.1     理論頻度にする) 1 42 40.2 0 32 40.2 ――――――――――――――――――――

のとき, χ^2 = 7.76(自由度は3) < χ^2(0.05)= 7.81 で,均斉なサイコロを偏りなくなげたとした仮説を棄却できないが,最初の3つ のクラスでジュースの数が多すぎるとの疑念にみまわれる.

χ2 値 抜粋 ―――――――――――― 自由度  5% 1% ―――――――――――― 1   3.84  6.63 2   5.99 9.21 3   7.81 11.34 4   9.49 13.28 5   11.07 15.09 6   12.59 16.81 7   14.07 18.48 8   15.51 20.09 9   16.92 21.67 10   18.31 23.21 ――――――――――――

例4:連鎖の検出 例1で   観測値 遺伝子型      f1 = 104(緑色無地) A_B_      f2 = 20 (金色無地) aaB_      f3 = 10 (緑色縞) A_bb      f4 = 26 (金色縞)  aabb とする. 9:3:3:1の理論分離からの検定は,       n = f1 + f2 + f3 +f4 = 160 160 x 9/16 = 90 160 x 3/16 = 30 160 x 3/16 = 30 160 x 1/16 = 10  から     χ^2 = (104-90)^2/90+(20-30)^2/30+(10-30)^2/30+(26-10)^2/10    = 2.18 + 3.33 + 13.33 + 25.6 = 44.44 > χ^2(0.05) = 7.81  よって観測値は9:3:3:1の分離比には適合しない. 次に連鎖の有無の検定を行う.そのために以下を計算する. 自由度  A座の分離比(3:1) χA^2 = ( f1- 3f2+ f3- 3f4)^2 / 3n   1  注1)  B座の分離比(3:1) χB^2 = ( f1+ f2- 3f3- 3f4)^2 / 3n   1  注2)    の検定によりA,B遺伝子座は3:1に分離していることを確認後,  分離の独立性   χL^2 = ( f1- 3f2- 3f3+ 9f4)^2 / 9n   1  注3)  を検定する. 9:3:3:1の検定をχT^2とすると            χT^2 = χA^2+χB^2+χL^2 である 3  注4) 上記例では  χA^2 = ( 104- 3x20+ 10- 3x26)^2 / 3x160 = 1.2 < χ^2(0.05) = 3.84  χB^2 = ( 104+ 20- 3x10- 3x26)^2 / 3x160 = 0.53 < χ^2(0.05) = 3.84   で,A,B遺伝子座はともに3:1に分離している.  χL^2 = ( 104- 3x20- 3x10+ 9x26)^2 / 9x160 = 42.71 > χ^2(0.05) = 3.84   で,A,B遺伝子座間に連鎖が存在すると結論される.  なお,χA^2+χB^2+χL^2 = 44.44 = χT^2> χ^2(0.05) = 7.81 注1)A座の分離は (A_:aa=3:1)   観測値 理論数      A_B_ + A_bb = 104+10 = 114   160x(3/4)=120     aaB_ + aabb = 20+26 =  46   160x(1/4)=40    からχA^2 = (114- 120)2/120 +(46 - 40)2/40 = 1.2 としても同じ. 注2)B座の分離は (B_:bb=3:1)   観測値 理論数      A_B_ + aaB_ = 104+20 = 124   160x(3/4)=120     A_bb + aabb = 10+26 =  36  160x(1/4)=40  からχB^2 = (124- 120)2/120 +(36 - 40)2/40 = 0.53としても同じ. 注3)χL^2は χT^2 からχA^2とχB^2を引いた残差成分. 注4)検算 χT^2 = 2.18 + 3.33 + 13.33 + 25.6 = 44.44   χA^2+χB^2+χL^2 = 1.2 + 0.53 + 42.71 = 44.44 問題1. 924 263 321 138 X-square= 19.23 問題2 902 274 311 120 X-square= 6.60 問題3 928 293 337 103  簡単だが,カイ平方の計算エクセルファイル 始めに戻る
以上で通常のデータ処理はほぼ充分と思うし,あまり複雑な試験設計は解釈が 困難になるので始めから避けた方が良い. 以下は演習問題なし.必要が生じたときに参照下さい.

13.追加

1)年次・処理の二元配置の分散分析 「年次」は無数の気象条件のうちから抽出された任意標本とはみなせないので, 表記の課題は以下の方法が妥当である (三留三千男,農業実験計画法,朝倉書店,p.311ー317,1969年,から抜粋した).  4処理を5年間行ったとする.先ず,年次ごとの分散分析を行う.

 年次別分散分析    昭和27年      昭和28年 ―――――――――――――――――― ―――――――――― 要  因 自由度 平方和  平均平方 平方和  平均平方 ―――――――――――――――――― ―――――――――― ブロック 3  1204.75  401.58   2055.19  685.06 処  理 3   1299.25  433.08   960.69   320.23 誤  差 9  1393.75  154.86 1197.56  133.06    総  15 3897.75        4213.444 ―――――――――――――――――― ――――――――――          昭和29年      昭和30年      昭和31年 ――――――――――――――――― ―――――――― ――――――――― 要  因 自由度 平方和 平均平方  平方和 平均平方   平方和 平均平方 ――――――――――――――――― ―――――――― ――――――――― ブロック 3   2661.70 887.23  2596.75 865.58 2150.00 716.67 処  理 3   781.95 260.65 1722.25 574.08* 2706.50 902.17 誤  差 9   701.80  77.98 1074.75 119.42 4046.50 449.61    総  15 4145.45 5393.75 8903.00 ――――――――――――――――― ―――――――― ―――――――――

処理間差異が有意と判定されたのは昭和30年だけである. 次に処理のほかに年次を変動因にとつて,5カ年のデータを総合して分析する.          自 由 度 処理  (T)   4−1=3 年次  (Y)   5−1=4 交互作用(T Y) (4−1)(5−1)=12 の処理・年次交互作用計算のため,処理(T)と年次(Y)の2元分類表を用意する.

  2元分類(T x Y) ―――――――――――――――――― 年次\処理 A  B  C  D  計 ―――――――――――――――――― 昭27   273 187 232 186 878  28   208 134 210 195 747  29   122 76 143 96 437  30   251 151 214 254 870  31   305 160 221 246 932  計   1159 708 1020 977 3864 ―――――――――――――――――― (表の数値は4ブロックの合計である)

(1) 補正項  C.T.=38642 / (20x4)=186631.20 (2) 総平方和 S[TxY]=(2732+2082+・・・+2462)/4−C.T.=203921.00−186631.20=17289.80 (3) 処理平方和 ST=(11592+7082+10202+9722)/(4×5)−C.T.=191973.70−186631.20=5342.50 (4) 年次平方和 SY=(8782+7472+・・・+9322)/(4×4)−C.T.=196586.63−186631.20=9955.43 (5) 処理・年次交互作用 STY=S[TxY]−ST−SY=17289.80−9955.43−5342.50=1991.87

処理・年次2元配置における分散分析表 ――――――――――――――――――――――― 要因 自由度  平方和  平均平方  F ――――――――――――――――――――――― ブロック 15  10668.39  711.23 処理 (T) 3   5342.50  1780.83 1780.83/165.99=10.73 ** 年次 (Y) 4 9955.43  2488.86 T Y 12 1991.87 165.99  165.99/186.99=0.89 ns 誤差 45 8144.36 186.99 総 97 36372.55 ―――――――――――――――――――――――

注)10668.39=1204.75+・・・+2150.0, 8414.36=1393.75+・・・+4046.50 原書に一部計算ミスあり.処理平方和が191473.70−186631.20=4842.50 と あるが,191473.70 は,191973.70 のミスで,5342.50 である. 従って,交互作用も値が異なる. ブロックと誤差の自由度と平方和は年次ごとの値の合計. 交互作用検定は誤差に対して行う.結果は有意でないから, 処理効果の年次反応は変化ない. もし交互作用に有意性が認められたら,年次ごとの,あるいは適当な年次の グループに分けて,交互作用が有意にならない年次のグループ内で解析する. あるいは,似通った処理のグループにわけ,処理・年次の解析をする. 処理の有意性は交互作用に対して行う.この場合1%水準で有意.  この計算のエクセルファイル 始めに戻る
2)3元配置 飼料にリジン4水準(A),メチオニン3水準(B),蛋白2水準(C)と変えて 添加し,仔豚を2反復(ブロック化)で飼育した体重増の値が下である. 添加物組合せの効果をみたい.

―――――――――――――――――――――――――――― 反復1 反復2 ―――――――――――――――――――――――――――― A1 B1 C1 1.11 0.97 C2 1.52 1.45 B2 C1 1.09 0.99 C2 1.27 1.22 B3 C1 0.85 1.21 C2 1.67 1.24 A2 B1 C1 1.30 1.00 C2 1.55 1.53 B2 C1 1.03 1.21 C2 1.24 1.34 B3 C1 1.12 0.96 C2 1.76 1.27 A3 B1 C1 1.22 1.13 C2 1.38 1.08 B2 C1 1.34 1.41 C2 1.40 1.21 B3 C1 1.34 1.19 C2 1.46 1.39 A4 B1 C1 1.19 1.03 C2 0.80 1.29 B2 C1 1.36 1.16 C2 1.42 1.39 B3 C1 1.46 1.03 C2 1.62 1.27 ―――――――――――――――――――――――――――― 計 31.5 28.97 ―――――――――――――――――――――――――――― 1. CF 76.17960208 2. 全体 2.040897917 3. 処理 1.275647917 4. 反復 0.133352083 5. 誤差 0.631897917 ―――――――――――――――――――――――――――― A総括表 A1 A2 A3 A4 計 B1 5.05 5.38 4.81 4.31 19.55 B2 4.57 4.82 5.36 5.33 20.08 B3 4.97 5.11 5.38 5.38 20.84 計 14.59 15.31 15.55 15.02 60.47 6. 表はCについての和 7. Aの全体 0.349572917 8. A 0.04265625 9. B 0.052554167 10. AxB 0.2543625 ―――――――――――――――――――――――――――― B総括表 C1 C2 C3 計 B1 8.95 10.6 0 19.55 B2 9.59 10.49 0 20.08 B3 9.16 11.68 0 20.84 計 27.7 32.77 0 60.47 11. 表はAについての和 12. Bの全体 0.670235417 13. C 0.53551875 14. BxC 0.0821625 ―――――――――――――――――――――――――――― C総括表 A1 A2 A3 A4 計 C1 6.22 6.62 7.63 7.23 27.7 C2 8.37 8.69 7.92 7.79 32.77 C3 0 0 0 0 0 計 14.59 15.31 15.55 15.02 60.47 15. 表はBについての和 16. Cの全体 0.81808125 17. AxC 0.23990625 18. AxBxC 0.0684875 ―――――――――――――――――――――――――――― から分散分析は ――――――――――――――――――――――― 要因 自由度 平方和 平均平方 F値 ――――――――――――――――――――――― 全体 47 2.040 反復 1 0.133  0.133  4.85 * A 3 0.042  0.014  0.52 B 2 0.052  0.026  0.96 C 1 0.535  0.535  19.49 ** AB 6 0.254  0.042  1.54 AC 3 0.239  0.079  2.91 BC 2 0.082  0.041  1.50 ABC 6 0.068  0.011  0.42 誤差 23 0.631  0.027 ―――――――――――――――――――――――

となるが,3元配置は区数が増えるし,結果の解釈は困難なので, 3元配置試験の実施は通常薦められない. 2元配置での最大の目的は2因子間の交互作用をみたいことであった.その意味3元 配置は3因子間の交互作用をみることになる.これは AxB 交互作用が C によって異 なるか,BxC が A で異なるかといった意味であり,その実際的な解釈は困難である.  この計算のエクセルファイル 始めに戻る
3)ノンパラメトリック法    母集団が正規性から著しく偏っていたり,標本の分散が大きく異なっており,今 まで述べてきた上記方法の前提が失われる場合に,母集団分布の形に依存しない本 法を用いる. (1)2処理の順位による検定(符号検定) 家畜の体格といった形質で,測定のための尺度はないが優劣がみきわめられる場合 などに適用. 例題;8個(A〜H)の対になった判断(官能試験)による1対のひき肉の良否(標 本1は低温貯蔵,標本2は変温貯蔵)について,順位を,1が高,2が低,と付し たのが以下とする.

―――――――――――― 判断 標本1 標本2 ――――――――――――  A   1   2  B   1   2  C   2   1  D   1   2  E   1   2  F   1   2  G   1   2  H   1   2 ――――――――――――

このために自由度1で1:1のχ^2検定(Dixon & Moodの“符号検定”と同じ)を 行う.順位の向きは7:1で,小標本での修正した  χ^2 = ( |a - b| - 1 )^2 / ( a + b )   = ( |7 - 1| - 1 )^2 / ( 7 + 1 ) = 3.125  を計算する.ここで a = 7, b = 1.χ^2(df=1,0.05) = 3.841 であり,差がない との仮説は棄却できず,標本1,2の平均値間に有意差がない(ns). a = 8, b = 1 なら χ^2 = 4 となり有意差が検出される(*). なお,ここでの値を良否の順序ではなく,絶対値(標準品との差の観察値など)と みなしてt-検定すると,前者でも有意差が検出される. この計算は計算されたχ^2値を常に3.841と比較すればよい(1%なら6.635).  簡単だが計算エクセルファイル
(2)対になった測定値の間の差の順位による検定(Wilcoxonの順位検定)  下は J 型をした分布から抽出した値で,A,B 処理間の差をみたいとき t-検定ではその前提が無効となる.

―――――――――――――――――――――――――――――――――― A処理 1.98 3.30 5.91 1.05 1.01 1.44 3.42 2.17 1.37 1.13 B処理 0.33 0.11 0.04 0.24 1.56 0.42 0.00 0.22 0.82 2.54 ―――――――――――――――――――――――――――――――――― A-B  1.65 3.19 5.87 0.81 -0.55 1.02 3.42 1.95 0.55 -1.41 ――――――――――――――――――――――――――――――――――

値は対になった区からのものである.A-B の平均は 1.65. 試みに,分布の正規性の検定をここのエクセルで行ってみよ.A,B 処理 ともに,有意に歪み,尖っていることが検出されるであろう. 検定のため,まず差の絶対値に順位をつける.

―――――――――――――――――――――――――――――――――――――― 差の絶対値の整列:0.55 -0.55 0.81 1.02 -1.41 1.65 1.95 3.19 3.42 5.87 差の符号    : + - + + - + + + + + ―――――――――――――――――――――――――――――――――――――― 差の符号付き順位: 1.5 -1.5 3 4 -5 6 7 8 9 10 ――――――――――――――――――――――――――――――――――――――

同順位のときは順位の平均値,ここでは ( 1 + 2 ) / 2 = 1.5 を用いている. 6位以上はすべて+なので作表を省略してもよい. 負の順位を加えると -6.5 (正の順位の和のほうが小さいときはその値を使う). Wilcoxon の表から,対の数 10 での5%水準値 8 より絶対値の 6.5 が小さい ので,差がないとの仮説が棄却され,5%水準(*)で有意差ありとなる.

Wilcoxon 順位検定の表(絶対値でこの値以下だと有意差あり) 抜粋 ――――――――――――――――――――――――――――――― 対の数 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ――――――――――――――――――――――――――――――― 5% 2 3 5 8 10 13 17 21 25 29 34 40 46 52 1% 0 0 1 3 5 7 9 12 15 19 23 27 32 37 ――――――――――――――――――――――――――――――― 統計数値表(1972)によりスネデカーを一部訂正

 順位検定のためのエクセルファイル
(3)対でない測定値間の差の順位による検定(Mann-Whitney の方法) 例題1 以下は,草丈の異なるトウモロコシへのアワノメイガ産卵数の違いを確 かめようとして10個体づつ産卵数を調査したものである.このデータでは,多くの トウモロコシ個体で値は小さく,産卵数が多いのは少数であり,頻度分布図は左に 大きく歪み(ここで試せ),正規分布とは言い難い.

―――――――――――――――――――――――――― 草丈低(A) 0 14 18 0 31 0 0 0 11 0 草丈高(B) 37 42 12 32 105 84 15 47 51 65 ―――――――――――――――――――――――――― 検定のため小さい順に値を並べ,順位をつけると ―――――――――――――――――――――――――― 整列 :0 0 0 0 0 0 11 12 14 15 18 31 32 順位 :1 2 3 4 5 6 7 8 9 10 11 12 13 群の所属 :A A A A A A A B A B A A B ――――――――――――――――――――――――――

14 位以降はすべて B なので省略. また同順位は(2)同様平均とするが,順位1〜6はすべて同じ群に続しており平 均値としてもしなくても同じなので,このまま A の順位の和 T を計算すると, Aの順位の計は 1 + 2 + 3 + 4 + 5 + 6 + 7 + 9 + 11 + 12 = 60 Bの順位の計は 8 + 10 + 13 + 14 ・・・ + 20 = 170 小さいほうの値をとる.また n1,n2(群の数)で,T = 60 が, 順位の総数; n1 x ( n1 + n2 + 1 ) = 10 x ( 10 + 10 + 1 ) = 210 の半分 210 / 2 = 105 より大であることを確認する. 下の White の T 表で,n1 = 10,n2 = 10 は 78,T = 60 はこれより小さいので 両者に5%水準で有意差あり(ここで表は省略しているが,1%水準値は 71 であ るので,1%水準で有意差あり). 例題2 2群の大きさは違っても可で,

―――――――――――――――――――――――――――――――― A処理 23 45 33 43 B処理 28 15 35 28 35 22 23 22 17 20 30 16 16 30 ―――――――――――――――――――――――――――――――― のときは, 検定のため小さい順に値を並べ,順位をつけると ―――――――――――――――――――――――――――――――――――――――――― 整列 : 15 16 16 17 20 22 22 23 23 28 28 30 30 33 35 35 43 45 順位 : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 群の所属 : B B B B B B B B A B B B B A B B A A ――――――――――――――――――――――――――――――――――――――――――

である.同順位は(2)同様平均とするが,とりあえず平均値としないで計算すると, Aの順位の計は 9 + 14 + 17 + 18 = 57 Bは 1 + 2 + ・・ + 16 = 114 小さい方の 57 をとる.但し n1(小さい群の数),n2(大きい方の数)で, 順位の総数; n1 x ( n1 + n2 + 1 ) = 4 x ( 4 + 14 +1 ) = 76 の半分 76 / 2 = 38 < 57 なので,76 - 57 = 19 を検定値 T とする(Aの順位を右 から数えた値となる). 計算した T 値 19 は White の T 表での,n1 = 4,n2 = 14 の値 19 以下なので, 処理間に5%水準で有意差あり(表は省略しているが,1%水準値は 14 であるの で,1%水準での有意差はない). なお,8,9 位が A,B と異なる群で同順位である.そのためこれらは平均の 8.5 位と するので A の順位計は正確には 57.5,T 値が 18.5 となる.検定結果は変わらない. 上記データはこの説明のためスネデカーのを一部変更した.

White の T 表(この値以下だと有意差あり)  抜粋 ―――――――――――――――――――――――――― n2 \ n1 2 3 4 5 6 7 8 9 10 11 12 13 14 ―――――――――――――――――――――――――― 4 10 5 6 11 17 6 7 12 18 26 7 7 13 20 27 36 8 3 8 14 21 29 38 49 9 3 8 14 22 31 40 51 62 10 3 9 15 23 32 42 53 65 78 11 3 9 16 24 34 44 55 68 81 96 12 4 10 17 26 35 46 58 71 84 99 115 13 4 10 18 27 37 48 60 73 88 103 119 136 14 4 11 19 28 38 50 62 76 91 106 123 141 160 ―――――――――――――――――――――――――― 統計数値表(1972)によりスネデカーを一部訂正 n1 ≦ n2 とする.5%水準.

n1 + n2 > 30 のときは,Z = ( |μ−T|−0.5) / σ ここで,μ = n1 ( Ni + n2 + 1 ) / 2 , σ = √( n2 μ / 6 ) を計算する.Z と正規分布の表から有意確率 P が求まる. すなわち,Z が 2.04 以上なら5%,2.72 以上なら1%水準で差は有意である.  Mann-Whitney の方法のエクセルファイル (ここでは1%も可)
(4)Spearman による順位相関  7匹づつのネズミにある処理をして,その状態を観察して順位づけた. あるいは連続的な値を得たとしても,その分布が正規性を疑わせるので,その 観測値を順番に変えた.2名の観察者間の関連性の程度を求めたい.

―――――――――――――――――――― ネズミ番号 1 2 3 4 5 6 7 ―――――――――――――――――――― 観察者1による順位 4 1 6 5 3 2 7 観察者2による順位 4 2 5 6 1 3 7 ―――――――――――――――――――― 差 0 -1 1 -1 2 -1 0 ――――――――――――――――――――

Σ差^2 = 0^2 + (-1)^2 + ・・ + 0^2 = 8  n = 7 順位相関 rS は rS = 1 - 6 x Σ差^2 / [ n ( n^2 - 1 ) ]  ;1 - 6 ・・ の 6 は常に 6 = 1 - 6 x 8 / [ 7 x ( 49 - 1 ) ] = 0.857 下の表から,rS は5%水準で有意(1%水準値は0.893)

順位相関の有意性の表(5%水準) 抜粋 ―――――――――― 標本の大きさ ―――――――――― 5 1. 6 .886 7 .750 8 .714 9 .666 (ここ以上は通常の相関係数と同じ) 10 .632 11 .602 ―――――――――― この値以上なら5%水準で有意.

 Spearmanの順位相関計算エクセルファイル.1%もあり. 始めに戻る
4)世論調査などでの誤差の計算法 スネデカー,コクラン著 統計的方法 原著第6版.畑村又好・奥野忠一・津村 善郎訳.1985,p.202.岩波書店.より,割合の信頼95%限界は; 誤差=±1.96√(%×(100−%)/標本数)+50/n %;調査結果の%値. 600人調査して,値が10%や90%なら, ± 1.96√[ (10 x (100 - 10 ) / 600 ] + 50 / 600 = ± 2.4833 と±2.5%となる. 標本数を4倍にしても誤差は約半分にしかならない. ± 1.96√[ (10 x (100 - 10 ) / 2400 ] + 50 / 2400 = ± 1.2210  この計算のエクセルファイル
5)欠測値の処理  ブロック化した試験でデータが欠測したとき,ブロックを無視して 反復数の異なる分散分析の適用も一つの手であるが,以下の対応がある. (1)欠測が1つのとき 例;小麦4品種の収量試験結果が以下とする.

―――――――――――――――――― ブロック 品 ―――――――――――――― 種 1 2 3 4 5 ―――――――――――――――――― A 32.3 34.0 34.3 35.0 36.5 B 33.3 33.0 36.3 36.8 34.5 C 30.8 34.3 35.3 32.3 35.8 D 26.0 29.8 28.0 28.8 ――――――――――――――――――

品種 D の第一ブロックが欠測していたとする.このため, X = ( aT + bB - S ) / [( a - 1 )( b - 1 )] ここで a = 品種の数 = 4 b = ブロックの数 = 5 T = 欠測項と同じ品種の項の和 = 26.0 + 29.8 + 28.0 + 28.8 = 112.6 B = 欠測項と同じブロックの項の和 = 32.3 + 33.3 + 30.8 = 96.4 S = 観測値すべての和 = 32.3 + ... + 28.8 = 627.1 つまり X = ( 4 x 112.6 + 5 x 96.4 - 627.1 ) / [( 4 - 1 )( 5 - 1 )] = 25.442 の X の値を入れて分散分析を行うが,以下の2つの補正をする. 品種の補正 = [ B - ( a - 1 ) X ] ^2 / [ a ( a - 1 )] = ( 96.4 - 3 x 25.442 )^2 / 12 = 33.58 誤差の自由度は1を引く.

分散分析表は以下となる. ―――――――――――――――――――――――――――― 自由度 平方和 平均平方 F ―――――――――――――――――――――――――――― 品種 3 137.363 = 170.943 - 33.58 45.78 29.06** ブロック 4 35.204 8.801 5.58* 誤差 11 17.33 1.575 ――――――――――――――――――――――――――――

品種平方和は 25.442 を入れて計算した値が 170.943 多重検定のための反復数の代表値 n0 は n0 = [ 1 / ( a - 1 )] x ( Σnj −Σnj^2 / Σnj ) = (1/3) x [ 5+5+5+4 - (25+25+25+16)/19 ] = 4.73 a は品種数,nj は各品種での反復数.   この計算のエクセルファイル
(2)欠測が2つのとき 以下の表で X22 と X31 が欠測だとする.

――――――――――――― ブロック    品 ――――――― 種 1 2 3 和 ――――――――――――― A 6 5 4 15 B 15 X22 8 23 C X31 15 12 27 ――――――――――――― 和 21 20 24 65 ―――――――――――――

まず X22 に適当な値,X22 = 10.75 を入れる.これは品種 B とブロック 2 の値 の平均値である. この値をスタートとして,上記の欠測値が1つのときの X31 を計算する. X31 = [ 3 x 27 + 3 x 21 - (65 + 10.75 )] / 4 = 17.0625 次に,この X31 を入れて X22 を欠測値とし,欠測値が1つのときの X22 を計算, X22 = [ 3 x 21 + 3 x 27 - (65 + 17.0626 )] / 4 = 11.73435 この X22 を入れて X31 を計算. X31 = [ 3 x 27 + 3 x 21 - (65 + 11.73435 )] / 4 = 16.81641 以下同様に繰り返す. X22 = [ 3 x 21 + 3 x 27 - (65 + 16.81641 )] / 4 = 11.7959 X31 = [ 3 x 27 + 3 x 21 - (65 + 11.7959 )] / 4 = 16.80103 X22 = [ 3 x 21 + 3 x 27 - (65 + 16.80103 )] / 4 = 11.79975 X31 = [ 3 x 27 + 3 x 21 - (65 + 11.79975 )] / 4 = 16.80007 ・・・  X22 = 11.8,X31 = 16.8 に収斂するのでこれらの値を使う. 誤差の平方和は,これらの値を入れてブロック化した分散分析を行った結果の 誤差の平方和で 6.40.(乱塊法の計算で確かめてみよ) この自由度は欠測1つにつき1つ引いて 4 - 2 = 2 全体とブロックの平方和は欠測した表を用いて, 全体の平方和 6x6 + 5x5 + 4x4 + 15x15 + 8x8 +.... 12x12 - 65x65 / 7 = 131.428 ブロック平方和 21x21 / 2 + 20x20 / 2 + 24x24 / 3 - 65x65 / 7 = 8.92856 品種平方和は,全体の平方和−ブロック平方和−誤差平方和   = 131.428571 - 8.92856 - 6.40 = 116.10   (品種平方和の補正は不要)

分散分析表は以下となる. ――――――――――――――――――― 自由度 平方和 平均平方 F ――――――――――――――――――― 品種 2 116.10 58.05 18.14ns 誤差 2 6.40 3.20 ―――――――――――――――――――

多重検定のための反復数の代表値 n0 は n0 = [ 1 / ( a - 1 )] x ( Σnj −Σnj^2 / Σnj ) = (1/2) x [ 3+2+2 - (9+4+4)/7 ] = 2.29 a は品種数,nj は各品種での反復数. この計算のエクセルファイル 始めに戻る
6)分散均一性の検定
例;8腹の子豚の出生時の体重.腹間で差があるかを検定したい(スネデカー P.264).
――――――――――――――――――――――――――――
出生時の体重個体数平均平均平方
――――――――――――――――――――――――――――
1 2.0 2.8 3.3 3.2 4.4 3.6 1.9 3.3 2.8 1.1102.840.909
2 3.5 2.8 3.2 3.5 2.3 2.4 2.0 1.6 8 2.66 0.496
3 3.3 3.6 2.6 3.1 3.2 3.3 2.9 3.4 3.2 3.2 103.180.075
4 3.2 3.3 3.2 2.9 3.3 2.5 2.6 2.8 8 2.970.102
5 2.6 2.6 2.9 2.0 2.0 2.1 62.360.146
6 3.1 2.9 3.1 2.5 42.900.080
7 2.6 2.2 2.2 2.5 1.2 1.2 61.980.393
8 2.5 2.4 3.0 1.5 4 2.350.390
――――――――――――――――――――――――――――
分散分析は各標本の分散間で差がないとの仮定をしているが,その均一性が 疑われるときは,Bartlettの検定を行う.その計算はエクセルファイルを参照. 答え; x2 = 18.92 ** (自由度は 7. ns なら不均一とはいえない)  但し,相当平均平方値が異なっても(10倍程度迄),有意とはならないことが 多いので,この検定はしないことが多い.  この例題では 0.909 / 0.075 = 12.1 倍違っていた.また,分散が異なるとしたら, その意味することを探ることが重要である.
7)分布の正規性の検定
例;下図のような頻度分布のデータがあったとする. 個数 120,最大 22,最小 -3,平均 8.06,σ 5.56  分布が正規分布に従っているかの検定及びその概観をみるには,このエクセルファイルで 分布が歪んでいるか,尖っているかの検定をする(スネデカーP.185.自由度は無限大値).  例題では, 歪み値 0.553 (t値 2.50 * ) (値が正なら平均値より小さい個体が多い) 尖り値 -0.421 (t値 -0.96 ns) (値が負なら頂上が平ら) 両方 ns なら正規性は棄却できない  データ数が多いときは有意に歪む,尖る,が検出されるが,通常はまず有意性 は検出されないので,分布がほぼ連続的に分布していればこの検定は不要であろう. 始めに戻る
8)データの変換  正規性や分散の均一を疑わせる場合,ノンパラメトリック法は一つの解決法だが, ある種の変換を行って測定値の尺度を変えると前提が満足され,通常の方法が可能 になることがある. (1)試験区内の雑草,虫の数など(ポアソン型の分布)は,平方根 √X への変換

変換前(カラス麦中のケシの数)   変換後 ―――――――――       ――――――――――――― 438 538 77 17      20.9 23.2 8.8 4.1 442 422 61 31       21.0 20.5 7.8 5.6 ―――――――――      ―――――――――――――

(2)ある,ないのような個体の割合,罹病個体の率など(二項型の分布)は, 逆正弦変換 Arcsin(√) への変換

変換前(胴割れ罹病率,%値)    変換後 ―――――――――――      ―――――――――――― 19.3 10.1 25.2 14.0      26.1 18.5 30.1 22.0 29.2 34.7 36.5 30.2       32.7 36.1 37.2 33.3 ―――――――――――       ――――――――――――

(3)比例的なもの,平方根変換でも旨くいかないものは,対数への変換

変換前(網の中のプランクトン数)  変換後 ―――――――――――       ―――――――――――― 895 1520 43300 11000       2.95 3.18 4.64 4.04 540 1610 32800 8600      2.73 3.21 4.52 3.93 ―――――――――――      ――――――――――――

 この計算エクセルファイル. 元に戻すのもあり
14.その他 ☆10%危険率での検定 t表の10%値を利用する(F表などでも同じ)

─────────── df 0.10 0.05 ───────────  2 2.920 4.303  4 2.131 2.776 6 1.943 2.447 ───────────

(数値例) *:5%, $:10% == A == M == B == M t値 33 34 35  (34) 31 32 33 (32) 2.45 $  この位では10%. 35 34 34 (34.3) 31# 32 33 (32) 3.50 * ↓平均値は下がって 35 34 34 (34.3) 29# 32 33 (31.3) 2.41 $  も危険率は高い ==== A ==== M ==== B ==== M t 33 34 35 35 (34.3) 31 32 33 33 (32.3) 2.95 * 4反復は有意に 32 33 34 35 (33.5) 30 31 32 33# (31.5) 2.19 $ なりやすい       == A == M  == B ==   M t   33  34 (33.5)  30 #32  (31)  2.24 2反復は余程高精度   33  34 (33.5)   31# 30 (30.5)   4.24 $ でないと有意になら   33  34 (33.5) 29  30 (29.5)   5.66 * ない   35  40 (37.5) 30  35# (32.5)  1.41 この程度の試験では   35  40 (37.5)  25# 30 (27.5)   2.82 だめ  10%危険率を適用してよいかどうかは,実験者本人の判断による.但し,それを 記述するとき,“10%水準で差は有意であった”,との表現は不適で(5%水準が 一般的な約束ごとなので),“この差の有意水準は10%であった”,なら事実を述 べているだけなのでOKであろう. 始めに戻る
☆ 分散分析の図解

肥料の比較(1) 肥料の比較(2) ───────── ────────── A B A B ───────── ────────── 11 5 10 6 11 8 10 6 8 5 10 6 ───────── ────────── 平均 10 6 総平均 8 平均 10 6 総平均 8 比較(1)を分解する ┌──────┐ │ 11 5 │ 元データ ┌───┤ 11 8 ├────┐ │ │ 8 5 │ │ │ └──────┘ │ ばらつかない│部分 10 6 (8) │ │   ばらつ│く部分 ┌──┴──┐ ┌───┴──┐ │ 8 8 │ │ 3 -3 │ │ 8 8 │ + ┌─┤ 3 0 ├──┐ │ 8 8 │ │ │ 0 -3 │ │ ばらつ└──┬──┘ │ └──────┘誤差│によるばらつき かない │部分  肥料│によるばらつき │ ┌──┴──┐ ┌──┴───┐ ┌───┴──┐   │ 8 8 │ │ 2 -2 │ │ 1 -1 │ │ 8 8 │ + │ 2 -2 │  + │ 1 2 │ │ 8 8 │ │ 2 -2 │ │ -2 -1 │ └─────┘ └──────┘ └──────┘ 平均 8 2 -2 0

ばらつかない部分  = 総平均 ばらつく部分  = 元データ - 総平均 肥料によるばらつき = 肥料ごとの平均 - 総平均 誤差によるばらつき = 元データ - 肥料ごとの平均 肥料差の平方和 = 2^2 + 2^2 + 2^2 + (-2)^2 + (-2)^2 + (-2)^2 = 24 誤差の平方和 = 1^2 + 1^2 + (-2)^2 + (-1)^2 + 2^2 + (-1)^2 = 12 (全体の平方和 = 3^2 + 3^2 + 0^2 + (-3)^2 + 0^2 + (-3)^2 = 36 ) 肥料差の分散 = 24 / (2-1) = 24 誤差の分散   = 12 / (5-1) = 3

分散分析表 ────────────────────────── 要因   自由度  平方和 分散(平均平方)分散比(F) ────────────────────────── 肥料差   1 24 24    8+ 誤差 4 12 3  全体   5 36       ──────────────────────────

F分布表からf1:1,f2:4の5%値は7.71(F値がこれより大きい値になる頻度は5%). 帰無仮説:A,B肥料による効果の差はない,とした.表の意味するところは, 「この仮説を棄却して(対立仮説を採択して)誤る確率は5%以下である.」 肥料の効果の差は5%水準(有意水準,危険率)で有意である. 始めに戻る

☆Lotusで4品種(処理),6ブロックのデータの分散分析を行う(Exelでも走る) ────────────────────────────────────── : A : B : C : D : E : F : G : H : ────────────────────────────────────── 1: : ブロック1: ブロック2: ブロック3: ブロック4: ブロック5: ブロック6:@avg(B.G): 2: 品種1 : 64 : 72 : 68 : 77 : 56 : 95 : 72 : 3: 品種2 : 78 : 91 : 97 : 82 : 85 : 77 : 85 : 4: 品種3 : 75 : 93 : 78 : 71 : 63 : 76 : 76 : 5: 品種4 : 55 : 66 : 49 : 64 : 70 : 68 : 62 : 6:@avg(2.5): 68 : 80.5 : 73 : 73.5 : 68.5 : 79 : 73.8 : 7: CF = : 130538: : : : : : : 8: +X*X : 4096 : 5184 : 4624 : 5929 : 3136 : 9025 : 5184 : 9: : 6084 : 8281 : 9409 : 6724 : 7225 : 5929 : 7225 : 10: : 5625 : 8649 : 6084 : 5041 : 3969 : 5776 : 5776 : 11: : 3025 : 4356 : 2401 : 4096 : 4900 : 4624 : 3844 : 12: : 4624 :6480.25: 5329 :5402.25:4692.25: 6241 :5439.1 : 13: 分散 :分析表 : : : : : : : 14: : 要因 : df : SS :  MS : F : 有意性: : 15: : 合計 : 23 : 3654.5: 158.9 : : : : 16: : ブロック : 5 : 537.5: 107.5 : 1.089 : NS : : 17: : 品種 : 3 : 636.5: 545.5 : 5.527 : ** : : 18: : 誤差 : 15 : 1480.5: 98.7 : : : : 19:     : lsd : 12.2 : : : : : : ──────────────────────────────────────

注)B2〜G5に元データをいれる.次に以下の計算式を指定した欄にいれる.  H2〜H5:@AVG(B2.G2)〜@AVG(B5.G5) ;品種の平均値(式のコピーを利用) B6〜H6:@AVG(B2.B5)〜@AVG(H2.H5) ;ブロックの平均値(同) B7:+H6*H6*(C16+1)*(C17+1) ;補正項 B8〜H12:+B2*B2〜+H6*H6 ;平方値(式のコピーを利用) C15:+(C16+1)*(C17+1)-1 ;全体の自由度 C16:+6-1 ;ブロックの自由度で6は反復数.又は@COUNTを使用 C17:+4-1 ;品種の自由度で4は処理数. C18:+C15-C16-C17 ;誤差の自由度 D15:@SUM(B8.G11)-B7 ;全体の平方和 D16:@SUM(B12.G12)*(C17+1)-B7 ;ブロックの平方和 D17:@SUM(H8.H11)*(C16+1)-B7 ;品種の平方和 D18:+D15-D16-D17 ;誤差の平方和  E15:+D15/C15    ;全体の平均平方 E16:+D16/C16  ;ブロックの平均平方 E17:+D17/C17  ;品種の平均平方 E18:+D18/C18  ;誤差の平均平方 F16:+E16/E18  ;ブロックのF値(E18を固定) F17:+E17/E18 ;品種のF値 C19:@SQRT(2*E18/(C16+1))*2.131  ;品種平均値の最小有意差.      2.131はt表のdf(誤差の自由度)=15の5%値をいれる.ここを      自動的に行いたいなら,dfとt値をどこかにいれておき@VLOOKUP使用. G16,G17  ;F表から手作業で判断する.     f1=3,f2=15の1%値は5.24,f1=5,f2=15の5%値は2.90(同上)

 上記データの平均値の多重検定 (Tukey の方法) ────────────────────────────────────── : A : B : C : D : E : F : G : H : I : J : K : ────────────────────────────────────── 21:  :Q(df=15): D値 : 品種:平均値:1位−:  :2位−: :3位−: : 22:Q(2)=: 3.01 : 12.2 : 2 : 85 : : : : : : : 23:Q(3)=: 3.67 : 14.9 : 3 : 76 : 9 : NS : : : : : 24:Q(4)=: 4.08 : 16.5 : 1 : 72 : 13 : NS : 4 : NS : : : 25: : : : 4 : 62 : 23 : * : 14 : NS : 10 : NS : ──────────────────────────────────────

注)B22〜B24:スチューデント化されたQ(5%)値(スネデカーP.233)をいれる.  又は@V(H)LOOKUPを使用(Manual参照).df(誤差の自由度)は15.  次に以下の計算式を指定した欄に,式のコピーをうまく利用していれる. C22:+B22*@SQRT(E18/(C16+1)) ;隣同士比較の基準値.lsdに一致. C23:+B23*@SQRT(E18/(C16+1)) ;2階級離れたものの比較の基準値. C24:+B24*@SQRT(E18/(C16+1))  ;3階級   〃 F23:+E22-E23, F24:+E22-E24, F25:+E22-E25;1位-2位,1位-3位,1位-4位 H24:+E23-E24, H25:+E23-E25 ;2位-3位,2位-4位 J25:+E24-E25 ;3位-4位 G23:@IF(C22-F23>=0,"NS","*")     ;C22がF23より大ならNS,小なら* G24:@IF(C23-F24>=0,"NS","*")   ;C23がF24 〃 G25:@IF(C24-F25>=0,"NS","*")   ;C24がF25 〃 I24:@IF(C22-H24>=0,"NS","*")     ;C22がH24 〃 I25:@IF(C23-H25>=0,"NS","*") ;C23がH25 〃 K25:@IF(C22-J25>=0,"NS","*")     ;C22がJ25 〃 E22〜E25はH2〜H5を大〜小へソートしてコピーする. Duncan の検定を行うには,ここの方法に従い,B22〜B24に Duncan の表 (米澤らP. 197)の値をいれる.

とりまとめは ──────────────────────────   平均      ─── 線間に差なし 注 ────────────────────────── 1位 85 1位対 2位対 3位対 │     a 2位 76  NS ││ から  ab 3位 72  NS  NS │││ 手作業で ab 4位 62  *  NS  NS ││    b     とし, ──────────────────────────

注)「同一記号のついた平均値間には5%水準で有意差がない」と記す. NS の→↑方向が * となったら,それは NS に変える. 4品種6反復未満のときは C16, C17 を変更する.その他の変更は不要.@COUNT 使用していれば変更なし.4品種6反復を超えるときも類推して式を作ればよい. ブロック化してなく,単なる反復のときは, C18:+C15-C17    ;誤差の自由度 D18:+D15-D17    ;誤差の平方和,に変更すればよい.  ブロックの欄は無視する. Lotus参考ファイル Lotus参考ファイル2 Excel参考ファイル 始めに戻る
☆レンジとσの比 (スネデカー1966より)

――――――――― n σ/レンジ ――――――――― 2 0.886 3 0.591 4 0.486 5 0.430 6 0.395 7 0.370 8 0.351 9 0.337 10 0.325 12 0.307 14 0.294 16 0.283 18 0.275 20 0.268 30 0.245 40 0.231 50 0.222 ―――――――――

例; -1 6 13 4 1 1 3 5  のとき,最大は 13 最少は -1 で, レンジは 14,nは 8 だからσが 0.351×14 = 4.914 と簡単に推定できる. 計算値は 平方和 ss = (-1)^2 + 6^2 + ・・・ + 5^2 - 32^2 / 8 = 130 平均平方 ms = 平方和 / (n - 1) = 130 / 7 = 18.57 標準偏差(σの推定値)s = √(ms) = √18.57 = 4.31 であり,この 4.91 は 充分使える値である. このσの簡易推定値を利用して t検定(対になってない,群内個体数が等しい2群の比較)の場合, 群内変異(最大値ー最小値,レンジ)の大きさがどのくらいで有意差が検出できるか.

―――――――――――――――――― 群内個体数 群差 5%有意水準を検出するレンジ ―――――――――――――――――― 2 5 1.3 2 10 2.6 2 15 3.9 2 20 5.2 2 30 7.8 3 5 3.7 3 10 7.4 3 15 11.1 3 20 14.9 3 30 22.3 4 5 5.9 4 10 11.8 4 15 17.8 4 20 23.7 4 30 35.6 5 5 8 5 10 15.9 5 15 23.9 5 20 31.8 5 30 47.8 10 10 30 10 20 65 10 30 98 20 10 58 20 20 116 20 30 174 ――――――――――――――――――

注)両群こみの平均値は100(よって以下の値は%とみてよい),両者の個々のレン ジは同一とした.群内個体(標本)数が2,両群平均値間の差が5(102.5と97.5) あるとき,群の最大ー最小値が1.3以下(つまり101.3〜98.7以内の変異)であれば 5%水準の有意差が検出される. 分散分析で,反復(群)内変異(レンジ)がどの程度なら処理平均値間の有意差が 検出できるか.

―――――――――――――――――――――――――――――――――――――― 処理数 3 3 3 3 3 反復数 2 3 4 5 6 処理平均レンジ 10 20 10 20 10 20 10 20 10 20 反復内レンジ 3 6 7.6 15.2 11.7 23.5 15.5 31.1 19.1 38.2 処理数 4 4 4 4 4 反復数 2 3 4 5 6 処理平均レンジ 10 20 10 20 10 20 10 20 10 20 反復内レンジ 3 6 7 14.1 10.7 21.4 14 28 17.1 34.2 処理数 5 5 5 5 5 反復数 2 3 4 5 6 処理平均レンジ 10 20 10 20 10 20 10 20 10 20 反復内 3 6 6.7 13.5 10.1 20.2 13.3 26.6 16 32 ―――――――――――――――――――――――――――――――――――――――

注)3処理2反復で反復内変異(最大値−最小値)が3以下なら,処理平均値間レンジ 10 の 5% 有意差が検出される. 処理平均値間のレンジ20なら,反復内レンジ6以下. 同一処理数,反復数内での値は比例しているので,レンジ5の場合は反復内変異は1.5 以下. (エクセル,35k)  始めに戻る
☆重回帰について 複数の独立(説明)変数(X1, X2, ・・・・)に対する目的変数Yの回帰.  Y = b0 + b1*X1 + b2*X2 +・・・・・・ を最小自乗法で求める.b1,b2・・・は偏回帰係数と呼ばれる. 係数相互間の比較には,X1,X2 の標準化した値 [(X−平均値)/標準偏差] で係数を 求める(標準偏回帰係数). 重相関係数 (R) は重回帰式で予測される値と実際の観測値との相関係数.R^2は回 帰の当てはめの成功の測度 (寄与率). 独立変数を増やしていけば寄与率は大きくなる.自由度調整済みの重相関係数が定義 されており,(計算方法は省略)これが増加する限り追加された独立変数は有効. 多変量解析法のほんのさわりはこちら
☆N人の誕生日が全部違う確率 40名のクラスで誕生日がたまたま同じペア(何日でも可)がある可能性は案外高い.

―――――――――――――――――――――――――――――――― 人数   計算            確率(1−この値,が可能性) ―――――――――――――――――――――――――――――――― N=2 364/365 = 0.997 注1 N=3 364/365 x 363/365 = 0.991 注2   N=4 364/365 x 363/365 x 362/365 = 0.983 以下同様; N=10 364/365 x ・・・・x 356/365 = 0.883 N=20 364/365 x ・・・・x 346/365 = 0.588 N=22 = 0.524 N=23 = 0.492 N=25 = 0.431 N=30 = 0.293 N=35 = 0.185 N=40 = 0.108 N=45 = 0.059 N=50 = 0.030 N=100 = 0.0000003 ・・・                    366人では,勿論 N=366 364/365 x  ・・・・ 0/365 = 0    ――――――――――――――――――――――――――――――――

注1;2人では,2人の内のある一人と,次の1人が違う(364日残る)確率. 注2;3人では,3人の内のある一人と,次の1人目が違う(364日残る)確率 ×2人目も違う(363日残る)確率; この場合の意志決定についてはここを
以上で生物統計学のテキスト終わり. 始めに戻る