演習問題
次のデータは3元配置実験データです。このデータを解析しなさい。
図表1 3元配置実験データ
| |
使用量 |
| |
材料の種類 |
従来 |
1割増し |
1割減 |
添 加 率 |
現状 |
A |
52 |
39 |
30 |
| B |
70 |
51 |
50 |
| C |
45 |
39 |
36 |
| 2割増し |
A |
61 |
56 |
40 |
| B |
56 |
66 |
68 |
| C |
39 |
36 |
35 |
解説
分散分析法と回帰分析法による解析を説明します。
□分散分析法
変動分解の公式を用いて分散分析表を求める方法を解説します。
変動分解の公式を用いた分散分析表(一般形)は図表2のようになります。
図表2 分散分析表(一般形)
| 変動因 |
変動(平方和) |
自由度 |
平均平方(分散) |
分散比 |
| A |
SA |
fA=(a-1) |
VA=SA/(a-1) |
VA/Ve |
| B |
SB |
fB=(b-1) |
VB=SB/(b-1) |
VB/Ve |
| C |
SC |
fC=(c-1) |
VC=SC/(c-1) |
VC=Ve |
| A*B |
SA*B |
fA*B=(a-1)(b-1) |
VA*B=SA*B/(a-1)(b-1) |
VA*B/Ve |
| A*C |
SA*C |
fA*C=(a-1)(c-1) |
VA*C=SA*C/(a-1)(c-1) |
VA*C/Ve |
| B*C |
SB*C |
fB*C=(b-1)(c-1) |
VB*C=SB*C/(b-1)(c-1) |
VB*C=Ve |
| 繰り返し誤差 |
Se |
fe=abc(n-1) |
Ve=Se/[abc(n-1)] |
|
| 合計 |
ST |
f T=abcn-1 |
|
|
|
(注) a:要因Aの水準数、b:要因Bの水準数、c:要因Cの水準数、n:繰り返し数
|
| 【公式】 |
| 変動(平方和) |
:ST=SA+SB+SC+SA*B+SA*C+SB*C+Se |
| 自由度 |
:f T=fA+fB+fC+fA*B+fA*C+fB*C+fe |
分散分析表を作成する手順は次のとおりです。
- 修正項CTを求める
- 総変動STを求める
- 各要因の変動(平方和)を求める
- 合成要因AB、AC、BCの変動(平方和)を求める
- 交互作用項A*B、B*C、A*Cの変動(平方和)を求める
- 誤差変動(平方和)を求める
|
| 各々の計算式は以下のとおりです。 |
| 1. |
CT(修正項)=(全データの和)²/全データ数 |
| 2. |
ST=個々のデータの2乗の和-CT |
| 3. |
SA=(A1水準でのデータの和)²/A1水準でのデータ数+(A2水準でのデータの和)²/A2水準でのデータ数+……+(Aa水準でのデータの和)²/Aa水準でのデータ数-CT
SB、SCも同様。 |
| 4. |
SAB=(A1B1水準でのデータの和)²/A1B1水準でのデータ数+(A2B2水準でのデータの和)²/A2B2水準でのデータ数+……+(AaBb水準でのデータの和)²/AaBb水準でのデータ数-CT
SBC=(B1C1水準でのデータの和)²/B1C1水準でのデータ数+(B2C2水準でのデータの和)²/B2C2水準でのデータ数+……+(BbCc水準でのデータの和)²/BbCc水準でのデータ数-CT
SAC=(A1C1水準でのデータの和)²/A1C1水準でのデータ数+(A2C2水準でのデータの和)²/A2C2水準でのデータ数+……+(AaCc水準でのデータの和)²/AaCc水準でのデータ数-CT |
| 5. |
SA*B=SAB-SA-SB
SA*C=SAC-SA-SC
SB*C=SBC-SB-SC |
| 6. |
Se=ST-SA-SB-SC-SA*B-SA*C-SB*C |
それでは、実際に計算して分散分析表を作成します。
| CT(修正項) |
= |
755161²/18=41953.389 |
| ST |
= |
52²+70²+……+68²+35²-41953.389=2629.611 |
| SA |
= |
(52+70+45+39+51+39+30+50+36)²/9+(61+56+39+56+66+36+40+68+35)²/9−41953.389 |
| = |
112.500(添加率の変動) |
| SB |
= |
(52+70+45+61+56+39)²/6+(39+51+39+56+66+36)²/6+(30+50+36+40+68+35)²/6−41953.389 |
| = |
343.111(使用量の変動) |
| SC |
= |
1464.111 (材料の変動) |
| SAB |
= |
624.944 (読者は計算してください) |
| 同様にして、 |
| SAC |
= |
1756.944 |
| SBC |
= |
1999.111 |
| SA*B |
= |
624.944-112.500-343.111=169.333 |
| SA*C |
= |
1756.944-112.500-1464.111=180.333 |
| SB*C |
= |
1999.111-343.111-1464.111=191.889 |
| Se |
= |
2629.611-112.500-343.111-1464.111-169.333-180.333-191.889=168.334 |
|
|
|
図表2に値を当てはめ、計算すると図表3のような分散分析表が完成します。
図表3 分散分析表
| 変動要因 |
平方和 |
自由度 |
平均平方 (分散) |
F0 (分散比) |
P-値 |
F 境界値 |
| 添加率 |
112.50 |
1 |
112.50 |
2.67 |
0.18 |
7.71 |
| 使用量 |
343.11 |
2 |
171.56 |
4.08 |
0.11 |
6.94 |
| 材料 |
1464.11 |
2 |
732.06 |
17.40 |
0.01 |
6.94 |
| 添加率×使用量 |
169.33 |
2 |
84.67 |
2.01 |
0.25 |
6.94 |
| 添加率×材料 |
180.33 |
2 |
90.17 |
2.14 |
0.23 |
6.94 |
| 使用量×材料 |
191.89 |
4 |
47.97 |
1.14 |
0.45 |
6.39 |
| 誤差 |
168.33 |
4 |
42.08 |
|
| |
| 合計 |
2629.6 |
17 |
|
ここで、p-値(危険率)は関数FDISTを用いて求めます。FDIST(x, 自由度1, 自由度2)で、たとえば、添加率のときはFDIST(2.67, 1, 4)=0.18となります。同様に、使用量のそれは、FDIST(4.08, 2, 4)=0.11、材料のそれは、FDIST(17.40, 2, 4)=0.01です。
F境界値は関数FINV(確率、自由度1、自由度2)で、たとえば添加率のときは、FINV(0.05, 1, 4)=7.71、使用量のそれは、FINV(0.05, 2, 4)=6.94、材料はFINV(0.05, 2, 4)=6.94です。
分散分析表から、変動要因{添加率、使用量、材料、添加率×使用量、添加率×材料、使用量×材料}が生成量の増減に効果があるかどうか、つまり統計的に有意であるかがわかります。
そのためには、P-値(危険率)を見ます。添加率の危険率は0.18つまり18%です。(信頼率は82%です。)危険率18%で有意と判断しました。ということです。
もしも、予め危険率を5%と設定していれば、添加率の危険率は18%なので有意とは言えません。使用量の危険率は11%なので、これも有意とは言えません。材料の危険率は1%なので、有意であると言えます。さらに交互作用項は有意とは言えません。結局、有意な要因は材料のみとなりました。
危険率を11%と設定していれば、材料と添加率が有意ということになります。
(注)危険率の設定は5%が多いようですが、あくまで当事者が決めるべきことだと思います。
平均平方(分析)の円グラフを描いてみましょう(図表4)。
図表4 平均平方(分散)の円グラフ
材料は57%と断然トップです。次いで、使用量となっています。
□回帰分析法で解析
回帰分析を実行します。要因として、材料の種類(危険率1%)だけでなく、使用量(危険率11%)も採用してみます。
図表5は回帰分析実行用データです。
統計学の理由により、1割減とC列データを削除しています。
図表5 回帰分析実行用データ
| 従来 |
1割増し |
A |
B |
生成量 |
| 1 |
0 |
1 |
0 |
52 |
| 1 |
0 |
0 |
1 |
70 |
| 1 |
0 |
0 |
0 |
45 |
| 1 |
0 |
1 |
0 |
61 |
| 1 |
0 |
0 |
1 |
56 |
| 1 |
0 |
0 |
0 |
39 |
| 0 |
1 |
1 |
0 |
39 |
| 0 |
1 |
0 |
1 |
51 |
| 0 |
1 |
0 |
0 |
39 |
| 0 |
1 |
1 |
0 |
56 |
| 0 |
1 |
0 |
1 |
66 |
| 0 |
1 |
0 |
0 |
36 |
| 0 |
0 |
1 |
0 |
30 |
| 0 |
0 |
0 |
1 |
50 |
| 0 |
0 |
0 |
0 |
36 |
| 0 |
0 |
1 |
0 |
40 |
| 0 |
0 |
0 |
1 |
68 |
| 0 |
0 |
0 |
0 |
35 |
図表6は回帰分析実行結果です。
図表6 回帰分析実行結果
| 回帰統計 |
| 重相関 R |
0.829 |
| 重決定 R2 |
0.687 |
| 補正 R2 |
0.591 |
| 標準誤差 |
7.954 |
| 観測数 |
18 |
| |
自由度 |
変動 |
分散 |
観測された分散比 |
有意 F |
| 回帰 |
4 |
1807.222 |
451.8056 |
7.141964 |
0.0029 |
| 残差 |
13 |
822.3889 |
63.26068 |
|
| 合計 |
17 |
2629.611 |
|
| |
係数 |
標準誤差 |
t |
P-値 |
| 切片 |
33.22 |
4.191946 |
7.92525 |
2.48E-06 |
| 従来 |
10.67 |
4.592047 |
2.322857 |
0.037052 |
| 1割増し |
4.67 |
4.592047 |
1.01625 |
0.328052 |
| A |
8.00 |
4.592047 |
1.742142 |
0.105075 |
| B |
21.83 |
4.592047 |
4.754597 |
0.000376 |
図表6から、生成量を表す式は
です。
生成量が最大になるのは、使用量が従来で、材料がBのとき、このとき
33.22+10.67+21.83=65.72 となることが期待されます。
確認実験は必ず実施しましょう。
<参考文献>
上田太一郎、近藤宏ほか「Excelでできるデータ解析入門」同友館
|