【連載 統計解析力アップ講座】 演習;統計的品質管理(3)
|
| 統計的品質管理講座の第3回です。統計的品質管理は、数々の要因の中から品質に影響をおよぼす異常原因を見つけ出して対処することが目的です。今回は、複数の要因の中から影響をおよぼしているものを見つけるための基礎となる手法−分散分析−についての演習です。 ○例題1 ある製品の製造において、4種類の材料A〜Dについて次のような特性データを取得しました。材料によって特性に違いがあるといえるでしょうか?
●答 2つの材料どうしの平均に違いがあるかどうかは、t検定を実施することで判断できます。しかし、4つの材料のそれぞれの組合せで違いがあるかどうかをt検定で見るには最大6回のt検定を実施しなければなりません。 ここで、材料の違いによる変化をばらつきとみなすとどうでしょう?材料の違いによるばらつきと、材料が変わらないときのばらつきの違いがあるかを判定すれば、材料の変更による影響を検定できます。 ばらつきに違いがあるかどうかは、F検定を実施すればわかります。つまり、材料の違いによる標準偏差(分散)と、材料が変わらないときの標準偏差(分散)をF検定することによって、平均の違いを検定することができます。 このような分析方法を分散分析といいます。Excelの「分析ツール」には分散分析を実施するツールが含まれています。上記のデータについて「分析ツール」の「分散分析:一元配置」を実施すると、次のような結果が得られます。 「グループ間」で示された値が材料を変えた時のばらつきを、「グループ内」で示された値が材料を変えない時のばらつきを示しており、その分散の比が「観測された分散比」に算出されています。そして「P-値」で示された値が、計算された分散比がF分布上で発生する確率を示しています。この確率が5%以下だと、材料の違いによるばらつきが材料を変えない時のばらつきより明らかに大きい、すなわち材料によって違いがあることを示します。今回の結果ではP-値が0.04%と5%を下回っていますので、材料によって特性に違いがあると判定できます。 ○例題2 ある製品の製造において、材料A〜Dだけでなく、それぞれの加工温度も変えて次のような特性データを取得しました。材料、加工温度によって特性に違いはあるでしょうか?
例題1に比べ、材料の違いだけでなく加工温度の違いも追加されてデータの条件の項目が2つになっています。このような条件の項目のことを要因といいます。このデータは、材料と加工温度という2つの要因について取得されたデータになっている、といえます。 このように要因が2つあるデータについても、分散分析ではそれぞれの要因について平均の違いがあるかどうかを一度に検定することができます。 要因が2つある分散分析を2元配置の分散分析、または2元配置実験と呼びます。これに対して例題1のような要因がひとつだけの分散分析を1元配置の分散分析、または1元配置実験と呼びます。 また、各要因が取る値のことを水準と呼びます。材料の要因にはA〜Dの4水準がある、と表現します。 2元配置の分散分析もExcelの「分析ツール」にツールが含まれています。上記のデータについて「分析ツール」の「分散分析:繰り返しのない二元配置」を実施すると、次のような分析結果が得られます。 「行」の分散が加工温度によるばらつきを、「列」の分散が材料によるばらつきを示します。また、加工温度、材料のどちらも変えないときのばらつきが「誤差」の分散で示されており、「行」「列」のそれぞれの分散と「誤差」の分散との比をとってF検定することによって、加工温度、材料による影響を検定できます。 表には、それぞれの分散比のF分布上での確率が「P-値」で示されています。加工温度の確率は0.009588(=0.96%)、材料の確率は4.51E-05(これは0.0000451=0.004%を示す指数表記で、Excelでは自動的にこのような表示になってしまうことがあります。)と、どちらも5%以下となっており、加工温度によっても材料によっても特性値に違いがあると判定できます。 ○例題3 広告、PR電話の販売促進活動の効果を見るために、ある小売店で実施した店舗実験の結果が次のように得られています。広告、PR電話、継続期間の各要因が売上に影響があるかどうかを調べてください。
●答 このデータは、要因が3つある3元配置実験です。分散分析では要因が増えた多元配置実験についても分析できます。Excelの「分析ツール」では多元配置実験に対応していませんが、このデータを3つの2元配置実験とすることで、分析ツールによる分析結果をもとに3元配置実験の分散分析表を作成することができます。 まず、上記のデータを次のように3つの2元配置の表に書き換えます。各表は、それぞれの表に含まれない要因の違いを無視してデータを並べるだけで作成できます。
このような表を2元表といいます。それぞれ2元配置実験とみなすことができますが、同じ条件のデータが繰り返して取得されたことになっていますので、この場合の分散分析は繰り返しのある2元配置実験になります。 一つ目の2元表について「分析ツール」の「分散分析:繰り返しのある2元配置」を実施すると次のような分散分析表が得られます。 表中「標本」と書かれた行が広告の要因の効果を示し、「列」と書かれた行が継続期間の要因効果を示しています。 繰り返しのある2元配置実験は、要因同士の交互作用の影響も求められることが特徴です。交互作用とは別な要因がとる値(水準)によって結果に対する影響が異なる効果のことで、いわゆる要因同士の相乗効果のことです。ここでは、広告と継続期間の相乗効果があるかどうかが、「交互作用」と書かれた行によって示されています。広告と継続期間の交互作用を広告×継続期間の交互作用と記述します。 変動要因の名称をわかりやすく書き換え、同様に他の2つの2元表についても「分析ツール」によって分散分析表を求めると次のような結果が得られます。 この3つの分散分析表を比べて見ると、同じ変動要因の数値と合計の数値が同一になっていることがわかります。それぞれ同じデータから分析されているので値が同じになるのです。これを利用して3元配置実験の分散分析表を次のように作成することができます。 まず、各分散分析表から数値を抜き出し、次のように空欄のある3元配置実験の分散分析表を作成します。 次のように空欄の数値を算出します。 (1)=合計の変動−要因・交互作用の変動の合計 =1542-(870.3+・・・+93)=14 (2)=合計の自由度−要因・交互作用の自由度の合計 =17-(2+・・・+2)=4 (3)=変動/自由度=14/4=3.5 (4)〜(9)=各分散/繰り返し誤差の分散 (10)〜(15)はExcelのFDIST関数を用いて、FDIST(観測された分散比、自由度、繰り返し誤差の自由度)で求めます。 これより、次のような分散分析表が完成します。要因・交互作用の影響があるかどうかは、それぞれのP-値が5%(0.05)以下かどうかで判定できます。 この結果、P-値が5%以下となった広告、継続期間、PR電話の要因と、PR電話×広告の交互作用が売上に対して影響していると判定できます。また、広告×継続期間の交互作用とPR電話×継続期間の交互作用はP-値が5%に近い値なので、もう少しデータを増やす等で実験の精度を上げると売上に影響しているという判定に変わるかもしれない、ということもわかります。 分散分析を元にして、もっと多要因の影響を効率的に求められるよう発展した手法が実験計画法です(実験計画法については第6回で紹介します)。次回、第4回では相関分析と回帰分析を紹介します。回帰分析を利用すると、分散分析や実験計画法の解析がより簡単に実施できるようになります。 <参考文献> ・「Excelでできる統計的品質管理」(同友館) ・「Excelで学ぶ営業・企画・マーケティングのための実験計画法」(オーム社)
|