分散分析表の見方

分散分析表(ANOVA表)は、分散分析(ANOVA: Analysis of Variance)の結果をまとめた表で、統計的にどの要因が実験結果に有意な影響を与えているかを判断するために使います。分散分析表の各項目を正しく理解することで、実験結果を適切に解釈することができます。

それでは、分散分析表の各項目について詳しく説明していきます。

分散分析表の構成

典型的な分散分析表は、以下のような項目で構成されています。

項目自由度 (df)平均平方 (MS)F値 (F)P値 (P)
要因AdfAMSAFAPA
要因BdfBMSBFBPB
誤差(残差)dfErrorMSError
合計dfTotal

1. 自由度 (df: Degrees of Freedom)

自由度は、データの中で自由に変動できるデータポイントの数を指します。これは、分散分析において非常に重要な概念です。自由度は、データのサンプル数や因子の数に基づいて計算されます。

  • 要因Aの自由度 (dfA): 要因Aに関連する水準数 - 1
  • 要因Bの自由度 (dfB): 要因Bに関連する水準数 - 1
  • 誤差の自由度 (dfError): (全データの個数) - (要因Aの水準数) - (要因Bの水準数) + 1
  • 合計の自由度 (dfTotal): 全データの個数 - 1

2. 平均平方 (MS: Mean Square)

平均平方は、平方和(Sum of Squares, SS)を自由度で割った値です。各因子や誤差に対する分散の指標となります。

  • 要因Aの平均平方 (MSA): 要因Aに関する平方和 (SSA) ÷ dfA
  • 要因Bの平均平方 (MSB): 要因Bに関する平方和 (SSB) ÷ dfB
  • 誤差の平均平方 (MSError): 誤差に関する平方和 (SSError) ÷ dfError

3. F値 (F-value)

F値は、各因子の平均平方を誤差の平均平方で割ったものです。この値が大きいほど、要因が応答に与える影響が強いことを示します。具体的には、以下のように計算します。

  • FA = MSA ÷ MSError
  • FB = MSB ÷ MSError

F値は、実際のデータに基づいて計算されるため、F分布に従います。これにより、要因が有意かどうかを判断する基準となります。

4. P値 (P-value)

P値は、得られたF値が偶然生じる確率を示します。一般に、P値が小さい(通常は0.05以下)場合、その要因が統計的に有意であると判断されます。P値が小さいほど、その要因が応答に有意な影響を与えている可能性が高いです。

分散分析表の読み方の例

以下に、分散分析表の具体的な例を示します。

項目自由度 (df)平均平方 (MS)F値 (F)P値 (P)
温度 (因子A)21507.50.01
圧力 (因子B)2603.00.07
誤差(残差)1520
合計19

この表の見方を説明します。

  1. 温度(因子A): 自由度が2、平均平方が150、F値が7.5、P値が0.01です。P値が0.05以下なので、温度は応答に有意な影響を与えていると判断できます。
  2. 圧力(因子B): 自由度が2、平均平方が60、F値が3.0、P値が0.07です。P値が0.05より大きいので、圧力は応答に統計的に有意な影響を与えていないと判断されます。
  3. 誤差(残差): 自由度が15で、平均平方が20です。誤差項は実験のばらつきを示します。

まとめと今後の学習の指針

分散分析表は、実験結果を統計的に分析し、どの因子が結果に有意な影響を与えているかを判断するための重要なツールです。各項目を理解し、正しく解釈することで、実験の結果をより深く理解することができます。次に進む際には、実際のデータを使って分散分析を行い、その結果を解釈する練習をしてみてください。それが、実験計画法や統計解析の理解をさらに深める助けとなるでしょう。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。