有意水準とは何か?

こんにちは.M2 の吉岡です.アドベンドカレンダー11日目を担当します.

私は塾講師のアルバイトをしており,その際にはよく高校生に数学を教えています.
今年から,高校の数学分野に統計が追加されたことをきっかけに,有意水準という言葉を授業で目にする機会が増えました.
また,論文を読む際にも,データを統計的に評価する際に有意水準が示されています.

そこで,有意水準とは何か改めてまとめてみました.
とりあえず ChatGPT に聞いてみました.回答結果は以下のようになりました.

統計学において,有意水準(significance level)は,仮説検定を行う際に用いられる重要な概念です.
有意水準は,帰無仮説が正しいと仮定した場合に,得られるデータが観測された結果と同等かそれ以上に極端である確率の上限を指します.
一般的には,α で表され,以下のように定義されます:

有意水準(α ) : 帰無仮説が正しいと仮定した場合に,誤って帰無仮説を棄却する確率の上限

以上がChatGPTの回答になります.
これを具体的に考えていきます.

仮説検定とは?

仮説検定は,統計学における基本的な手法で,データを用いてある主張や仮定がどの程度支持されるかを評価するプロセスです.
例えば,ある広告が集客効果を持っているかどうかなどを評価することが仮説検定にあたります.

仮説検定における仮説

仮説検定では,以下の2つの仮説が設定されます.

  1. 帰無仮説(H0):主張したい仮説と対をなす仮説
  2. 対立仮説(H1):主張したい仮説

例えば,広告が集客効果を持っているという仮説を立てたい場合,

  1. 帰無仮説(H0):広告が集客効果を持っていない
  2. 対立仮説(H1):広告が集客効果を持っている

と仮説を設定します.

仮説検定におけるプロセスと有意水準

仮説検定は,以下のような手順で進められます.

  1. 仮説の設定:
    • 帰無仮説(H0):主張したい仮説と対をなす仮説
    • 対立仮説(H1):主張したい仮説
  2. データ収集と統計量の計算: サンプルデータを基に検定統計量を計算

  3. p値の算出: 観測されたデータが帰無仮説の下で得られる確率を計算

  4. 仮説の判断: p値と有意水準を比較し、帰無仮説を棄却するかどうかを判断

仮説検定では,p値(p-value)という指標が計算されます.
p値は,帰無仮説が正しいと仮定した場合に,観測された結果と同等またはそれ以上に極端な結果が得られる確率を示します.

この時,有意水準は,帰無仮説を棄却するための閾値として機能します.
例えば,p値が0.03であり,有意水準が5%(0.05)である場合,p値は有意水準を下回るため,帰無仮説を棄却します.

  • p値 < α (有意水準):帰無仮説を棄却.
  • p値 > α (有意水準):帰無仮説を棄却しない.

先ほどの広告の例で考えてみます.

  1. 仮説の設定:
    • 帰無仮説(H0):広告が集客効果を持っていない
    • 対立仮説(H1):広告が集客効果を持っている
  2. データ収集と統計量の計算: 広告を出した店舗と出していない店舗の売上データを収集

  3. 統計量の計算とp値の算出: 広告を出した店舗と出していない店舗の売上の平均値を比較し,その差が偶然で起きる確率(p値)を算出(具体的な算出方法は省略します.)

  4. 仮説の判断: p値と有意水準を比較し、帰無仮説を棄却するかどうかを判断する.p値が有意水準より小さい場合,広告による影響が統計的に有意であると判断する.

結論

仮説検定は非常に重要な統計学の概念であり,科学的な結論を導く上で重要なものです.
しかし,そのプロセスは,高校生にとっては難しく感じられるかもしれません.
実際に,仮説検定がわからない!という生徒を多く見てきました.
それでも,基本的な考え方を理解することで,統計的な結果を正しく解釈し,データに基づいた意思決定を行う基礎が身に付きます.
ぜひ,この記事を参考に基本的な考え方を理解していただければと思っています.

参考

  1. https://ja.wikipedia.org/wiki/仮説検定


Comment

No comment