統計_標準誤差

標準偏差とよく似たものに標準誤差 ( SE:StanDard Error ) というものがある。
これは標本平均のばらつきを表す。

標本平均で「母平均を推測する時の誤差の大きさ」を表す指標になる。

 

標本平均の度数分布を描く

無作為抽出した標本から平均値を取り、この値を m1 ( ex 60 ) としてプロット。
この標本集団を一旦母集団に戻して再度無作為抽出で別の標本集団から
平均値 m2 ( ex 55 ) をプロットし、これを繰り返す。

そうすると、標本平均値の分布が出来上がる。
f:id:koshinRan:20181016122020p:plain

 

この分布に関して、次のようなことが成り立つ。

  1. 母集団がどんな分布をしていても、標本平均の分布は漸近的に
    正規分布に近似する。これを中心極限定理 という。
    漸近 ( ぜんきん ):徐々に近づいていくさま。
    漸近的に:標本集団の例数が多いほど正規分布により近似するという意味。
  2. 標本平均の平均値は母平均と一致する。
  3. 標本平均標準偏差 sm は、
    標本集団の例数を n 、母標準偏差を σ とすると、次式で求められる。
    f:id:koshinRan:20181016121357p:plain

標本平均標準偏差 sm のこと標準誤差と呼ぶ。

標準偏差 σ は普通未知なので、
標本集団から計算した母標準偏差推測値 s で代用して次のように計算する。
https://bellcurve.jp/statistics/course/8616.html から拝借
f:id:koshinRan:20181016121456p:plain

 

 

標準誤差標本平均のばらつき

標本平均で「母平均を推測する時の誤差の大きさを」表す指標になる。

例数が増えれば増えるほど標準誤差小さくなる。
そのため標本平均母平均推測した時誤差が小さくなり、
標本平均の信頼性が増す。

データ数が多いほど実験結果が信頼できるようになる、
という常識を裏打ちしている。

このような標準誤差の意味を考えると、
よく見かける下記の図のような平均値の経時的変化を表わすグラフでは
平均値の上下に標準誤差を付け加えるのが適切だとわかる。
f:id:koshinRan:20181016121550p:plain

このグラフの意味するところは、

実験結果では、標本集団の平均値グラフの折れ線のように変化した。
しかしこの標本平均本当の平均値 ( 母平均 ) を推測すると標準誤差程度
推測誤差がある。
そのため母平均は標本平均の上下に標準誤差をプラス・マイナスした幅の間を
変化していると考えられる。
故に、子のグラフはそのような帯状のグラフとして見てほしい。

ということ。

 

標準誤差は推測統計学独特の指標

標準誤差は推測統計学独特の指標であり、記述統計学にはない。

したがって、
平均値の上下に標準誤差を描くということは単に標本集団の様子を
グラフ化しているだけではなく、母集団の様子を推測してグラフ化している。

つまり、記述統計学ではなく推測統計学を適用している。
故に、平均値の信頼区間を描くのが本来であり、
標準誤差信頼区間の簡便な代用品ということになる。

 

 

標準偏差を付け加えるける場合

標準誤差に対して、標準偏差を付け加えるける場合。

A 錠剤 100 錠と B 錠剤 100 錠の重さを想定したところ、
平均値はどちらも同じだが、データのばらつきは A 錠剤の方が小さかった。
つまり錠剤の均一性は A 錠の方が高かったとする。

このことをグラフ化したい時は平均値の上下に標準偏差を付け加えるのが適切。
なぜならば、
平均値の上下に標準誤差を付け加えると母平均の推測範囲を表わすグラフになり、
データのばらつき具合を表わすグラフではなくなってしまう。
f:id:koshinRan:20181016121606p:plain

つまり、このグラフの意味するところは次のようなことになる。

A 錠剤 も B 錠剤 も平均値は同じだが個々の錠剤のバラツキは A 錠の方が小さい。
したがって、A 錠の方が錠剤の均一性が高い。
つまり A 錠の方が錠剤を製造する技術は優れている。

 

 

このように標準偏差標準誤差はその意味するところを十分に考えて
適切に使い分ける必要がある。

 

こちらから。
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html

以上。