統計学
多くのデータを要約し、中に含まれている情報を把握するための手段。
要約した値のことを統計量という。
統計量には 平均値、分散、標準偏差、などがある。
データ:数字。
情報 :データを整理して意味付けしたもの。
要約値:複数のデータを四則演算によって要約した統計量。とする。
代表値:要約をしないポイント的な統計量。とする。
歴史 ~ 古典統計学と近代統計学 ~
19 世紀末から20 世紀初頭にかけての統計学は、
データを要約して調査対象の情報を数学的に記述することが中心。
記述統計学 または 古典統計学と呼ばれる。
統計学のターニングポイントが 1925 年にやってきた。
フィッシャーは、
「実験や試験の対象となる集団は、非常に多くの例からなる
ある理想的な集団の標本に過ぎない」ことに気付いた。
そして、
実験や試験の対象となる現実の集団について測定したデータと
理想的な集団について測定したデータでは、
数学的な取り扱いを変える必要があるということを発見した。
ex )
100 人の日本人から体重を測り平均値 60 kg 、標準偏差 10 kg だった場合。
この 100 人は日本人という集団の標本であって、
日本人全体というわけではない。
平均値 60 kg 、標準偏差 10 kg も 100 人の集団の要約値であり、
日本人全体の要約値ではない。
知りたいのは日本人全体の要約値。
日本人全体の集団のことを母集団とよび、100 人の標本を標本集団と呼ぶ。
本当は、母集団を調べたいが、数が多すぎて調べられないので手近な標本で我慢している。
フィッシャーが考えた統計学は、
それによって母集団の様子を記述する
というもの。
この新しい統計学は、推測統計学 または 推計学、近代統計学と呼ばれている。
現在では、単に統計学と言えば推測統計学を示すことになってる。
その後、近代統計学はネイマンやピアソン等の人々によりさらに発展。
こちらから。
http://www.snap-tck.com/room04/c01/stat/stat01/stat0101.html
https://istat.co.jp/stprimer
以上。