ラベル 分散 の投稿を表示しています。 すべての投稿を表示
ラベル 分散 の投稿を表示しています。 すべての投稿を表示

2016年1月7日木曜日

記述統計学実践編

記述統計学とは、データを見易くすること


 データを整理して誰でも見易くする「記述統計学」を実践してみましょう。

 R Consoleにデータ(Aテストの点数)を入力し、平均と分散を表示させてみます。



Aテストの結果
Aテストの点数結果と平均点と分散

  • 平均値:72.4
  • 分散:259.3778


 分散(データの散らばり具合)に関しては、他のテストの点数結果を比較する時に使います

 例えば、Bテストの結果がこんな結果となった場合

Bテストの結果
Bテストの点数結果と平均点と分散
  • 平均値:78.1
  • 分散:225.8778

記述統計学から分かること


 AテストとBテストでは、Bテストの成績が良かったという評価ができる。(先生視点

 Aテストでは、Bテストと比べて、出来る人と出来ない人の差が激しい。(生徒視点

 つまり、生徒の能力を正しく判定するテストの出来は、

 分散が小さいBテストが優れていると考えられる。

 分散1つで、テストの善し悪しを評価出来るのは、記述統計学の強み。

 では視覚的な視点で、データを見るとどうでしょうか?

描画コマンド
par(mfrow=c(2,1)):描画を表示する画面を、2行1列で表示する
br <- seq(40,100,15):40~100までを15等間隔でデータを入力
br::「40,55,70,85,100」
hist(A,breaks=br,prob=T):Aのデータ、breaksはx軸の目盛、probは相対頻度を表す


ヒストグラム
ヒストグラム
 
 視覚的に表示することによって、数字だけの統計結果をやんわりさせることができます。

 AテストとBテストのヒストグラムでは、なかなか分かりづらいですね。

 図と数字両方をうまく使い分けることが大切です。