テストの点数や身長,体重の測定値などのデータがあるとき,平均値というモノさしを使ってデータ情報を数値で要約します。平均は,皆さんがよく知っている通り,
個々のデータをすべて足し合わせ,
データの個数で割る
ことで求めることができます。
例えば,「今回の中間テストの平均点は60点でした」という言葉を聞くと,多くの人は図1のような60点台の人数が一番多い棒グラフ(ヒストグラム)を想像すると思います。
これは,「平均点はだいたい真ん中の点数にある」と思っているからだと想像されます。
しかし,“しおり”にあったグラフ(図2)のように,人数の多いところ(近辺)に平均があるとは必ずしもいえません。平均の計算式では,高得点(80点・90点台)が数人いると,その影響を受けてデータの真ん中より高い数値が平均点となるからです。
この他にも,データから計算した平均は50点台(56点)であっても,データの分布を棒グラフで書くと,50点台の人数がとても少ないという図3のような場合も起こります。
平均は計算も簡単でとても便利なモノさしですが,それだけに頼らずに,データの分布をグラフに描いて見ることで,より詳しく傾向を見ることができます。
実際のデータ解析では,平均だけではなく,最頻値(データの一番多いところ)や中央値(データを並べたときに真ん中にくる値)といったモノさしを使って,データの特徴を表現していきます。
(図2)
(図3)