中央値

前章・平均値

前回扱った「平均値」は、飛びぬけて高い値を持ったものがあると、中心(と思われる部分)から大きく外れてしまう、という性質があった。

学生であればテストの順位は気になるところ。例えば10人でテストを受けて

A B C D E F G h I J
99 100 98 95 100 99 94 0 84 100

という結果だった場合、平均値は86.9点となる。Iさんの立場に立ってみると、「84点か、平均よりちょっと下だから、まぁ真ん中くらいかな」という感想を抱くことだろう。ところが実際には10人中下から2番目の順位となる。平均は必ずしも中央を表さない。

そこで別の考え方が必要になってくる。中央値だ。中央値とは

資料を小さい順に並べて、ちょうど真ん中にある数

のことだ。先のテストで考えてみよう。中央値を出すには、まず資料を小さい順に並べ替える。

A B C D E F G h I J
99 100 98 95 100 99 94 0 84 100

0 84 94 95 98 99 99 100 100 100

並べ替えたちょうど真ん中の数を見る。ただし、今回は10個の数が並んでいて、5番目と6番目の二つがちょうど真ん中になっている。そんな時は「5番目の数と6番目の数のちょうど真ん中」の数が中央値となる。

今回は98と99のちょうど真ん中、98.5が中央値だ。

2 3 7 8 11

という並びがあれば、中央値は7。

10 12 33 40 89 90

という並びがあれば、中央値は(33+40)÷2=36.5。

資料が偶数の時は、中央のさらに中央をとる必要がある。

もちろん、中央値も万能ではない。再度、先ほどのテストの中央値を見てみよう。

0 84 94 95 98 99 99 100 100 100

中央値は98.5だった。しかし

0 1 4 7 98 99 99 100 100 100

というテストの結果でも、中央値は98.5となる。あるいは

90 91 93 97 98 99 99 100 100 100

という結果でも、中央値は98.5となる。

ばらつき具合が分かりづらい、という点が中央値にはあることを意識しておくといい。

TOP