前回扱った「平均値」は、飛びぬけて高い値を持ったものがあると、中心(と思われる部分)から大きく外れてしまう、という性質があった。
学生であればテストの順位は気になるところ。例えば10人でテストを受けて
A | B | C | D | E | F | G | h | I | J |
99 | 100 | 98 | 95 | 100 | 99 | 94 | 0 | 84 | 100 |
という結果だった場合、平均値は86.9点となる。Iさんの立場に立ってみると、「84点か、平均よりちょっと下だから、まぁ真ん中くらいかな」という感想を抱くことだろう。ところが実際には10人中下から2番目の順位となる。平均は必ずしも中央を表さない。
そこで別の考え方が必要になってくる。中央値だ。中央値とは
資料を小さい順に並べて、ちょうど真ん中にある数
のことだ。先のテストで考えてみよう。中央値を出すには、まず資料を小さい順に並べ替える。
A | B | C | D | E | F | G | h | I | J |
99 | 100 | 98 | 95 | 100 | 99 | 94 | 0 | 84 | 100 |
↓
0 | 84 | 94 | 95 | 98 | 99 | 99 | 100 | 100 | 100 |
並べ替えたちょうど真ん中の数を見る。ただし、今回は10個の数が並んでいて、5番目と6番目の二つがちょうど真ん中になっている。そんな時は「5番目の数と6番目の数のちょうど真ん中」の数が中央値となる。
今回は98と99のちょうど真ん中、98.5が中央値だ。
2 | 3 | 7 | 8 | 11 |
という並びがあれば、中央値は7。
10 | 12 | 33 | 40 | 89 | 90 |
という並びがあれば、中央値は(33+40)÷2=36.5。
資料が偶数の時は、中央のさらに中央をとる必要がある。
もちろん、中央値も万能ではない。再度、先ほどのテストの中央値を見てみよう。
0 | 84 | 94 | 95 | 98 | 99 | 99 | 100 | 100 | 100 |
中央値は98.5だった。しかし
0 | 1 | 4 | 7 | 98 | 99 | 99 | 100 | 100 | 100 |
というテストの結果でも、中央値は98.5となる。あるいは
90 | 91 | 93 | 97 | 98 | 99 | 99 | 100 | 100 | 100 |
という結果でも、中央値は98.5となる。
ばらつき具合が分かりづらい、という点が中央値にはあることを意識しておくといい。