統計データは、作成者の意図によって、姿、形を、まったく別のモノとして伝えることができる。
典型的なデータ改ざんの手法
下の図をみてほしい。すべて同じグラフだ。
Y軸の刻みを変える
違ってみるのは、Y軸の刻みを変えているからだ。
作成者が情報の受け手に、一番左のイメージを伝えたい時は、縦軸を100刻みにする。
現実は、何も動いてないと伝えたい時は、一番右のイメージにするために、縦軸を1万刻みに変える。
単位を変える
桁を変えてたら、まずい時は、「単位」を変えたりもする
cm → mm
kg → ton
データは、作成者によって、どのようにもできる。
情報の歪曲だ。
また、横軸の単位を変えたり、都合のよい軸間だけを抜き取る方法もある。
時間軸を変える
例えば、以下のグラフがある。
上昇感を伝えたい時は、
赤い部分を抜き取る
そして、このグラフをお客様に見せる
横軸が1~5までしかない!
いつわりの情報が出来上がる。世の中、こんなものばかりだ。
なぜなら、自分にとって、またクライアントにとって、都合の悪いグラフは出せないからだ。
かならず脚色して、良く見えるように工夫する。悪い言い方をすれば、「改ざん」する。
作成者の主体と意図を確認せよ
以上のように、世の中は、発信者の都合に合わせデータが作成されている場合が多い。
したがって、グラフを見る時は、必ず発信媒体、発信者、その意図、単位などに注意しながら見ると、面白いモノが見えてくる。
冷静に考えて分析すると、あまりにも、作成者の意図が露骨にわかり過ぎて、面白い時がある。
また、ずるがしこいと感じる時もある。
子供は、ほぼ100%騙されている
発信者の意図に、騙されている大人も多いが、子供は、ほぼ100%騙されている。
そういったデータベースが不正確な基盤上で話が展開される。
そういった子供が大人になり、データの真実を確かめずに議論や仮説を始める。
一つ一つ検証する時間がないので、仕方ないのであるが。
だからこそ、自分の頭や体で体感して、「どこかこのデータはおかしい」と直感する力を身に着けることも大事だ。
グラフに騙されないためにすべきことは?
グラフを読み取る力を付けるには、「多面的に情報を集めること」と、「現場に行く」ことだ。
とは、いうものの、ビックデータ時代に入ったので、「現場に行く」ことの比重は少し説得力が弱まるかもしれない。
しかし、ビックデータですらウソをつく事だってあるかもしれない。なぜなら、ビックデータをプログラミングしているのは、人だからだ。
そこにも、悪意があれば、同じことである。
ミルキヅク