品質管理では算術平均・算術標準偏差をよく使い、環境管理では幾何平均と幾何標準偏差をよく使います。
平均値にもいろいろあると言うのは皆さんよくご存知です。普通に平均と言えば、算術平均を言います。標準偏差と言えば、算術標準偏差です。
品質管理で、製品の質量の規格が「2000.00g±2.00g」と決まっている場合に、計量器で質量を測る場合などです。今日の生産個数が100個で、平均質量が2000.12g・標準偏差が0.72gとかです。平均は規格中心からのズレを表し、標準偏差がバラツキの大きさを表します。統計的品質管理の最初で学びます。
ところが環境管理では少し様子が変わります。有害物質の気中濃度が「5.00ppm未満」となるように管理すると決まっている場合に、濃度を10点×2日間測定したとします。算術平均で1.22ppmで算術標準偏差が1.02ppmであっても安心できません。
何故かと言うと、環境測定の値は正規分布を取らないからです。そこで、測定値の対数をとって幾何平均を求めて、幾何標準偏差を使って管理をします。この対数変換をして正規分布に表示する方法は、環境管理に限らず社会科学の分野でもよく使われます。
右の例は、夏目漱石の有名な小説のなかのひとつの文がどれだけの長さかをみたものです。上は普通のグラフで、下は対数目盛のグラフです。右の例は、日本の市の人口を並べたグラフで、同じく下が対数目盛です。いずれも、下のグラフはほぼ正規分布しています。
同じような例としては、世帯収入とか貯蓄額なんかもありますね。算術平均では実感が湧かないような大きな金額になる世帯収入や貯蓄額でも、対数をとればきれいに正規分布をします。
西内啓さんの「統計学は最強の学問である」というシリーズがベストセラーになっていますが、世の中の多くのデータから正解を導くことは重要です。