本コンテンツは、お客さまがご利用のOSまたはブラウザーへ対応しておりません。
最新のOS、ブラウザーにアップデートしてください。

図解で思考整理(実践編)

ビジネスマンが抱える悩みを、「図」にすることで解決します。

vol.24 データを視覚的に捉えるチャートと、
統計学の基本「平均、分散、標準偏差」で一歩先へ!

初心者にもわかりやすい!
魅惑のデータ・アナリシスと統計学の世界にようこそ!

AI、ビッグデータなどの登場に伴う「産業革命4.0」の過渡期の真っただ中にいる私たち。世界の製造業が必死にIoT化を進めることで生き残りを図ろうとしているなか、エンジニアだけでなくデータ・サイエンティストの力も重要になってきています。彼らが武器とするデータの扱い方や読み解き方は、多くの皆さんにとっても、その基礎に触れるだけでも物事を新しい見方で捉え、埋もれていた価値を発見するヒントとなります。
そこで前回に引き続き今回も、データをわかりやすく視覚化するためのチャート作りを紹介しながら、データ分析と統計学の基本についても解説していきます。

データを視覚的かつ直感的に比較できる3つのチャート

フレームワークで使われることが多い「レーダーチャート」「バブルチャート」「ボリュームチャート」は、複数のデータを視覚的かつ直感的に比較するのに適しています。すべてのチャートの原型となるマトリックスを作ってから、これら3つのチャートの形にしてみましょう。いずれも基本的なチャートですから、一般的な表計算ソフトで作成可能です。

※フレームワーク・・・経営戦略や業務改善など、さまざまなビジネス局面において、課題解決や現状分析をするための思考方法。思考の枠組み。

「レーダーチャート」の例 (商品スペックの比較)
比較しやすくするポイント
・属性の似ている項目同士を隣同士に置く
・図形内部を塗りつぶす、メモリの数値を書き込むなど、見やすく工夫する

「レーダーチャート」の例 (実力テストにおける学校とAさんの比較)
比較しやすくするポイント
・各項目の平均値を求めて図形内に表示する

レーダーチャートは放射状の軸と、クモが巣を張ったような軸からなり、「クモの巣」や「スターチャート」とも呼ばれます。ひと目で各項目のバランスが把握できるのが特徴で、製品やサービスの性能比較などに便利です。見やすさを考えると、五角形から八角形くらいになるよう項目数を設定するのが良いでしょう。

「バブルチャート」の例(受注件数、売上高、売上シェアの比較)
比較しやすくするポイント
・バブルの重なり方を考えてメモリの間隔を設定する
・バブルの重なっている部分の色を濃くする

バブルチャートの特徴は、縦軸と横軸に加えて、3番目の値である項目の大きさをバブル(円)の大きさで表現できることです。例えば縦軸に受注件数、横軸に売上高、売上シェアをバブルの大きさで示して、事業を3軸から分析することができます。ほかにも、顧客満足度などを把握するためのポートフォリオ分析など、応用の幅が広いため、重要なビジネスシーンにもしばしば登場します。

「ボリュームチャート」の例(商品スペックの比較)
比較しやすくするポイント
・強調したい項目の色を濃くするなどカラーリングで工夫
・各項目の名前をラベルとして図中に配置する
・データから分析した解説を図中にフキダシとして埋め込む

ボリュームチャートでは、各項目の時系列にそった変化量をわかりやすく表すことができます。面の大きさは規模を表しているので、総量や構成比率などを把握しやすいのも特徴。毎月の売上データをボリュームチャート化すれば、ある月に意外な商品が売れているなど、思わぬ動きも発見しやすくなります。

ゼロから知る統計学
データのばらつき具合を示す「分散」を知る

さて、ここからは統計学の世界に入っていきましょう。最も初歩的で簡単な統計分析は平均の算出です。データの合計値をデータの個数で割った平均によって、ある事象の概要がつかめ、これらを比較できます。例えば同じ会社で切磋琢磨するA班とB班の売り上げを、それぞれの所属メンバーの人数で割れば、1人あたりの平均売上高が求められます。
しかしながら、平均だけでは統計データの傾向を把握するには不十分。なぜなら個々のデータは平均値からずれているからです。

A班、B班の売上比較例
A班とB班で1人あたりの売上高は同じだが、その実態は大きく異なる。

平均からのデータのばらつき具合は、上の図からわかりますが、比べるデータの量が多くなってくると図を作るのは現実的ではありません。そのためこの場合、各班の実情を知るためには「平均からのデータのばらつき具合」を数値化するのが最もシンプルな手段なのです。そしてそれを可能とするのが統計学の「分散」と「標準偏差」なのです。ではその計算方法を解説しましょう。

分散の例

分散は個々のデータが平均値からどのくらい離れているか、その総和を個数で割ることで得られる「ばらつき値」です。平均値との差をそれぞれ2乗しているのは、平均よりマイナス値があると計算が合わなくなるため。分散の平方根(ルート)を「標準偏差(SD=Standard Deviation)」と呼び、標準偏差を比べることが一番簡単にばらつき具合を把握する方法です。
上の図でいうとC班とD班の平均は同じ「100万」ですがばらつき具合はC班が「0」、D班が「19250の平方根」となります。標準偏差の値が大きい方が、ばらつき具合が大きいと判断できますから、D班はC班よりも売り上げの多い人と少ない人の格差が大きいといえます。
分散と標準偏差は、製品のサンプリング検査などに応用することができます。例えば異なる2つの工場で同じ製品を作った場合に、それぞれの規格(例えば重さや大きさ)の標準偏差を求めて、値の大きい方が品質のばらつきが激しいと考えられます。自分の手元にある何らかのデータで、一度標準偏差を求めてみてください。それによってデータ分析と統計学の重要性や汎用性を実感してみましょう。

PROFILE

永田 豊志
永田 豊志ながた・とよし
知的生産研究家、ショーケース代表取締役社長。九州大学卒。リクルートで新規事業開発を担当。その後、出版社や版権管理会社などを経て、ショーケース・ティービー(現ショーケース)を共同設立。図解思考、フレームワーク分析などビジネスパーソンの知的生産性研究にも取り組んでおり、国内外での執筆活動や講演でそのノウハウ普及を行う。

記事公開:2019年9月