Power BIで分析入門:データ分析は難しくない
前回は、BIエキスパートを目指す方々には、ぜひ覚えておいていただきたい「データ整理とデータ分析の違いとは?」について、紹介しました。
今回は、「データ分析」とは具体的にどんなことをすればよいのか? 実際にグラフを見ながら、解説していきましょう。決してデータ分析は難しくない!と思っていただけるのが、今回のゴールです。
では、さっそく見ていきましょう。
二軸のデータで分析するのが基本
データの集計や整理の段階では、一軸のデータも使いますが、分析では二軸が基本と前回も紹介しました。
まず、次のサンプルを見てみましょう。地域ごとの売上棒グラフです。
こちらは、「地域」のみの一軸のデータです。一軸だけの視点でわかるのは、地域ごとの偏りがあるというデータの「特徴」です。このチャートでは「○○だから売上が多い」ということはわかりません。
では次に、二軸のチャートにして見てみましょう。下図をご覧ください。
こちらは、「地域」に加え、「人口」という情報の加わった二軸のバブルチャートです。ほとんどの地域は人口が増えると売上も上がり、関東は売上も人口も高くなっているという右肩上がりのチャートになりました。ここで見えてくる仮説はいくつかあります。
・関東地域の売上が高かったのは、人口に起因しそうだ
・上下があるものの、人口が多い地域では売上が高いので、人口比で売上が上がるのではないか
・人口正比例ならば、地域ごとの特徴はないことになるが、北海道・東北地域は人口が少なく売上が高いため、別の要因が考えられるのではないか
棒グラフの状態とは、見方が大分変わりますね。単なる見た目の特徴から一歩進んで、もっと一般化された「人口は売上に相関しそうだ」という知見が得られるようになっています。ここから得られたファインディング(発見)は、「人口比例」ということです。
ファインディングから、次のアプローチへ
では、もう一つは、数量の合計と地域を使ったバブルチャートです。こちらでは「売上数量に売上が完全に比例している」というファインディングがあります。
こうなると、きれいな正比例を描いていなかった人口比と比較すると、ある地域の中で、1人あたりの売上個数が極端に多い地域や、来客数が人口比に比例していない地域があるのではないか、といった推測が成り立ってきます。
このようにして、データを根拠に一般的な推測へと導けるようになると、どのようなデータを調べるべきかという、次のアプローチがわかるようになってきます。例えば、この例で言えば、人口との相関性をさらに深く掘っていくのか、それとも人口以外の要因を深く掘っていくべきか、というように、ストーリーの次の筋道を考えられるようになりました。
ここが、データ分析のもっとも基礎的な考え方です。
「つまり、こういうことじゃないですか?」という、もう一段階踏み込んだ、仮説を加えられること。これがデータ分析の第一歩です。
データの整理だけでは、データ分析になりませんよ、とお話したものの、データ分析は、臆するほど難しいものではありません。
ただし、同じ二軸のデータを作るにしても、数あるデータの選択肢の中から意味のある組み合わせでチャートを作成する必要があります。そこを考えていく過程が、分析で大切なところです。この「有効な組み合わせを決める」鍛錬を積むことが、BIの分析力を上げていくためには、欠かせません。
BIスペシャリストに求められること
さて、BIスペシャリストやデータ分析の担当者が、上司や経営層から「とりあえずデータをまとめてレポートにしておいて」と言われたときに目指したいのは、Excelの機能でなんとなくグラフを並べることではなく、分析に役立つ二軸のチャートを用意することです。
それも、「複数の軸に基づいた、知見が得られるヒントになりそうなチャートを作る」ことが求められます。
とはいえ、上司や依頼者が本当にほしいチャートはどんなものか、なかなか正確な要望がヒアリングできないというお話はよく聞きます。そのときは、「使えそうなチャート」をいくつか多めに用意して提案することが重要です。提案した結果「こういうことができるならば、こんな分析もできますか?」といったリクエストを引き出すことができれば、しめたものです。
データ分析の第一歩は、なるべくピントの合っていそうなレポートを複数提案してみること。データはあるのにうまく活用されていないという現場にも、生の数字を意味のあるチャートの形で見せることで、価値あるデータに変わってくるということも多いと思います。
Power BIは、そのために試行錯誤がしやすく、何度でもさまざまなチャートが瞬時に作れるよう機能が豊富に提供されています。ぜひ、日々のデータ整理にも、データ分析にも、お役立てください。