Power BIで分析入門:データ整理とデータ分析の違いとは?
データを可視化すればそれは即、データ分析と言えるのか…?
今回は、Power BIで分析をしたい…その前段として、「データ分析」と「データ整理」の違いはどこにあるのか、についてお話します。
データ分析とデータ整理の違い!?
データの可視化というと、グラフを使ってデータの内容を説明する、とイメージされる方が多いと思います。
しかし、データが可視化されればデータ分析なのか?というとそれはちょっと違います。ここでは、「データ分析」と「データ整理」の違いを明確化できるようになりましょう。
たとえば、ある小売チェーン店の売上のデータ。支店毎の月次売上グラフなどはよく目にするようになっているでしょう。ではこれは、「データ分析」と「データ整理」のどちらでしょうか?
データ整理は現状を把握するもの
棒グラフや折れ線グラフなどの可視化されたデータは、数字の羅列を分かりやすく見せることができます。
たとえば売上順に棒グラフを作成すれば、支店ごとに売上の高いところと低いところがすぐに分かりますし、平均値をとって折れ線グラフにした場合は、売上が右肩上がり、右肩下がりなどどのように遷移しているか、すぐに分かります。
しかし、これはデータ分析ではありません。データ整理です。なぜなら、現状や過去のデータを把握しやすくはなりましたが、新たな知見は得られないからです。
データ分析とは「次のアクションに移す」ための根拠探し
一方、データ分析は、そこから次のアクション「課題解決のための行動」に結びつけられるもの、と定義できます。では、データ整理とデータ分析の違いはどんなことがあるのでしょうか。もう少し、詳しく見ていきましょう。
例えば、あるチェーン店の支店A・B・C、それぞれの売上の違いを見て、B支店は売上が低いことが分かったとします。しかし、それだけでは翌月からどんな改善をすべきかのアクションを決めることができません。
ですから、そこからデータの見方をもう一歩進める必要があります。そのためにまず、仮説を立ててみるのです。「B店の売上が低い理由は、営業時間の差にあるのではないか?」それを検証するのがデータ分析です。A・B・C支店における1時間ごとの売上の変化をグラフにすれば、どの時間帯にどれだけの売上があるか分かります。これを比較することで、B支店が閉店している時間帯の売上を、他支店の売上データから予想することができます。たとえば、B支店が閉店した1時間後に、他支店での来店者数が多かった場合、B支店は閉店時間を延ばす必要がある、というアクションが考えられるのではないでしょうか。
あるいは、客単価はどうでしょう。「B支店では、顧客1人あたりの購入金額が少ない、もしくは購入する点数が少ないかもしれない」。こういった仮説の場合は、支店ごとに、顧客1人当たりの単価および商品数と売上とを比較する必要があるでしょう。もし売れている商品と売れない商品が支店ごとに違うと分かれば、B支店で売れる傾向のある商品をもっと入荷する必要がある、というアクションを考えられます。
こんな風に、「データ整理」によって把握した問題の原因を、データによって裏付けられるように試行錯誤する作業こそ、「データ分析」と言うのです。
データ整理もデータ分析もどちらも大事
経営者は、「B支店の売上をもっと上げよ」と言うだけかもしれません。しかし、売上を上げる方法は状況によりバラバラです。マネジメント層は、何によって売上を上げるのか、データを根拠として対策を決めなければなりません。
だからこそ、データ分析はどんどん重要になってきているのです。もちろん、スタティックな情報が入ってこなければ、課題を発見することもできませんから、データ整理をすることも大切です。データ整理のない現場では、データ分析は存在しません。
例に出したケースのような、支店ごとの「売上」についてなら、仮説を考えるまでもなく、経験値で検討がつくマネージャーのほうが多いかもしれません。しかし、特殊なケースになれば、データの重要性がぐっと上がってくるでしょう。
不確定要素のある高度な分析を可能にするために
キャンペーンの効果測定というようなケースは、分析の難易度が上がります。キャンペーン活動をして、売上が上がるのは普通だからです。
しかし、そのキャンペーンがどれだけ効果があったかを正確に知るには、キャンペーンのなかった前年同月比や、同じキャンペーンを行ったときの売上の平均と比較しなければなりません。
また、キャンペーンによる売上かそうでないかを区別するためのタグ付け(キャンペーン展開場所で取られた商品とそれ以外の商品の区別ができる印づけ)なども必要になります。
このように、新しい分析をするためには、いろいろな下準備が必要なのです。分析を行うデータアナリストは、キャンペーンの実施前から、どういうデータが必要かを、あらかじめ当たりをつけていなければなりません。
データ整理を担当する人にとっても、どんなデータがあると何ができるのか、あるいは何が手に入るのか、知っておくことは、重要でしょう。そうすることで、BIの分野に関わる業務が本当の意味で有効な現場になってきます。
分析データは必ず二軸
今回は、具体的なデータをお出ししませんでしたが、最後にひとつだけ、データ分析のためのチャートについて触れておくと、データ分析のためには必ず二軸での分析が必要になります。
データ分析を行う際に棒グラフは厳禁です。たとえば、先の例でいえば、「支店の売上」と「来店者数」という二軸のバブルチャート、「売上」と「顧客単価」による散布図など…必ず二軸以上のデータから状況を分析することになります。
次回は、このような基本的なデータ分析について、図を交えてもう少し解説したいと思います。