前回に引き続き、データ分析の紹介です。
前回までにデータ分析のもとになるデータの話をしてきました。今回はデータ分析の流れについて話をします。
データ分析の流れ
ざっとした流れでいうと、目的を決めて、データを収集し、可視化したうえで、分析を行い、評価といった感じです。目的と収集の際の留意点やデータの種類は既にお話した通りです。
少しおまけの話をしておくと、収集の際に不要なデータがあったり、不足のデータがあったりすると削除や補完といった前処理が必要になります。
データクレンジングとかデータクリーニングという機能がついています。データの汚れ具合が大きいとこの作業が一番手間と時間がかかるか場合が多いです。ツールによってはこの点を自動もしくは支援するものがあるので、積極的に利用してください。
生データを忠実に利用することも一つの方法ですが、異常値はせっかくの分析をあいまいなものにしてしまうことが多いので、前処理をきちんとすることをお勧めします。
可視化と分析を分けて記載しましたが、多くの場合は一体的にやってしまいます。しかし、分析手法が適切かどうかが判断しづらい場合もあります。できれば、一旦、データを可視化して、傾向や異常値の確認等を行ってから分析したほうが確実です。状況によって再度データクレンジングを行うことになります。
可視化と分析そして評価
もちろん、可視化と言っても、グラフ等に図化するために結果的には初歩の分析になるという点では可視化と分析が一体的になるとケースも間違ってはいません。
実際はこの図化された内容をさらに特定の目的をもって分析することがデータ分析の重要な作業となります。
例えば、商品別の売上数量を縦棒グラフにするだけなら、何となく商品ごとで多い、少ないがわかるという結果になりますが、多い順に並び替えて、さらに累積数の折れ線グラフを加えることで売り上げに占める割合を示すと、売れ筋、中間、死に筋がわかるいわゆるABC分析が可能になります。
販売商品を売れ筋に絞るのか、中間をもって売れるようにするか、あえて死筋も残して、ラインナップも充実させるのか目的とその評価によって、その後の判断は大きく変わります。つまり、可視化、分析、評価まで含めて一セットと考えてください。
◆目的別にわかるデータ分析手法の一覧
https://www.strh.co.jp/knowledge/data-analysis-method
マーケティングコンサルのStrh社のブログページです。分析に目的に応じた4つの手法分類とその具体的な手法の説明が図解でわかりやすく紹介されています。
◆データ分析とは?基礎から分かる手法と流れ、仕事でのメリットも解説
https://aismiley.co.jp/ai_news/what-is-data-analytics/
AI製品の比較サイトAIsmileyの1ページです。4つの手法分類や具体的な13の分析手法もありますが、エクセルとPythonでどのように分析するかが記載されている点がいいです。
◆目的別データ分析手法11選! 分析手順や注意点も解説
https://crm.dentsusoken.com/blog/ma-vol108/
電通総研の顧客接点DXのブログページです。目的に応じて、利用する分析手法の説明が簡単ですが、要点を抑えた説明で書かれています。
◆データ分析とは何か?そのメリット、進め方、分析手法など、その本質を理解しよう
https://www.fsi-embedded.jp/solutions/datautilization/what-is-data-analytics/
富士ソフトの組込開発サイトの1ページです。いきなりQ&Aから始まり、データの種類、分析手法の説明以外にも分析ツールや注意点、さらに必要スキルと盛りだくさんなページです。
◆データ分析とは?代表的な10の手法や手順、ポイントを解説
https://www.persol-group.co.jp/service/business/article/15798/
人材派遣のパーソルのデータ分析に関するページです。手法や手順にポイントの説明はもちろんですが、人材派遣会社らしく、データ分析に必要スキルが書かれています。