#10 データ分析手法(クロス集計・決定木)

 [公開]
icon 秋山 賢 が 2018/06/08 17:35 に投稿
  投稿を編集(サインイン)
  ストック
  アンケート回答

  目次

データ分析の技術について紹介したいと思います。
今回は、データ分析手法の中で「クロス集計分析」「決定木分析」について書きたいと思います。


クロス集計分析

アンケート調査によく利用される分析手法であり、アンケートの回答に性別や年代といった回答者の属性項目を交えて集計するデータ分析手法です。
エクセルなどの表計算ソフトでも、手軽にクロスする項目を選定して集計結果を得ることが可能です。

「ある商品に対して、購入者全体の70%の人が満足していたが、満足度に男女差があり、男性では満足している人の割合が30%と低かった」といったように、設問の回答傾向を、別の設問の回答別に細分化して見ることができるため、異なるグループ間での回答傾向の比較が可能になります。

以下は、全国の 60 歳以上の男女を調査対象にした
「どの程度生きがい(喜びや楽しみ)を感じているか」のクロス集計の例
image-20180606081935727.png
出典:内閣府ホームページの「平成25年度 高齢者の地域社会への参加に関する意識調査結果」を加工して作成

あらかじめ立てた仮説を検証したり、回答の傾向から新たな仮説を見つけ出すことをクロス集計分析によって行うことが出来ます。

決定木分析

ディシジョン・ツリーとも呼ばれており、アンケート結果などを基にツリー構造の図を作り、分岐点ごとにクロス集計を繰り返して偏りが最も大きくなる分岐条件を見つけ出す分析手法です。
「影響の強い要因」の把握と「要因の組み合わせ」を把握することができます。

例えば、年齢別、性別などの項目で樹形図を作り、どのような属性の人が購入志向が高いかを探ることができます。
以下、「ある商品の購入志向」の決定木分析の例
image-20180607102131571.png

決定木分析は、さまざまな業種、業態で活用されています。
例えば、金融機関の取引履歴から顧客属性別の貸し倒れリスクを測ったり、機器の動作ログから故障につながる指標を見つけ出したりといったことに決定木分析が利用されています。


 コメント追加