【コラム】調査内容にあった集計方法と最適なグラフの選び方
■アンケートの集計方法を考える
「アンケートを収集したはいいけれど、どう分析したらよいかわからない」
そんな経験がある方は多いのではないでしょうか。
調査内容にあった集計方法や適切なグラフの選び方に、誰しも最初は悩むものです。
今回のデータ分析ブログでは、アンケートを収集したあとの流れについて、紹介いたします。
■何を知りたいか
今回は、仮のイベントアンケートを設計し、以下の内容を取得しました。
属性情報として取得したのは、「性別」「年齢」「居住地域」「アクセス手段」です。
これらは「説明変数」などと呼ばれます。
また「参加満足度」を「目的変数」として、5段階評価で取得します。
※もちろん性別や年齢を「目的変数」と捉える場合もあります。
「参加理由」「イベントに期待したこと」「感想」は記述で取得しました。
取得した項目の「狙い」、すなわち、その項目を使って「何を知りたいか」を整理します。
・年齢や性別による満足度に差がないか
・居住地域やアクセス手段で開催地に対する意見、評価が別れるか
アンケートの回答をもとに、実施イベントの「成功度合い」を評価したいと思います。
まずは、参加満足度の指標において属性による影響があるのか調べるために、回答者の属性を表にします。
■データ構成の把握
男性と女性の回答者数と回答者中の男女比を表にしてみました。
データの構成比率を知りたい場合は、円グラフを使います。
男性と女性どちらが多いかが一目でわかりますね。
年代別の回答者数とその比率も、性別と同じように表にして、円グラフを作成することができます。
■2つの要素を合わせて集計する
アンケートに回答してくれた人の特徴が、二つの表と円グラフで可視化されました。
当日の様子からは、若年層は女性が多く、中年層では男性が多いように感じました。
ここから、年代別の男女比を出していきます。
ここで使うのは、「クロス集計」です。
クロス集計の結果は、次のような帯グラフを使うと見やすくなります。
年代別の男女構成比率が可視化されました。
今回のアンケートでは、あと二つ属性を取得していました。
集計していない以下のような状態だと、回答者の特徴(どのような人がどれくらいいるのか)が掴めません。
回答者の属性の内訳を一つの表にまとめてみます。
グラフを使わずともサマリ表などを作成することで概要を把握することが可能です。
集計結果は作成者のみならず、関係者などにも報告、公開することが多いため「情報をいかに上手く圧縮するか」がポイントになります。
次回は、同じアンケート結果を使いながら、満足度の集計をしていきます。
平均値の算出や、満足度の差の評価方法について解説したいと思います。