コラム Archive

ジニ係数について

ジニ係数ってなに? ジニ係数は「データの不均等さを表す統計値」として、 例えば国ごとに貧富の格差をあらわす時などに使用されます。 「1」に近いほど「不平等」で、「0」に近いほど「平等」に近いとされており wikipedi […]

重み付き回帰分析(WLS)について

重み付き回帰分析(WLS)ってなに? 重み付き回帰分析とは、加重最小二乗法やWeighted least squares (WLS)などと呼ばれる 回帰分析を行う際の係数の推定方法の一つです。 通常の最小二乗法(Ordi […]

無相関について

無相関とは、例えば2変数であれば、共分散が「0」という状態を指しますが、視覚的に見えるほうが良いと思い、いくつかの例をご紹介します。 ※相関係数って何? という記事は別記事参考ください。 相関係数は2変量間の傾向を示すた […]

2020年8月現在のWEB情報収集に関する雑感

日々進化するサーバーの仕様と そのサーバーからデータを効率よく収集しようとする側の戦いは ときにドラマチックなこともあり感慨深いものがあります(大げさ)。 今記事ではそのような収集行為(スクレイピング行為)に関する方法と […]

Google form を活用した費用対効果の高い調査運用について

つい何年か前までWEB調査のメリットというものがあまり感じられず 弊社では積極的な提案をしておりませんでした。 今回は「なぜ 積極的な提案をしなかったか」と 「Google form の調査であれば課題が解決するのか」を […]

【コラム】イェイツのカイ二乗検定について

カイ二乗検定とは クロス集計の属性差を知るためにχ(カイ)二乗検定(または独立性の検定)を使うケースが多いと思います。 カイ二乗検定をざっくり説明するならば「このクロス表の数値はランダム(乱数)で作った表とどの程度ズレて […]

【コラム】t検定の使いどころについて

調査データの分析にt検定を使うケースは多いと思います。 例えば①まったく思わない~⑤たいへん思う、などの順序尺度で取ったデータを得点化し A群とB群で比較、などは良く活用されていると思います。 しかしながら、どういった傾 […]

【コラム】有意差が出ないデータをなんとかする?方法

ごく稀に、こんな相談を受けることがあります。 「ある分析で思うような結果が出ないのでなんとかしてほしい」 分析する過程でこういった悩みが出ること自体は珍しくありませんが 中にはこんな相談も。 「5%有意で7%だった。5% […]

【コラム】WEBアクセス解析による本当の閲覧時間の推測|Excel(エクセル)で学ぶデータ分析ブログ

■WEBアクセス解析による本当の滞在時間の推測 先日、事務所の打ち合わせでとあるページの滞在時間を眺めておりました。 スタッフA「これだけの期間でたくさんの人に見てもらえたんですね」 筆者「ありがたいですね。もっとわかり […]

テキストマイニングについて|Excel(エクセル)で学ぶデータ分析ブログ

■テキストマイニングとは? Wikipedia より(一部編集) “テキストマイニング(text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出 […]