コラム Archive
※相関係数って何? という記事は別記事参考ください。 相関係数は2変量間の傾向を示すために有効な手段ですが、散布図と合わせて確認しましょう、という点は見落とされる(省略されてしまう)ことがあります。 そもそも、5件法のア […]
日々進化するサーバーの仕様と そのサーバーからデータを効率よく収集しようとする側の戦いは ときにドラマチックなこともあり感慨深いものがあります(大げさ)。 今記事ではそのような収集行為(スクレイピング行為)に関する方法と […]
つい何年か前までWEB調査のメリットというものがあまり感じられず 弊社では積極的な提案をしておりませんでした。 今回は「なぜ 積極的な提案をしなかったか」と 「Google form の調査であれば課題が解決するのか」を […]
カイ二乗検定とは クロス集計の属性差を知るためにχ(カイ)二乗検定(または独立性の検定)を使うケースが多いと思います。 カイ二乗検定をざっくり説明するならば「このクロス表の数値はランダム(乱数)で作った表とどの程度ズレて […]
調査データの分析にt検定を使うケースは多いと思います。 例えば①まったく思わない~⑤たいへん思う、などの順序尺度で取ったデータを得点化し A群とB群で比較、などは良く活用されていると思います。 しかしながら、どういった傾 […]
ごく稀に、こんな相談を受けることがあります。 「ある分析で思うような結果が出ないのでなんとかしてほしい」 分析する過程でこういった悩みが出ること自体は珍しくありませんが 中にはこんな相談も。 「5%有意で7%だった。5% […]
■WEBアクセス解析による本当の滞在時間の推測 先日、事務所の打ち合わせでとあるページの滞在時間を眺めておりました。 スタッフA「これだけの期間でたくさんの人に見てもらえたんですね」 筆者「ありがたいですね。もっとわかり […]
■テキストマイニングとは? Wikipedia より(一部編集) “テキストマイニング(text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出 […]
※ざっくり読み解く 多変量解析始めました。 ■母集団と母集団の推定によるエクセル関数の使い分け エクセルには「分散」「標準偏差」「共分散」に対して下記のように細かい使い分けがあります。 【分散】 VAR.P→標本を母集団 […]
統計学を学ぶと、必ずといっていいほど賭け事に応用したくなるものです(あくまで私見です)。 但し、身を持って経験をせずとも結論を導くことができるのも、また統計学の面白いところではないでしょうか。 下記では古典的な賭博必勝法 […]