Author Archive

カイ二乗検定及び残差分析について(青少年のインターネット利用環境実態調査)

カイ二乗検定については過去記事でも触れたことがありますが、今回は実際の計算も交え、残差分析も加えながら、あらためて紹介したいと思います。 処理の流れ 大まかには・クロス集計表を作成する・期待値を算出する・カイ二乗値(統計 […]

ジニ係数について

ジニ係数ってなに? ジニ係数は「データの不均等さを表す統計値」として、 例えば国ごとに貧富の格差をあらわす時などに使用されます。 「1」に近いほど「不平等」で、「0」に近いほど「平等」に近いとされており wikipedi […]

観光統計から見る日本人の平均旅行回数について

日本人は年に何回、旅行をするのか 先日、とある会で「日本人は年に何回、旅行をするのか」という話題に触れましたのでその際に調べた諸々をご紹介します。まず簡単にググった範囲であれば、公益財団法人日本交通公社「第I編 日本人の […]

重み付き回帰分析(WLS)について

重み付き回帰分析(WLS)ってなに? 重み付き回帰分析とは、加重最小二乗法やWeighted least squares (WLS)などと呼ばれる 回帰分析を行う際の係数の推定方法の一つです。 通常の最小二乗法(Ordi […]

加重平均について|Excel(エクセル)で学ぶデータ分析ブログ

加重平均とは 加重平均とは重み付け平均などと言われることもある処理方法です。 平均値に対して「加重=Weight」を掛けるわけですが、エクセルでも計算ができるようまとめてみました。 後半にはe-statの公開データを用い […]

無相関について

無相関とは、例えば2変数であれば、共分散が「0」という状態を指しますが、視覚的に見えるほうが良いと思い、いくつかの例をご紹介します。 ※相関係数って何? という記事は別記事参考ください。 相関係数は2変量間の傾向を示すた […]

ざっくり読み解く 主成分分析【検算もかねて編】

はじめに 今回は過去に紹介した主成分分析の関係性を 実際の計算も踏まえご紹介します。 使用する言語は「R」ですが、需要があればパイソンやVBAでもやっていこうと思います。 データセット まずは乱数でデータセットの作成。 […]

ざっくり読み解く 主成分分析【もうちょっと詳しく編】

はじめに 主成分分析の話題。 主成分分析は固有値と固有ベクトルを計算して 固有ベクトルをちょっと加工して主成分負荷量 固有値と固有ベクトルをちょっと加工して主成分得点などを計算し傾向などを分析します。 固有値や固有ベクト […]

ざっくり読み解く 因子分析【多因子分析編】

はじめに 1因子数で因子分析をやってみる、で因子負荷量に九九っぽいものを入れると 九九表っぽい相関行列が得られたことを確認しました。 今回は複数の因子を用いて、いくつか極端な場合を確認してみます。 2因子の場合 fc_1 […]

ざっくり読み解く 因子分析【1因子分析編】

はじめに ざっくり中のざっくり説明で いくらなんでもざっくりが過ぎるぞ、というご指摘を踏まえ もう少しだけくわしく説明するのが今回の記事です。 因子分析を難解なものにさせる大きな理由の1つが「因子数がたくさん『ある』場合 […]