Rでカテゴリ変数の相関を調べる。質的変数とクラメール相関係数の計算。
基本は、(1)分割表を作る、(2)相関係数を調べるの流れ。
library("vcd) ##サンプルデータの作成 #x<-rbinom(1000,size=1,prob=0.5) #y<-rbinom(1000,size=1,prob=0.5+0.3*x) #x<-factor(x) #y<-factor(y) d<-data.frame(x,y) assocstats(xtables(~y+x,d,drop.unused.levels=TRUE))
assocstats:クラメールの相関係数を計算(vcd パッケージ)
xtabls: 連関表を作れる関数
出力
X^2 df P(> X^2)
Likelihood Ratio 103.81 1 0
Pearson 101.56 1 0Phi-Coefficient : 0.319
Contingency Coeff.: 0.304
Cramer's V : 0.319
参考:
Rのカテゴリカルデータの操作と統計量
https://www1.doshisha.ac.jp/~mjin/R/45/45.html