小程序数据埋点:序数数据的离群点分析(ordinal stats)

简而言之,我进行了一项满意度调查,要求被调查者以 1 到 7 的满意度回答。

是来自数据集的两个变量之间的散点图(抖动)的示例(我正在研究 R):

enter image description here

https://drive.google.com/uc?export=download&id=0Bx2Sns2vaI9ycm1tV2pNSWUxQXc

因此,我正在研究的数据集是由我想要进行异常值分析的有序数据形成的。

对于这种类型的数据,你会建议什么作为最好的离群值分析方法,以及如何在 R 上实现?

提前谢谢你,

1

你的数据看起来像这样:

x = rep(1:7, c(3, 4,17, 21, 48, 118, 93)) 
y = c(
    rep(1:7,c(1,2,0,0,0,0,0)),
    rep(1:7,c(2,0,1,1,0,0,0)),
    rep(1:7,c(10,3,2,1,0,0,1)),
    rep(1:7,c(15,3,1,1,1,0,0)),
    rep(1:7,c(20,10,2,10,3,2,1)),
    rep(1:7,c(40,20,20,30,3,4,1)),
    rep(1:7,c(50,25,10,5,3,0,0))
)

情节:

library(car)
sp(x,y, jitter = list(x=0.8, y=0.8), smoother=F, reg.line = F)

enter image description here

如果你只是想知道一个给定的值是否是你的数据中的异常值 (即单变量异常值分析),你可以使用:

library(outliers)
grubbs.test(x)

或者简单地使用boxplot,这些值被绘制为异常值:

boxplot(x, plot=F)$out

如果需要多变量异常值,可以使用mvoutlier包(请参阅函数?chisq.plot?pcout):

library(mvoutlier)
pcout(x=data.frame(x,y))

本站系公益性非盈利分享网址,本文来自用户投稿,不代表边看边学立场,如若转载,请注明出处

(479)
应用价值:在具有应用价值的数据框中使用 fillna
上一篇
北向接口:如何在geopandas地图上添加“北向箭头”
下一篇

相关推荐

发表评论

登录 后才能评论

评论列表(71条)