我在statsmodels
中使用 PP 图,我想知道为什么将比例 = 5 和 loc = 20 的正态分布与标准正态分布进行比较会导致 PP 图上的直线当分布非常不同时。请在下面找到示例代码:
import numpy as np
import statsmodels.api as sm
import pylab
test = np.random.normal(20, 5, 100000)
pp = sm.ProbPlot(test, loc=0, scale=1)
fig = pp.ppplot()
plt.show()
您可以尝试减少样本量,您将看到效果。
test = np.random.normal(20, 5, 100)
pp = sm.ProbPlot(test, loc=0, scale=1, fit=False).ppplot(line='45')
plt.show()
如果 fit 为 false,则将 loc 、 scale 和 distargs 传递给分布。如果 fit 为 True,则使用 dist.fit 自动拟合 dist 的参数。在减去拟合的 loc 并除以拟合的比例后,分位数由标准化数据形成。如果 dist 是 SciPy 冻结分布,则不能使用 fit。
本站系公益性非盈利分享网址,本文来自用户投稿,不代表边看边学立场,如若转载,请注明出处
评论列表(56条)