• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

在R语言中用模拟探索回归的P值

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

最近关于p值讨论的爆发激发了我进行简短的模拟研究。

特别是,我想说明p值如何随着效果和样本大小的不同而变化。
以下是模拟的详细信息。我模拟了我的自变量的绘制:

 

对于每一个,我定义一个as

 


换句话说,对于每个效果大小,模拟绘制并出现一些错误。估计以下回归模型并观察p值。

绘图和回归完成1,000次,因此对于每个效果大小 - 样本大小组合,模拟产生1,000个p值。下面绘制了每种效应大小和样本大小组合的这1,000个p值的平均值。

注意,这些结果是固定的。较高的采样误差通常会使这些曲线向上移动,这意味着对于每个效应大小,相同的样本将产生较低的信号。

 

 

首先,对于给定的样本大小,更容易“检测”更大的效果大小。通过检测,我的意思是使用.05阈值发现具有统计显着性。可以使用相对较小的样本大小(在这种情况下<10)检测较大的效果大小(例如.25)。相反,如果效果大小很小(例如.05),则需要更大的样本来检测效果(> 10)。

其次,这个图说明了一个关于p值的常见警告:总是在样本大小的范围内解释它们。缺乏统计意义并不意味着缺乏效果。可能存在效果,但样本大小可能不足以检测它(或者数据集中的可变性太高)。另一方面,仅仅因为p值表示统计显着性并不意味着该效果实际上是有意义的。考虑效果大小.00000001(实际为0)。根据该图表,随着样本大小的增加,甚至该效应大小的p值趋于0,最终超过统计显着性阈值。

非常感谢您阅读本文,有任何问题请在下面留言!


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
R语言 神经网络neuralnet和nnet发布时间:2022-07-18
下一篇:
用R语言分析我的fitbit计步数据发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap