• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

复杂统计方法R语言——简单回归

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

简单回归

数据来源:http://www.statsci.org/data/general/cofreewy.html

 

1.读入数据

setwd("D:/数学建模/寒假美赛集训/R统计")
w=read.table("COfreewy.txt",header=T,encoding = "utf-8")

 

2.线性回归

a=lm(CO~.,w)
#a=lm(CO~Traffic+Wind,w)#线性回归
#print(w)
summary(a)

 第一列为回归系数,第二列为标准差,一般都<0.05较好,第四列为p值。原假设为:系数为0。p<0.05,则拒绝原假设。若p>0.05,可以考虑去除该变量再做一次回归,以使每一个p值都<0.05。

 

3.AIC逐步回归

b=step(a,direction = "backward")#逐步回归
summary(b)

通过使用逐步回归,我们选择了变量,舍弃了Hour变量,每一个p值都<0.05。

 

4.残差检验

shapiro.test(b$res)#做残差的正态性检验

 $y-\hat{y}$为残差,应符合正态分布,均值为0。如果均值不为0,则存在系统误差。

 

5.画出qq图

qqnorm(b$res);qqline(b$res)#查看回归残差的qq图

qq图有两个作用:1、检验一组数据是否服从某一分布。2、检验两个分布是否服从同一分布。qq图全称是quantile-quantile plot,从名称中可以了解到是和分位数相关的图。qq图没有过原点,说明仍存在一定系统误差。

 

 

6.各变量散点图

plot(w)
#pairs(w)

 

7.傅里叶技术变换

cor(cbind(CO,Traffic,Tsq=Traffic^2,Tcub=Traffic^3,
          Hour,Hsq=Hour^2,Hcub=Hour^3,Wind,Wsq=Wind^2,Wcub=Wind^3))
a=lm(CO~Traffic+Wind+I(Wind^2)+I(Wind^3)+sin((2*pi/24)*Hour)+
  cos((2*pi/24)*Hour)+sin((4*pi/24)*Hour)+cos((4*pi/24)*Hour))
b=step(a) #逐步回归,按照aIC选择变量
summary(b);anova(b);shapiro.test(b$res)

b1=lm(CO~Traffic+Wind+I(Wind^2)+
        cos((2*pi/24)*Hour)+cos((4*pi/24)*Hour))
summary(b1)
anova(b1)#方差分析表
shapiro.test(b1$res)#对残差的正态性检验
qqnorm(b$res);qqline(b$res)#查看回归残差的qq图

 

 

 

 

 

 所有代码:

setwd("D:/数学建模/寒假美赛集训/R统计")
w=read.table("COfreewy.txt",header=T,encoding = "utf-8")
attach(w)#把数据变成全局变量
print(CO)
head(w)#查看前6条数据
a=lm(CO~.,w)
#a=lm(CO~Traffic+Wind,w)#线性回归
#print(w)
summary(a)

b=step(a,direction = "backward")#逐步回归
summary(b)

shapiro.test(b$res)#做残差的正态性检验

qqnorm(b$res);qqline(b$res)#查看回归残差的qq图

par(mfrow=c(2,3))#同时显示6张图
plot(Traffic,Wind)
plot(CO,Wind)
plot(Traffic,CO)
plot(Hour,Wind)
plot(CO,Hour)
plot(Hour,Traffic)
plot(w)
#pairs(w)

cor(cbind(CO,Traffic,Tsq=Traffic^2,Tcub=Traffic^3,
          Hour,Hsq=Hour^2,Hcub=Hour^3,Wind,Wsq=Wind^2,Wcub=Wind^3))
a=lm(CO~Traffic+Wind+I(Wind^2)+I(Wind^3)+sin((2*pi/24)*Hour)+
  cos((2*pi/24)*Hour)+sin((4*pi/24)*Hour)+cos((4*pi/24)*Hour))
b=step(a) #逐步回归,按照aIC选择变量
summary(b);anova(b);shapiro.test(b$res)

b1=lm(CO~Traffic+Wind+I(Wind^2)+
        cos((2*pi/24)*Hour)+cos((4*pi/24)*Hour))
summary(b1)
anova(b1)#方差分析表
shapiro.test(b1$res)#对残差的正态性检验
par(mfrow=c(1,1))
qqnorm(b$res);qqline(b$res)#查看回归残差的qq图

  

  


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap