拓端tecdat|R语言ggmap空间可视化机动车交通事故地图

在本文中，我使用ggmap可视化纽约市的交通事故。

数据来自纽约市开放数据。我的数据范围是2012年至2015年。该数据跟踪车辆的类型，发生事故的街道的名称以及事故的经度和纬度坐标。两个坐标都保存为单个字符变量，称为“ LOCATION”。

在下面，我加载数据，删除所有没有位置坐标的事故，并解析LOCATION变量以获取经度和纬度坐标。我还解析日期变量以创建年份变量，并使用该变量创建两个数据集：一个数据集包含2013年的所有车辆事故，另一个数据集包含2014年的所有车辆事故。

d_clean=d[which(regexpr(\',\',d$LOCATION)!=-1),]
 
comm=regexpr(\',\',d_clean$LOCATION)
d_clean$loc=as.character(d_clean$LOCATION)
d_clean$lat=as.numeric(substr(d_clean$loc,2,comm-1))
d_clean$long=as.numeric(substr(d_clean$loc,comm+1,nchar(d_clean$loc)-1))
d_clean$year=substr(d_clean$DATE,7,10)
 
d_2013=d_clean[which(d_clean$year==\'2013\'),c(\'long\',\'lat\')]
d_2014=d_clean[which(d_clean$year==\'2014\'),c(\'long\',\'lat\')]

接下来，我使用get_map（）查询Google Maps并获取纽约市的地图。我使用stat_density2d（）向该地图添加了一个二维密度层。我对2013年和2014年的数据都执行此操作，并使用gridExtra的grid.arrange（）并排放置地图。

ny_plot=ggmap(get_map(\'New York, New York\',zoom=12, maptype=\'terrain\'))

 
grid.arrange(plot1, plot2,nrow=1,ncol=2)

接下来，我按行政区域绘制了2013年的事故密度。我编写了一个函数boro（），该函数会删除所有缺少街道名称的观测值，并基于自治市镇（2013）子集。我将它们堆叠在一起，同时添加自治市镇名称，然后在向量col_vals中为每个自治市镇分配一种颜色。我使用stat_density2d的group参数以不同的颜色分别绘制每个自治市镇的密度层。


plot4=ny_plot+
  stat_density2d(data=full, geom=\'polygon\',bins = 10, aes(x=full$long,y=full$lat,fill = Borough, alpha=..level..))+
  scale_fill_manual(values=col_vals)+
  #guides(fill = guide_colorbar(barwidth = 1, barheight = 12)) +
  scale_alpha(guide = FALSE)+
  xlab(\' \')+ylab(\' \')+
  ggtitle(\'NYC Vehicle Accident Density by Borough, 2013\')
plot4

客服电话

电子邮件

请发表评论

全部评论

上一篇：

下一篇：

关于我们

产品与服务

解决方案

139-2527-9053