在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
对着满屏的游戏后台数据,需要快速了解数据特征,一种茫然无从下手的感觉? 本文在游戏后台数据中,如何通过R语言快速的了解游戏后台的数据特征,以及统计各个数据之间的相关系数,并通过相关图来发现其中相关系数较高的数据,从而通过R得到高相关系数之间的线性回归方程,最后通过矩阵散点图来初步发现数据中的一些规律解决相应的问题。附:本文需要安装corrgram和car包 具体代码如下: library(corrgram) library(car) summary(data9) cor(data9) scatterplotMatrix(data9,spread=FALSE,main="时间,横幅展示,横幅点击,注册框点击,注册数之间关系") corrgram(data9,order=TRUE,lower.panel=panel.shade,upper.panel=panel.pie,text. panel=panel.txt,main="时间,横幅展示,横幅点击,注册框点击,注册数之间关系") 其中以某单机网的游戏广告投放后台数据为例 通过R中的summary和cor函数可以得到图一,可以快速了解数据的基本特征和相关系数。 为了方便快速展示数据之间的关联性,可以适当通过图形展示,提高工作效率,如图二,通过使用corrgram包中的corrgram()函数产生的相关图可以快速发现注册框点击和注册的相关系数最高,达到0.98。可以用R语言得到线性回归方程,从而发现从中的规律或者转化率: myLm<-lm(M[negotiated=TRUE]~Z[negotiate=TRUE],data=data9) myLm$coefficients summary(myLm) 得到结果:(Intercept)requested[negotioted==TURE] 20.81 0.21 得到注册框点击Z和注册数M的基本线性回归方程:M=20.81+0.21*Z 而下图三,载入car包中的scatterplotMatrix()函数生成的矩阵散点图,可以快速了解数据之间的规律。仅下图标记2为例,表示流量和注册数的关系,即广告流量越大,注册数越多,则渠道正常。反之,流量越大,注册数保持不变或者下降的趋势,则渠道疲劳,即该渠道对广告产生视觉疲劳,可初步考虑放弃该渠道。同理,当渠道正常,下图标记1,即时间和注册数的关系成反比,则表示用户对素材疲劳,可适当切换新素材,保持点击新鲜度。
最后本文通过R语言产生的三个图,可以快速了解数据的基本特征,数据之间的相关性,以及数据之间的分布规律和趋势规律,从而基本达到快速了解游戏后台数据目的。 作者:心者,审稿:fish
转自:http://www.itongji.cn/article/012040302015.html |
请发表评论