• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

R语言实现LDA主题模型分析网购数据

原作者: [db:作者] 来自: [db:来源] 收藏 邀请
 

 研究人员对各大电商平台海量用户的评价数据进行分析,得出智能门锁剁手攻略。

1

语义透镜

顾客满意度和关注点

我们对于评价数据进行LDA建模,就是从语料库中挖掘出不同主题并进行分析,换言之,LDA提供了一种较为方便地量化研究主题的机器学习方法。

我们使用最大似然估计进行最优化主题个数的选取。当主题个数定为20的时候,似然估计数最大,即留言板数据分为20个主题的可能性比较大。将模型生成的20个主题中的高频词取出。

图表1

根据各个主题的高频关键词,大概可以将顾客关注点分成5个部分:商家品牌、价格质量、客服师傅、使用便捷性和包装物流。从上图,我们发现用户关注的点主要集中在客服对商品问题的耐心解答,师傅对门锁安装的指导以及包装和物流上。

我们也发现不少顾客的评论反映出智能门锁的便捷性(e.g.不用带钥匙)和先进(e.g.指纹识别度高)。同时我们没有发现安全性相关的高频词汇。

2

顾客抱怨

质量、客服服务和物流

接下来,我们对不同价格和主题的顾客抱怨率进行比较。

图表2

从价格方面我们发现价格低于2000的智能门锁购买量最多,同时抱怨率也较高,根据关注点来看,顾客抱怨点主要集中在商品质量和客服的耐心程度。购买量位于第二的价格是高于4000的区间,整体抱怨率最低。购买量位于第三的是2000-3000区间,该区间顾客抱怨点主要集中在商家品牌与物流。最后是3000-4000区间,该区间顾客抱怨点主要集中在价格质量与物流。同时反映出顾客对智能门锁价格有较高心理预期,主要抱怨点在质量、客服服务和物流上。

3

自营非自营

价格和满意度

图表3

从左图可以看出自营和非自营商品在顾客满意度上相差不大,非自营商品的满意度要略高于自营商品。同时可以看到大于4000区间的顾客满意度最高,且都是非自营商品。

从右图中,我们可以看到满意度关于价格的回归预测结果。图中红线表示的是自营商品,在3000以下的区间,价格越高,满意度反而下降,高于3000的区间中,价格越高,满意度越高。在非自营商品中,3000以下的价格区间中,价格和满意度关系不明显,高于3000的价格区间中,价格越高,满意度越高。

从前文中,我们发现价格低于3000的商品抱怨率最低的点在于便捷和使用高效,因此给人的感觉性价高,满意度较高,而价格接近3000时,顾客对客服、物流、质量等预期更高,因此容易成为抱怨的重灾区。当价格接近和高于4000时,商品的品牌、质量往往又得到保证,因此满意度又上升。

 

▍需要帮助?联系我们

 

 

大数据部落       -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和

统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服

QQ:3025393450

 

【服务场景】        

 科研项目; 公司项目外包;线上线下一对一培训;学术研究。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务

 

分享最新的大数据资讯,每天学习一点数据分析,让我们一起做有态度的数据人

微信客服号:lico_9e

QQ交流群:186388004  

欢迎关注微信公众号,了解更多数据干货资讯!

加入欢迎的我们大数据学习必备利器课程

http://study.163.com/course/courseMain.htm?courseId=1003776041&share=2&shareId=1023497288

 

 


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap