在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
1.3 数据分析师的能力要求 首先数据分析师要具备组织能力。这体现在项目前期调研、方案制定、项目开发和项目落地的职责和能力要求。
数据处理能力、数据挖掘能力和数据应用能力这三大块能力需要数据分析师通过时间、项目经验去磨砺,不断成长,懂得何时运用哪种数据挖掘技术解决相应的问题。 1.3.1 数据处理能力刚刚收集上来的raw data(原始数据)一般存在脏数据,不能达到直接建模的要求。我们不能直接利用raw data进行数据分析建模,所谓“垃圾进垃圾出”,这样得到的分析结果也不一定是可靠的。对于raw data,我们需要评估数据质量,清洗脏数据,通常包括缺失值和异常值的处理,使之达到数据分析的需求。假如现在有一份30万的用户调研数据,由于某些玩家不愿意填写自己的性别、收入等,导致这些变量存在数据缺失的情况。现在利用数据分析技术对缺失值模式进行可视化探索,如图1-3所示。 针对异常值数据,我们同样希望能通过科学的方式甄别异常值并处理。例如,可以利用箱线图发现异常值,并在图上打印出异常值的样本号和数值,直观地对异常值进行可视化展示。比如现在有某个月日新增用户在第30日留存率的数据,通过普通曲线图很难发现是否有某些天的新增在第30日留存存在异常情况。此时可以借助箱线图的方式甄别异常值,如图1-4所示。 由图1-4可知,这个月有三天的新增用户在第30日留存率低于正常水平,分别是5日、6日和9日。 1.3.2 数据挖掘能力数据分析师在建模的过程中,需要根据业务需求和数据特点选择合适的算法,利用专业的数据挖掘工具进行建模,并评估模型效果。比如在面对用户分析的需求时,可分别分析玩家点击行为的路径和玩家购买的道具,根据不同的方向和目标选择不同的算法和工具。 在研究玩家的购买行为时,可以利用关联规则发现购买物品之间的关系,如图1-6所示。 1.3.3 数据应用能力由于业务团队的数据分析意识和能力不如专业的数据分析师,他们大多不懂解读模型结果。此时需要数据分析师将模型得到的知识用朴素的业务语言表达出来,从而利用分析结果指导运营和营销活动。以图1-6为例,业务团队一般看不懂这个图传递的信息,需要帮他们解读。比如圆圈越大表示两者的关联关系越强,很多玩家都购买过超级大礼包和新手礼包这两个道具,在做运营活动时,可以将这两个礼包进行捆绑销售,提高另外一个道具的销量。 |
请发表评论