• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

R语言小实践---云词分析

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

1、加载本次云词分析使用的包

library(rJava)

library(Rwordseg)             #调用的是rJava包里的某个分词函数,所以要先打开ijava包

library(wordcloud2)          #做云词


2、本次实践的是对《我不是潘金莲》影评分析,里面涉及到名字,所以需要进行人名识别

segment.options(isNameRecognition = TRUE)


3、可以向词典加入自定义词汇,我比较懒没有加

insertWords()函数

insertWords(c('科斯托格洛托夫','帕维尔','尼古拉耶维奇','鲁诺夫','伊丽莎白','阿纳托利耶夫娜','舒卢宾','艾哈迈占','费得拉乌','董佐娃','瓦季姆','普罗什卡'),save=TRUE)


4、做分词

segmentCN("E:\\R\\mimi6\\1.csv",returnType="tm")      

我事先把数据下载下来的

下载链接:https://blog.csdn.net/lht_okk/article/details/54880614


5、做统计

我没有找到R语言做词频统计的函数,就用的Excel做的


6、做云词

data <- read.csv("E:\\R\\mimi6\\1.segment.csv")

wordcloud2(data[0:1000,])                     #数据太多时一定要提取前1000个(N)做分析

常规:wordcloud2(data)


结果:


 

鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
机器学习笔记之R语言基础5(T,F检验)发布时间:2022-07-18
下一篇:
R语言col参数值对应的颜色条形图发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap