在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
1、加载本次云词分析使用的包 library(rJava) library(Rwordseg) #调用的是rJava包里的某个分词函数,所以要先打开ijava包 library(wordcloud2) #做云词 2、本次实践的是对《我不是潘金莲》影评分析,里面涉及到名字,所以需要进行人名识别 segment.options(isNameRecognition = TRUE) 3、可以向词典加入自定义词汇,我比较懒没有加 insertWords()函数 insertWords(c('科斯托格洛托夫','帕维尔','尼古拉耶维奇','鲁诺夫','伊丽莎白','阿纳托利耶夫娜','舒卢宾','艾哈迈占','费得拉乌','董佐娃','瓦季姆','普罗什卡'),save=TRUE) 4、做分词 segmentCN("E:\\R\\mimi6\\1.csv",returnType="tm") 我事先把数据下载下来的 下载链接:https://blog.csdn.net/lht_okk/article/details/54880614 5、做统计 我没有找到R语言做词频统计的函数,就用的Excel做的 6、做云词
data <- read.csv("E:\\R\\mimi6\\1.segment.csv") wordcloud2(data[0:1000,]) #数据太多时一定要提取前1000个(N)做分析 常规:wordcloud2(data) 结果: |
请发表评论