使用R语言绘制词云图
我们选择悉尼大学的学生评价来做分析,将每条评价按照特定的方法分为若干个词,最后统计每个词出现的频率大小,据此绘制悉尼大学学生评价的词云图。
install.packages('tm')
library('tm')
install.packages('jiebaR')
library('jiebaR')
install.packages('cidian')
library('cidian')#用于将细胞词库转化为R可操作的dict或txt格式,加载不成功。
install.packages('wordcloud2')
library('wordcloud2')
data2=data[data$大学=='悉尼大学',]
data2=data2[complete.cases(data2[,'学生评价']),]
a=data2$学生评价
textsegment=as.character(a)
mixseg<-worker(type="mix")#设置分词方法、词典及停词,这里采用混合模型
seg<-mixseg[textsegment]#获取分词结果
stop_word<-c("这个","评价","因为","如果","可以","一个","就是")#自定义新增停词
seg<-filter_segment(seg,stop_word)
seg<-seg[nchar(seg)>1] #去除字符长度小于2的词语
num<-table(seg)
df<-data.frame(num)
wordcloud2(df)#采用默认参数,可修改
|
请发表评论