已知词频生成词云图(数据库到生成词云)--generate_from_frequencies(WordCloud)

词云图是根据词出现的频率生成词云,词的字体大小表现了其频率大小。

 

写在前面:

用wc.generate(text)直接生成词频的方法使用很多,所以不再赘述。

但是对于根据generate_from_frequencies()给定词频如何画词云图的资料找了很久,下面只讲这种方法。

generate_from_frequencies适用于我已知词及其对应的词频是多少(已有数据库),不需要分词的情况下。

官方文档说generate_from_frequencies函数的参数是array of tuple,但是我试了很久都不行,最后发现居然应该是dict 字典形式!

即形如:{ word1: fre1, word2: fre2,  word3: fre3,......,  wordn: fren }

 

注意:

词云wordcloud的中文显示,需要特殊处理,在网上看了不少是说加字体路径之类的方法我试了都不行,最后只好采用改变编码的形式才解决好。

fp = pd.read_csv(read_name, encoding='gbk') # 读取词频csv文件, 编码为gbk

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpfdjj.html