已知词频生成词云图（数据库到生成词云）--generate_from_frequencies（WordCloud）

日期：2021-06-01 栏目：程序人生浏览：次

词云图是根据词出现的频率生成词云，词的字体大小表现了其频率大小。

写在前面：

用wc.generate(text)直接生成词频的方法使用很多，所以不再赘述。

但是对于根据generate_from_frequencies()给定词频如何画词云图的资料找了很久，下面只讲这种方法。

generate_from_frequencies适用于我已知词及其对应的词频是多少(已有数据库)，不需要分词的情况下。

官方文档说generate_from_frequencies函数的参数是array of tuple，但是我试了很久都不行，最后发现居然应该是dict 字典形式！

即形如：{ word1: fre1, word2: fre2, word3: fre3,......, wordn: fren }

注意：

词云wordcloud的中文显示，需要特殊处理，在网上看了不少是说加字体路径之类的方法我试了都不行，最后只好采用改变编码的形式才解决好。

fp = pd.read_csv(read_name, encoding='gbk') # 读取词频csv文件, 编码为gbk