用数据分析头部微信公众号到底有多牛 (3)

老规矩,统计一下这 6000 多篇文章的标题和正文中出现最多的词汇。可以看得出都是些政治热门词汇,这与占豪的定位高度重合。另外标题的统计并没有省略“为何”、“什么”这些词汇,因这也是起标题的智慧,但正文中省略了许多这样的语气词汇。

用数据分析头部微信公众号到底有多牛

下图是标题的词云

用数据分析头部微信公众号到底有多牛

下图是正文的词云

用数据分析头部微信公众号到底有多牛

总结:

占豪,这是个超级大号,数据耀眼,我等小辈只能仰望喽。但是希望大家看完本文后不只有张大的嘴巴,还能有能为我所用的一点点感悟。

后记:

我曾以为分析曹大的首篇是从 0 到 1 的最难过程,分析占豪的只不过是从 1 到 100 的数据量增加而已,程序应该是一样的。但是实际分析的过程中发现要比分析曹大的难度大多了:文章多了、特例多了、数据维度多了之后可供挖掘的方向多了许多,其中的取舍并没有做好,有许多想列出但又怕太啰嗦的数据已经被我砍掉了。我深知本文还有许多欠考虑的地方,欢迎多提意见。

另外文中提及的所有类型的数据我都可批量获取,我还做了个文章批量导出软件,若您恰好有需求欢迎勾搭。当然除了做个初级搬运工,如何从数据中挖掘出更多价值是件有意义也有挑战的事情,欢迎讨论。

欢迎关注本号,后续还会有其他分析报告

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpdgdp.html