爬取微博用户公开信息,分析为周杰伦打榜的夕阳红老年团,告诉你他们真实年龄! (3)

选择了可视化库之后,我们就来使用吧!

在这里插入图片描述


这里说下为什么生成的是html?因为这是动态图,就是可以点击选择显示的,非常人性化!执行之后会生成一个gender.html文件,在浏览器打开就可以!

在这里插入图片描述


在这里插入图片描述


效果图中可以看到,在打榜的粉丝中女性多于男性,女性占比大概为62%!

4.分析年龄

这一项是大家比较关心的,真的是夕阳红粉丝团吗?

在这里插入图片描述


在这里插入图片描述


上图中我们发现为周杰伦打榜的主力军为:90后!

5.地区分析

下面我们来看看打榜粉丝全国各省的分布情况!

在这里插入图片描述


上图中我们可以看到打榜最多的三个省(直辖市)依次为:广州、北京、上海

6.打榜内容分析

我们来看看这些打榜的粉丝们都在说什么!

在这里插入图片描述


上图分析出现一些有趣的词:营业、老年人、奶茶!

看来打榜粉丝们都自认为自己是老年人,哈哈哈!

在这里插入图片描述

七、总结

从结果来讲为周杰伦打榜的粉丝主力军还是80、90后,毕竟曾经的青春啊,而且女生要比男生多,打榜粉丝最多的地区为广东!

从技术分析今天这个例子有不少的新东西,了解新浪微博分页机制、爬取用户公开信息、使用csv库保存文件、使用pyecharts做数据可视化!

当然中间遇到了很多问题,只有自己亲自尝试才会知道,猪哥已经把源码放在github(https://github.com/pig6/sina_topic_spider 或点击 阅读原文)中,感兴趣的同学记得转发收藏有时间的时候尝尝鲜!

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zyzjgd.html