选择了可视化库之后,我们就来使用吧!
这里说下为什么生成的是html?因为这是动态图,就是可以点击选择显示的,非常人性化!执行之后会生成一个gender.html文件,在浏览器打开就可以!
效果图中可以看到,在打榜的粉丝中女性多于男性,女性占比大概为62%! 4.分析年龄
这一项是大家比较关心的,真的是夕阳红粉丝团吗?
上图中我们发现为周杰伦打榜的主力军为:90后! 5.地区分析
下面我们来看看打榜粉丝全国各省的分布情况!
上图中我们可以看到打榜最多的三个省(直辖市)依次为:广州、北京、上海! 6.打榜内容分析
我们来看看这些打榜的粉丝们都在说什么!
上图分析出现一些有趣的词:营业、老年人、奶茶!
看来打榜粉丝们都自认为自己是老年人,哈哈哈!
从结果来讲为周杰伦打榜的粉丝主力军还是80、90后,毕竟曾经的青春啊,而且女生要比男生多,打榜粉丝最多的地区为广东!
从技术分析今天这个例子有不少的新东西,了解新浪微博分页机制、爬取用户公开信息、使用csv库保存文件、使用pyecharts做数据可视化!
当然中间遇到了很多问题,只有自己亲自尝试才会知道,猪哥已经把源码放在github(https://github.com/pig6/sina_topic_spider 或点击 阅读原文)中,感兴趣的同学记得转发收藏有时间的时候尝尝鲜!