pyhton项目和晋江文学城数据分析项目 (4)

从这个词云中可以看出,现在受人们喜爱的小说类型大多是爱情、原创、纯爱,稍次一点的是近代现代。从中可以了解,人们都比较喜爱新鲜的原创文学,以求更贴切的代入感和更完美的想象。

纯爱其实就是耽美BL文学,言情是男女BG文学,从中可以看出读者更喜欢看耽美文学,腐女的市场需求很强烈,产出链也相对完整,未来的影视、文学、娱乐市场可以考虑一下耽美背后的腐女力量。其实近几年已经可见端倪:

2016年《上瘾》的爆火使得黄景瑜、许魏洲空降娱乐圈

2018年《镇魂》播出,朱一龙、白宇从名不经传到突破顶流

2019年《陈情令》播出,一群小鲜肉大火,目前苗头正盛

爱情是平等的观念也在广泛传播,伯牙子期,柏拉图式,刎颈之交也在不断地解锁人们的思想。未来市场会如何发展,也许数据已经给了我们答案。

600条数据中作品积分折线图如图22/23所示:

pyhton项目和晋江文学城数据分析项目

22.作品积分折线图

 

pyhton项目和晋江文学城数据分析项目

23.作品积分折线图

这个作品积分折线图是动态的图,一张图可以容纳大量的数据,通过拉动底部框选条可以掌握不同范围的数据变化。从中可以看出,放在第一页的也不是积分普遍的高,排在后几页的也不是普遍的低。不过大趋势还是比较明显的,在书库页码从前到后,积分也是由高到低的总体趋势,各部分都会有小峰值。框选范围内的均值便是图中红点游标所示。

不过不得不说《天官赐福》的确拉高了所有作品的平均分,接下来我可能也去拜读一下这本书。

600条数据中各年份产出书籍量对比柱状图如图24所示:

 

pyhton项目和晋江文学城数据分析项目

24.各年份产出书籍量对比柱状图

这是我在所有数据中提取发表时间中的年份,并且用分组聚合的方式做出来的前600本书的各年份对比柱状图。从中可看出总体趋势是在上升,2016和2017年书籍增长量较多,2018年增长量梢缓。于2018年达到峰值,代表2018年发表在晋江文学城的书获得的积分最多、读者多、阅读量大、作品质量也该是不错。2019年呈断崖式下跌,但是我认为不是2019年的书质量差,读者少,而是因为书会有一个读者积累的过程。2019年的书比较新,累积的积分和阅读量等数据都会比较少,或许到2020年再次做分析调查的时候,2019的数据才会稳定有价值。

600条数据中各年份产出书籍量占比饼状图如图25所示:

 

pyhton项目和晋江文学城数据分析项目

25.各年份产出书籍量占比饼状图

我还做了各年份产出书的占比图,对比前600本书中的各年产出占比情况。从分析2020年初的数据可见,2017和2018年的书占据热门书籍的半壁江山。书是具有不可预知的无限回读性的,在电子书出现之前,新书从产出到火热再到平淡可能会需要多年的发酵。但是我们从图中可以看见,书已经有了快速代谢的端倪,2017和2018年产出的书还可以平分秋色,2016年产出的书还在热门的数量就折半锐减,2015年及以前产出的书在现在几乎已经没什么影响力了。由此可见网络对于书籍的催生换代有着很大的作用。

这不能说好与不好,只能说有利有弊,网络激发人们的创作欲望和阅读渴求,新作品层出不穷,文学市场新鲜血液充足,这是很好的方面。但是书的饱和,就会造成人的阅读速度加快,阅读深度不够,书籍的新老代谢加快,形成阅读浮躁和作品消沉的情况。我们没有资格去评价无主观意识的网络做了什么,产生什么样的影响,我们只能尽量去适应这个快速变化的时代。

 

600条数据中4项优质特征前30对应作者出现次数占比饼状图如图26所示:

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zyfwdy.html