python爬取近十年中国电影票房数据与分析 (2)

data.sort_values(by=\'票房\',ascending=False).head(10).plot.bar(x=\'电影\',y=\'票房\',title=\'top 10\')

# 年度top5

data[data[\'年份\']==2010].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2010 top 5\')

data[data[\'年份\']==2011].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2011 top 5\')

data[data[\'年份\']==2012].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2012 top 5\')

data[data[\'年份\']==2013].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2013 top 5\')

data[data[\'年份\']==2014].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2014 top 5\')

data[data[\'年份\']==2015].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2015 top 5\')

data[data[\'年份\']==2016].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2016 top 5\')

data[data[\'年份\']==2017].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2017 top 5\')

data[data[\'年份\']==2018].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2018 top 5\')

data[data[\'年份\']==2019].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2019 top 5\')

# 每年电影数

groupby_year = data.groupby(\'年份\').size()

groupby_year.plot.bar(title = \'每年电影数\')

# 每年总票房

data.groupby(\'年份\')[\'票房\'].sum().plot.bar(title = \'每年总票房\')

# 电影票房中的二八原则

data[data[\'年份\']==2019][\'票房\'].plot.hist()

data[data[\'年份\']==2018][\'票房\'].plot.hist()

percent = []

for k in range(10):

Boxoffice=  data[data[\'年份\']==(2010+k)][\'票房\']

q80 = np.percentile(Boxoffice ,80)

percent.append(Boxoffice[Boxoffice >= q80].sum()/ Boxoffice.sum())

percent

五、总结

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zzzzwx.html