data.sort_values(by=\'票房\',ascending=False).head(10).plot.bar(x=\'电影\',y=\'票房\',title=\'top 10\')
# 年度top5
data[data[\'年份\']==2010].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2010 top 5\')
data[data[\'年份\']==2011].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2011 top 5\')
data[data[\'年份\']==2012].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2012 top 5\')
data[data[\'年份\']==2013].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2013 top 5\')
data[data[\'年份\']==2014].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2014 top 5\')
data[data[\'年份\']==2015].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2015 top 5\')
data[data[\'年份\']==2016].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2016 top 5\')
data[data[\'年份\']==2017].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2017 top 5\')
data[data[\'年份\']==2018].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2018 top 5\')
data[data[\'年份\']==2019].sort_values(by=\'票房\',ascending=False).head(5).plot.bar(x=\'电影\',y=\'票房\',title=\'2019 top 5\')
# 每年电影数
groupby_year = data.groupby(\'年份\').size()
groupby_year.plot.bar(title = \'每年电影数\')
# 每年总票房
data.groupby(\'年份\')[\'票房\'].sum().plot.bar(title = \'每年总票房\')
# 电影票房中的二八原则
data[data[\'年份\']==2019][\'票房\'].plot.hist()
data[data[\'年份\']==2018][\'票房\'].plot.hist()
percent = []
for k in range(10):
Boxoffice= data[data[\'年份\']==(2010+k)][\'票房\']
q80 = np.percentile(Boxoffice ,80)
percent.append(Boxoffice[Boxoffice >= q80].sum()/ Boxoffice.sum())
percent
五、总结