摘要:在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。本文主要针对“点击率”这一因素进行分析,与大家分享。
在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。本文主要针对“点击率”这一因素进行分析,与大家分享。
本文为Rambo同学以项目分析的架构,从多维度展开分析。全文共4000+字,建议收藏。
P1 分析背景及目的这是一份淘宝平台的广告展示/点击数据,本次分析需要从这些数据中发现某些规律或者异常,进而给运营团队提出建议。
评价一个广告效果的指标就是广告的点击人数,可以反映一个广告有多少人愿意点击查看广告的内容,只有广告被点击,后续转化为购买行为才会发生。
把广告的点击人数指标拆分:
广告点击人数=广告展示数 x 点击率
而广告展示数又由广告商品的价格、类别影响;不同人群对不同类别商品有着不同的喜好,从而影响广告的点击率。
在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。
因此本次分析就针对【点击率】这一因素进行分析
P2 分析思路从“广告”和“用户”两个角度进行分析:
1.广告角度分析不同广告的商品价格对点击率的影响
分析哪些类别的广告点击率更高,哪些类别的点击率低
2.用户角度分析性别和广告点击率有什么关系
结合聚类分析与RFM模型分析用户群体对广告点击率有什么关系
P3 分析过程数据清洗
1、数据概览原始的数据集中包括三类数据,具体数据对应属性如下:
为了方便分析,抽取其中的部分字段作为分析。
从raw_sample数据集中抽取:用户ID、广告ID、是否点击
从ad_feature数据集中抽取:广告ID、类目ID、广告商品价格
从user_profile数据集中抽取:用户ID、年龄层、性别、购物层次
将三张数据表,组合到一张表中
a=raw_sample.merge(right=ad_feature,on='ad_id',how='left')
b=a.merge(right=user_profile,on='user_id',how='left')
得到一张记录了用户-广告信息表
3、缺失值处理 3.1 源数据中还有许多的缺失值,将性别和年龄层字段中为空值的记录删去 3.2 异常值处理查看广告商品价格字段的属性值范围:
还是存在数据值过大的异常值,为了方便分析对价格字段进行切分,选取更贴近日常生活的价格在1000元以内的广告记录进行分析
切片之后仍保留了751570条记录
4、数据字段整合对于广告商品价格字段,每个广告的商品都有各自的价格,根据价格字段不便于进行统计。新增一个字段“price_class”代表价格的区间。
(0-价格在0-100元、1-100-200元、2-200-300元...)
结合图表分析 1、分析不同广告商品价格对点击率的影响①将广告商品价格分类
将广告按价格分为100元以下、200元以下、300元以下等10类,并计算不同价格区间中广告的点击率情况。