进行了这样的操作后,我们要检查一下最低薪水和最高薪水中是不是所有的的值都像我们期待的一样填充了。利用筛选功能,筛选出最低薪水和最高薪水一列,发现有#value的值,把他们查找出来,看看是因为什么原因没有填充成功。
最低薪水因为有k用K表示,导致不能识别出来,我们用替换函数把K换成k即可,换完之后检查,通过。
最高薪水因为HR写的时候只写了最低的工资下限:如15k以上。所以针对这些样本,我们让最高工资等于最低工资即可。换完之后筛选检查,通过。
平均薪资:进行如上处理后,我们得到的是字符串类型的数字,不能直接用平均值函数。我们将他们先进行选择性复制(只复制值)到新列,进行 分列
操作,转换成数字型的就可以了。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121113126865.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
6、 _数据排序 _
这一功能主要是通过 排序和筛选 功能实现的,比较简单。
7、 _数据透析表看异常值 _
在这一部分我们想要只把数据分析有关的岗位筛选出来,以便于后面的分析工作。看下面的步骤:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121154421732.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
首先通过查找函数找到有这些关键词的岗位,如果没有这些关键词出现,这个函数将会返回一个错误标识,我们通过count函数处理一下:如果没有这些关键词,返回0,如果有这些关键词,则返回出现的次数。(比如数据分析师:数据分析,分析师都出现了,即函数返回2)。最后用IF函数将出现的标记为是,没有出现的标记为否。
进行完这一步之后,通过筛选功能把是的样本找到,然后将这些样本复制到新的excel表中,作为我们清洗数据后的结果。
在excel里面进行数据分析,我们不会涉及到很复杂的模型,在这里我们主要是借助数据透视表功能实现,这里的数据是我们进行过数据清洗之后的数据。
问题一:在哪些城市找到数据分析师工作的机会更大。
建立数据透视表,将城市选做行,将工作年限选做列,城市选做值,如下步骤:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121161648333.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
通过对行标签进行计数,我们看到从计数从大到小的城市排列。
![在这里插入图片描述](https://img-blog.csdnimg.cn/2019012116180725.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
结果:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121161901605.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
如果想要查看各城市的占比,单击右键,选择 值显示方式 下的 列汇总的百分比 ,会有
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121162400191.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
问题二:数据分析师的平均薪水的描述性统计怎么做?
安装分析工具库加载项,然后在数据下点击数据分析,选择描述性统计。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121162821911.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
结果如下:
问题三:数据分析师的薪水如何?
我们想要知道不同的城市这个岗位的平均工资 。
建立数据透视表,选择城市作为行标签,平均薪水作为值,但是这其实是显示的每个城市的平均工资总和,我们如果想要看到平均的平均,如下操作即可:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121163150850.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
结果如下(排序后):
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121163238700.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
我们想要知道不同的工作年限要求对工资的影响
同样的方法,只不过将行标签改为工作年限即可。
结果如下(排序后):
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121163503774.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
结论
通过上面的分析,我们可以得到的以下分析结论有:
1)数据分析这一岗位,有大量的工作机会集中在北上广深以及新一线城市,如果你将来去这些城市找工作,可以提高你成功的条件概率。
2)从待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。
3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-3年。
对于数据分析师来说,5年似乎是个瓶颈期,如果在5年之内没有提升自己的能力,大概以后的竞争压力会比较大。
4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。 日期数据处理(数据集已经更换)