Excel进行数据分析数据理解数据清洗构建模型 (3)

1、 _格式统一处理 _
首先进行分列功能,会产生如下结果:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121164406185.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
可以看到大部分的格式都已经转换成功,还有一小部分没有成功。
点击设置单元格格式,如下操作,就ok了:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121164458562.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
2、 _按月分类 _
想要知道每月用户的增长量
建立数据透视表:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121165603520.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
设置分组:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121165614995.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
结果:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121165628627.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
3、 _按照每月的最大值建表 _
我们在以上的建立表的过程中默认的是使用的求和,如果想要知道每一个月的最大值呢?在 值字段设置
里设置即可。上面的求每个城市的平均工资的平均也可以用这种方法。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121170145995.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)

多表关联查询

一直听说VLOOKUP函数是个强大的函数,这次希望能够系统的学习一下。知乎猴子总结的VLOOKUP函数的参数,我觉得非常有意思。

![在这里插入图片描述](https://img-blog.csdnimg.cn/2019012117372185.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
敲黑板重点:精确查找和近似查找(模糊查找)的区别
1)精确查找是指从第一行开始往最后一行逐个查找。一找到匹配项就停止查询,所以返回找到的第一个值。
2)当你要近似查找的时候,它就会苦逼地查遍所有的数据,返回的是最后一个匹配到的值
如果是精确查找的话那就将第四个参数设置为0。
1、 _学生信息和三好学生信息查找 _
如果三好学生表中只有名字,我们想要知道他所在的班级。我们通过这个函数来实现。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121175057455.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121175107666.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/2019012117512452.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121175151484.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121175201448.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
我们可以发现:对于重名的同学,我们只找出了第一个同学。怎么查找出重复值呢?
首先我们先将学号和姓名拼接在一起组成一个唯一的特征(只代表一个同学)。然后借助这一列来查找(方法同上)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121175418684.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190121175427883.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)
这里&是表示将两个单元格的内容拼接在一起。
2、 _消费数据分组 _
我们现在有这样一组数据,我们想要通过他们的月消费水平将他们的消费分组(低消费、中消费、高消费)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190122204532755.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1X3dlbnFpb25n,size_16,color_FFFFFF,t_70)

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zgyjdg.html