1.简单一点的数据分列

数据形式为“办公用-办公-1000FZH1009”,而我们想要的只是后面的产品id部分1000FZH1009,

这时候我们选择这一列,点击分列操作,选择根据‘-’符号进行分列,

#需要注意的是分成三列,需要提前空出两列,用来保存生成的两列数据,不然会覆盖接下来的两列数据,导致后面两列数据缺失。

2.复杂一点的数据分列

数据形式为‘品牌 名称 规格‘,按空格分隔发现,出现很多四列,五列的数据,这时候我们去查看一下这些出问题的数据为什么分出多列,其中发现,有的规格是‘每包 5 件’,这里的5的前后都有空格,这是我们需要全选,查找替换,替换每包空格为每包,空格件为件。

我们还发现有的品牌名称是 a ¥ b,在¥前后都有空格,这时候我们也需要替换掉。总结一下就是找到那些分列异常的特征,然后对其进行批量替换。

我们还发现,还有很多是四行,而正确的应该是第四行为空,所以我们对滴四列进行筛选,选择不为空的所有行,然后对第一列的id进行复制,去重,找到所有品牌名中带有空格的,分别进行替换即可。

3.数据清洗

3.1筛选

比如一列都是数字,快速地查找脏数据的办法是,选中这一列,然后点击筛选按钮,这里可以看到出现的所有类别,然后也可以看到不符合要求的数据,可以选中并修改。

3.2排序

可根据日期,字符串等进行排序,字符串排序时要注意,有些字是多音节,比如重庆,降序排列可能排到第一位,因为误以为首字母是Z。

3.3去重

选择一列,点击去重,然后可以看到去重后的所有值。

3.4VLOOKUP

一个有四个参数,第一个参数选择要进行对比的数据,第二个参数框选起一个范围,范围的第一列是查找区域,第三个参数是框选区域的第几列,第四个参数选择是否模糊查询,选择FALSE为精确查询,函数会将第一个参数的值在框选区域的第一列进行模糊或精确比对,比对成功后,选择相对对应列数进行展示。

4.数据透视表

对要进行透视的表进行全选,插入数据透视表,数据透视表包括四个部分,分别是筛选器,行,列,还有值。为数据透视表选择行和列,然后会被分成各自不同的类,然后选择要求值的属性,可以进行求和或者求平均,同为行的放在上级会优先分类,为一个大类,列也同理,而筛选器也是分类,是最高级的分类,并可以选择需要的最高类。

4.1在数据透视表基础上的折线图

全选数据透视表,然后建立折线图,可以生成一个反应变化趋势的直线图,并且在数据透视表基础上生成的折线图,可以通过展开收缩各个类,进行折线图的调整。

4.2在数据透视表基础上的柱状图

全选数据透视表,然后建立柱状图,适用于有两个维度,然后在每一个横类看纵类的大小比较,也适用于第二个维度分成多级,然后选择查看各自比例的柱状图。

4.2在数据透视表基础上的饼图