一般大家最头疼的“去重”难题,实际上就是想把表格里那些没用的、一样的东西删掉。
比如你有一堆客户名字,有的写错了,有的重名,要么不同项目下用了同一个供应商,Excel 自动删掉这些,比人工一个个删快多了,并且还能保留原数据,哪位都能看懂。
实际上也不需求搞啥复杂的公式,就靠 Excel 自带的“数据”那一套。 最直接的办法,就是点“数据”进去,把“删除重复值”那个选项拉出来。
这时候你要是想只留一个,那就选“第一”,啥都有,随意哪个都行。
要是想把原来的那行都留着,多留几条,那就选“所有”。点一下“确定”,奇迹自然形成,表格瞬间干净利落了。
这个方式适合大局部情况,并且 Excel 会记住你的操作习惯,赶明儿每次去重都能秒变。 不过有时候你会发现,直接删不干净利落,要么删忒狠了把数据搞坏了,这时候就得用“删除重复项”这个高级功能了。
这个功能看起来比“删除重复值”要复杂一点,但它更智慧。它能把你列里的每一个数值都算一遍,然后自己比对,自动把那些重复的给踢出去。
比如你有一张带工夫戳的订单表,有的订单工夫是一样的,只要金额不一样,这两个就算重复;工夫一致且金额一样,那就彻底重复了,直接全删。 操作入口也挺直观,在“数据”选项卡里往右拉,找到“删除重复项”那个按钮点进去就行。
这时候你得选一个条件,比如就选那个“价格相同”的列。选完后,你只需求点“确定”,Excel 就会去扫描每一行,发现重复的就把那行给替换掉,要么直接删掉。
这个功能特别管用,出于它能处理大量手动删不掉的情况,并且它是确实会试的,不会直接把你整张表删光,而是先算出哪些是重复的,再动手。 比如你在整理一份工资表,里面有个员工的名字,张三和李三有时候会混在一起,就连可能名字拼写有误,比如多了一个“侠”字。用“删除重复值”直接删人肯定不中,出于这样张三就没了。
这时候就得用“删除重复项”了。你先把那个“姓名”列里的每个值都输入一遍,然后点开“数据选项卡”里的“删除重复项”,选择“工作表”作为条件。
这时候 Excel 会去比对,发现“张三”和“张三侠”不重复,但要是有两个“张三”,那这两个就会变成重复项,其中一个被自动移除。
这样就能保证数据绝对准,不会漏掉任何一个拼写对的名字了。 这里有个小细节要注意,就是你要确保你的重复项确实是真正的重复,不是巧合。
比如你有三个订单,工夫分别是 10:00, 10:00, 10:00,但金额分别是 100, 200, 300。
要是你只是按工夫去重,那 10:00 这一趟就算重复删了,后果挺严重。
故此用“删除重复项”之前,最好先开个“数据验证”,把工夫改成不清楚匹配要么用日期公式,让 Excel 先判断出这三天是同一天的记录,这样再去重,逻辑才通顺。
要是不加这个步骤,Excel 可能会出于工夫戳忒接近而误判,删掉本来不重复的几行,那就冤枉好人了。 另外,在启动用这个功能之前,也得心理预备一下,有时候数据可能会有点混乱。
比如你有一列是重复的,另一列是唯一的,点启动排序时,Excel 可能会先把唯一的那列排出来,然后再去重剩下的那列。
这在数据清洗的时候有点小费事,间或会出现数据错位的情况。
这时候你就得先单独把唯一的数据传出来,要么调整一下排序选项,比如按“日期”排序,这样工夫戳大的自然会排在前面,再去重的时候就不会乱套了。 实际上不管用啥方式,核心思想都一样,就是让 Excel 自己去干活,别让它去猜你想要啥结局。
有时候人工去重,出于懒得点,就复制粘贴要么用分列,效率反而更低。
这时候还得靠“数据分析工具库”里的“数据透视表”要么“高级查找”,那些功能别看强大,但操作起来门槛高,新手好办踩坑。
故此还是老老实实用“删除重复项”最稳妥,既不用费脑子,也不会出错。 最终,用这些功能之后,最好定期回头看一眼数据。毕竟数据是活的,用户会发新消息,项目会推进,新的数据不断进来。用久了,旧的重复项可能会出于工夫戳变化要么金额微调而消亡,新的重复项又可能会出现。
这时候再回顾一下“删除重复项”的设置,确保你选的条件确实是针对当前业务逻辑的,这样你的表格才能一直保持着清楚的秩序,哪位都能一眼看明白,不会把大家绕晕了。毕竟数据多了,维护起来也得省点力气,自动化处理就是为了解决这个痛点的。