在excel中如何筛选重复数据|利用内置功能快速甄别整理重复内容
上周对接业务台账,手里堆了一千多条杂乱的客户信息,反复核对眼都花了,被逼着仔细琢磨在excel中如何筛选重复数据,原本以为是个简单操作,结果徒手核对半小时,越核对越乱,还改错了好几条原始数据。
最开始的操作完全是瞎忙活。
当时压根不知道excel自带筛选重复数据的功能,全程靠着肉眼逐行比对姓名和手机号,台账里有不少格式不统一的内容,有的单元格带隐形空格,有的联系方式数字末尾多了无效后缀,肉眼根本分辨不出来细微差别,忙活四十多分钟,只揪出来十几条表面能看到的重复数据,还漏掉了大半隐藏的重复条目,甚至把两条信息相近但完全不同的客户资料误判成重复,随手删掉之后导致部分业务数据缺失,差点耽误当天的工作报表提交,白白浪费了大把时间。
折腾好久才搞明白,肉眼排查是最没用的笨办法,excel自带的条件格式才是最快的初筛方式。
选中需要排查重复数据的整列或者整片数据区域,点击顶部菜单栏的开始选项,找到条件格式功能,点开里面的突出显示单元格规则,直接选择重复值选项,弹出的小窗口不用修改任何参数,直接点击确定就可以。这一步做完之后,表格里所有重复出现的内容都会自动填充浅红色底色,独一无二的数据则保持原样,不用再逐行翻看密密麻麻的单元格,所有重复内容都能直观呈现出来。
但这一步只是标记,没法直接整理。
一开始以为标红之后手动删除多余内容就行,可表格里有的数据重复三次、四次,零散分布在不同行,手动逐行删除不仅效率极低,还特别容易出错。再加上当时心态急躁,盯着屏幕久了视线发花,试了两次,要么误删了仅有的有效数据,要么还残留着零散的重复条目,越整理越混乱,差点直接放弃重新做表。
后来才反应过来,标记完重复值之后,必须搭配自带的筛选功能收尾,才算完整做完筛选工作。点击顶部工具栏的数据选项,点开筛选按钮,表格每一列的表头位置会弹出下拉小箭头,点击对应数据列的箭头,找到按颜色筛选的选项,只勾选标红的单元格颜色,整张表格就会自动隐藏所有正常数据,只展示全部重复的数据条目。这时候可以逐一对重复内容进行核对,确认是无效重复的内容,直接批量删除,保留唯一的有效数据就行,全程几分钟就能搞定。
忙完所有数据整理,关掉表格的时候,电脑屏幕还停留在规整干净的台账页面,指尖还残留着长时间敲键盘的酸胀感。