【数据清洗与整理】财务与 HR 刚需——全表敏感信息“一键全盲脱敏”
评论
收藏

【数据清洗与整理】财务与 HR 刚需——全表敏感信息“一键全盲脱敏”

经验分享
j
jyc_rvs
2026-05-20 16:00·浏览量:212
j
jyc_rvs
发布于 2026-05-20 16:00212浏览

一、痛点场景描述

  • 原始数据样子: 企业内部的员工花名册、客户成交记录流水,或者供应链对账单。表格字段极多(经常几十列),且敏感信息零散分布在各个角落:有些在专用的“手机号”、“身份证”列,有些则隐蔽在人工填写的“备注”、“异常说明”等纯文本列中。

  • 想达到的效果: 在将表格外发给服务商、外部审计或分析师之前,必须对所有敏感隐私(身份证号、手机号、银行账户)进行脱敏打码。要求:

  1. 全表盲扫: 无需手动指定在哪一列,AI 必须能自动识别全表所有单元格的内容。

  2. 多模态差异化处理: 识别到身份证就抹去出生日期,识别到手机号就打码中间4位,识别到银行卡就只保留后4位。

  3. 原地覆盖: 直接在原单元格内修改,不能破坏原有的表格结构、其余正常文本以及现有的排版格式。

  • 原手动操作耗时: 传统 Excel 没有“全表智能正则扫描”功能。人工处理需要先逐列筛选,再使用复杂的 REPLACEMIDLEFT 函数互相嵌套拉公式。如果备注列里混杂了电话,公式直接抓瞎,只能人工一个个双击单元格去手动删改。面对几千行的多列大表,至少耗时 2-3小时,且极易遗漏引发安全合规事故。

二、魔法指令(提示词)

在影刀“魔法指令”中,直接输入以下大白话提示词:

“请对当前整张表格进行全盘智能脱敏扫描:

  1. 只要发现符合‘18位中国身份证号’格式的文本,一律将第7到14位(出生日期)替换为‘********’;

  2. 只要发现符合‘中国手机号’格式的文本,一律将中间4位替换为‘****’;

  3. 只要发现由‘数字或英文构成的银行账户/账号’,仅保留最后4位,其余前缀字符全部用‘*’号打码。 请直接在原单元格内覆盖修改,保持其余正常文本内容和表格原有格式完全不变。”

三、执行效果展示

  • 输入指令运行后,表格瞬间刷新。身份证自动变为 340122********XXXX;手机号变为 138****5678;银行账号列的文本自动变为 ***************34567。格式未发生任何错动,非敏感文字完好无损。

四、可复用的场景包

  • 适用场景:

  • HR 部门: 员工花名册外发培训、商业保险申报、或企业通讯录脱敏发布。

  • 财务与运营部门: 电商多店铺成交流水外发分析、物流供应链对账单结算安全审计。

  • IT 与安全部门: 生产环境真实数据一键漂白,用于测试环境交付。

  • 需要修改的参数: 本方案基本属于通用脱敏引擎。如果不同企业有特殊的打码规范(例如身份证要求隐藏后6位,或特定格式的内部工号需要保密),只需在魔法指令(提示词)中直接修改对应的“第几位到第几位”以及替换的符号(如改成 #*)即可,零代码门槛。

收藏2
全部评论1
最新
发布评论
评论