『数据处理案例』文本相似性分析,使用影刀RPA可快速开发和分发python程序
评论
收藏

『数据处理案例』文本相似性分析,使用影刀RPA可快速开发和分发python程序

经验分享
E
Excel催化剂
2024-08-17 22:58·浏览量:1244
E
Excel催化剂
影刀见习开发者
发布于 2024-08-17 22:581244浏览

最近有一个客户需求,需要清理一些不同数据上下游的原因,在Excel上加工数据引起的同一个项目名称,被不同人命名成不同内容,引起无法进行查找引用vlookup数据处理的问题。

虽然之前开发过一个反向vlookup的自定义函数,可以查找完整的值,在不完整缩写的名称上进行查找,并返回不完整名称或其所在的引用区域其他列的内容。

此处仅举例说明,实际数据是可以模糊查找,不需要这么整齐划一的统一取最后一截的内容。

当然有了OFFICE365新函数后,也可以使用其他套路函数完成,略复杂,性能会较差。

上面的查找,只是基于字符串的包含结构来处理,如果遇到下面这种情况,就歇菜了。

上面的结果,是使用python来计算出来的,整个python代码也不复杂,问了gpt就轻松获取到了。

问题来了,这些效果,自用是很简单的,但如果分发给其他普通用户使用,有什么好的办法呢?

这时,影刀RPA的优势就出来了,一次性安装影刀,然后整个环境不需要自己去处理,开发完的程序可以同步到其他机器上直接使用,不用担心环境复杂配置问题。

同样地,在RPA软件里,操作Excel的读写也是很方便,而且还能够用COM的方式来操作当前活动工作薄,用户在Excel工作表上改动完,直接运行流程就可以。


经过上述的核心代码后,就可以把处理完的文本相似性写回到当前活动工作薄中,并且写入时,还可以把以前的内容给清空它。

总结

上述数据处理的方案,使用了影刀RPA的方案,开发效率高,程序分发也友好,当然最好的体验是在Excel插件中实现,奈何使用C#语言,对这些文本相似性的处理,不及python专门针对数据分析的语言来得方便。

整个方案只需要用户安装一次影刀RPA软件,后续的开发和交付都可以无感进行,开发好,通过帐号可远程同步,体验非常好,是个向普通终端用户交付成果非常不错的方案。

同时使用影刀RPA来开发,又可以充分利用上它现有的封装好的指令,对于复杂场景使用,特别是跨多个程序,处理流程链条足够长时,优势很明显,全程可以自动化完成。

最后,本文提及的RPA流程,有兴趣在自己机器上部署使用,或更多定制化场景需求,随时加笔者微信190262897联系。

收藏
全部评论1
最新
发布评论
评论