

发布于 2025-08-11 09:311892浏览本章首先演示了在聚水潭ERP系统中,使用影刀RPA进行数据抓取时遇到的元素不稳定问题,特别是由于IFRAME嵌套导致的元素定位不准确。通过实际操作展示了抓取数据不全的现象,并初步探讨了问题根源。
针对IFRAME嵌套导致的元素不稳定问题,本章详细介绍了解决方案。核心是避免使用不稳定的位置索引(INDEX)进行定位,转而采用更可靠的链接SRC属性。通过修改SRC路径,并使用通配符匹配,确保元素定位的稳定性,即使页面结构或操作顺序发生变化,也能准确抓取数据。
本章聚焦于数据抓取不全的问题,指出其主要原因是网页的"懒加载"机制。视频演示了如何使用影刀RPA的"获取懒加载Web"命令来处理此类页面。详细讲解了如何正确选择要抓取的行元素(TR),并结合循环打印,确保所有懒加载数据都能被完整抓取。
本章提供了一种处理IFRAME嵌套和懒加载的替代方法:直接访问IFRAME内部的链接。这种方法可以绕过IFRAME的限制,直接对内部页面进行操作和数据抓取,从而避免了元素定位和懒加载的问题,提高了抓取效率。但需注意并非所有网页都支持直接访问。
本章介绍了一种更高级、更偏门的懒加载处理方法:通过修改网页JS脚本中的像素点限制来欺骗网页,使其一次性加载所有数据。这避免了滚动抓取的繁琐,但适配性较差,仅适用于特定网站(如聚水潭ERP)。视频详细演示了如何定位并修改相关元素的Style属性。
本章继续演示了通过修改JS脚本来一次性加载所有数据后的批量数据抓取过程。强调了在修改元素属性后,可以直接进行单页批量抓取,无需懒加载操作。同时,也指出了这种方法可能遇到的元素未找到问题,并提供了相应的解决方案,即确保元素定位的准确性。
本章详细讲解了如何使用影刀RPA的"监听"功能来获取网页请求数据。通过F12开发者工具分析网络请求,筛选出包含所需数据的URL,并利用通配符进行精确匹配。演示了如何启动监听、触发请求、获取返回的JSON数据,并进行多层解析,最终提取出所需字段(如内部订单号和包装信息),实现高效的数据采集。

这个是视屏中操作的指令集合