点击文本(OCR)(免费版)
评论
收藏

点击文本(OCR)(免费版)

经验分享
RPA梦工厂
2025-09-24 18:55·浏览量:951
RPA梦工厂
影刀专家
发布于 2025-09-24 18:55951浏览

介绍

影刀里面的点击文本说实话有点贵,自己研究了下,具体配置在上篇文章: Umi-OCR:免费、离线、速度飞快的OCR文本识别

功能方面:

直接将网页对象/窗口对象,网页元素/窗口元素,全屏/区域当作变量传入,然后只需要设置点击文本的规则就行,筛选方面选择通配符,更简单一点,结果会输出符号要求的文本位置,然后使用鼠标点击就行。

1、支持通过通配符匹配精准定位目标文本,自动排除干扰内容

2、网页对象:可直接选取整个网页区域,仅在该区域内进行文本识别与点击。

3、窗口对象:支持选取指定窗口区域,仅在该区域内进行文本匹配与点击。

4、元素区域:在某一元素区域内进行文本点击

    • 软件窗口内无法直接捕获具体元素;
    • 元素层级复杂或无法通过常规方式定位;
    • 需基于文本内容进行交互,而非控件属性。

优点:

免费

区域范围更明确

速度也更快

参数方面更简单(事实上参数方面只需要纠结点击那个文本。inputs参数是直接输入,require固定为:坐标)

注意项:

使用鼠标点击指令时:


以剪映为例:(剪映元素无法直接捕获)


全屏点击“开发者社区”这个文本:



拓展方面:

可以筛选图片是否包含文本

手机端方面目前未测试是否可以,需要自行测试

收藏17
全部评论1
最新
发布评论
评论