目前有一个3000页的PDF。
我需要将几百条的指定客户名称,逐一找出该客户名称在PDF中的所在页,并提取出单独页的PDF。
目前使用的方法是 for循环PDF,逐页提取文本,判断该页是否包含 这个客户名称,并提取。
但是效率很低,几百个客户每个都要循环一遍3000页的pdf,总共要循环百万页的PDF。
平均每6分钟才跑完一次3000页,10个客户就要跑1小时才能。
但是用PDF的搜索功能,可以很迅速的找到对应字段所在位置。
所以影刀是否可以提供 PDF查找数据所在页的功能?