作者:守卫
关键词:企业微信、图片、视频
在做企业微信数据抓取时,我们会抓取文本,图片、视频等内容,如果完全使用rpa模拟人的方式,通过右键下载图片的方法。当图片比较多的时候,就会非常的慢,容易导致消息堆积。
在企业微信中,所有的数据都有存放的位置,而图片和视频有单独的文件夹用来存放,我们只需要找到对应的文件夹即可从内存中直接提取出图片,这样会大大的节约时间。

当打开文件位置的时候,会发现所有接受的图片都会按照 年-月 的方式存储到各个文件夹中,因此在做位置的时候,要获取当前的日期,转化成 年-月 的形式,进行动态的搜索。

而打开文件夹后,会发现,所有的图片都是随机命名的,而所有接受到的图片都会存储到这当中,无法做到关键匹配(如:人、时间)。因此在做图片提取之前,还要做一些简单的算法操作。

1.首先先清空所有的图片
2.当企业微信接受到消息,点击对应的聊天框
此时图片会进行重新加载,这里同一张图片会出现三张(聊天记录中图片,聊天中图片,缩略图)。

3.根据缩略图 线索,找到对应的图片
这里的关键点,就是那个带(1)的图片(*有的时候会变成(2),因此建议用(\d)去做)
提取出带 (\d)的图片,这里的图片为缩略图,不能直接作为实际图片使用,这里就需要在做进一步匹配,发现聊天中图片 与 缩略图的 图片 是一样的
4.根据缩略图,反推主图
这里只需要将(\d)去除掉,就可以找到对应的主图名称了,到此,就成功的找到了图片

先找到所有带(1)的,在通过下面的逻辑进行反选就能快速的找到对应的图片
