




https://www.winrobot360.com/yddoc/?
https://www.yuque.com/docs/share/1597c84e-1901-4aa3-a70d-95eb67e243c1?#
作业提示:需要点击打开所有左侧的层级菜单,才可以捕获到所有标题和链接。

=================================================================================






在交流群”内卷+奶茶诱惑“激发下迸射出很多闪光点,下面分享下他们的方法和巧思(目前我这里只收集到下面几份,如有更新会补充上来分享给大家。如有被遗漏的开发者作品,我先跟您道歉,请反馈给我,我尽快补充上来😂):

(该方法使用了len(web_element_list)的值是否为0来判断左侧标题层级是否全部展开,这种方法普适性广,不管左侧标题有多少层级,都可以完全展开)
技巧:通过修改网页结构实现批量数据抓取捕获的方法👇

(该方法是使用指令最少的方法,利用了影刀文档标题最高4层级的特点,使用for循环3次减少条件判断精简了指令长度,另外”批量数据抓取“的元素捕获方法独具巧思,通过修改网页结构的方法快速实现目标捕获,推荐大家学习!)
技巧:扬帆起航的”批量数据抓取“的技巧和滕健对”批量数据抓取“原理的总结(感谢👍👍👍)


(扬帆起航首先实现通过修改元素层级方法完成”批量数据抓取“一次性抓取所有标题和链接。很棒的钻研精神,值得学习!)

(该方法中写入数据表格的技巧很棒,用3条指令解决了批量写入:先获取循环项的对象,写入数据表格的时候再分别写入循环项的不同属性值)

(该方法采用无限循环+try……catch退出机制的方法,每循环点击一层菜单并写入一行数据的方法。其中获取元素对象使用了xpath定位的方法,很有创意)

(该方法使用”if元素可见“作为条件,判断左侧标题是否全部展开;写入数据表格采用map()函数将两个列表打包一次性写入数据表格)
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++



