• 微信

基础篇1:批量采集论坛用户的用户名,邮箱或用户积分(图文)

1178次浏览 更新日期:2020-11-08 22:34:49 分类:综合 评论:0

admin 2019-09-28 10:18:08

引用:
万能信息采集是一款小巧而功能强大的批量网页信息采集工具

今天给大家做一个批量抓取多个页面的某局部的信息,并导出到excel或文本。
为本论坛的用户资料页为例,采集全论坛的用户昵称并导出到表格
一:打开用户资料页,例如:http://bbs.kakawz.com/home.php?mod=space&uid=2777 ,可以看到,页面有多处包含昵称的地方。只要任意截取一个地方的,都能找到用户昵称。

二:当前页面,晴天娃娃07221 就是我们要找的昵称,即我们需要把晴天娃娃07221采集出来。

引用:
1、把1个的用户资料网址填到此框
2、点最下面的配置测试,右面框将显示页面源代码
3、在右侧找到任一处晴天娃娃所在位置
请注意晴天娃娃 前面/后面 的代码
只需截取出,前面和后面中间部分,就是 用户昵称

4、再将昵称的前/后的代码,分别填到区域区域的首与尾的框中,用途选择“截取区域之间的文本”


引用:
5、再点配置测试,右边将正确显示匹配出的用户名,如下图





OK,到这一步,说明我们的配置OK。
最后一步
将所有的用户页面网址,都填写到“提交网页”框中,再点“测试好了,开始批量处理”,稍等片刻,即可在任务列表显示全部的匹配结果

再把处理的结果,导出来吧~~

是不是超级简单省事多了~~有同学要问这几个页面我手动找都比你快,好的别抬杠啊,我只是拿这几个举例,实际应用中可以有上万个页面的信息要批量取,手动找找看~~

小作业:
1、用工具试着把这些页面的用户积分匹配出来
引用:

下节预告:将一个页面的所有文章标题匹配出来


38722856 2019-12-16 16:54:46
将一个页面的所有文章标题匹配出来{:wait:}


我来说两句
发布新帖
版主信息