CTspider(长腿蜘蛛)v2.3更新发布 查看更新日志 2018/09/27

采集设置

2017-04-19 入门指南

文章列表来源

长腿蜘蛛ctspider列表

添加要采集的网址,可以添加多个网址,每个网址以新行开始。

缩略图采集(wp特色图片)

长腿蜘蛛(CTspider)缩略图采集勾选(抓取缩略图)表示开始此功能。

设置CSS选择器:填写要采集的HTML元素。

详细CSS选择器教程:

方法1. 查看列表页面HTML源代码

html

可以看到img元素 有class=”zuto0″ 属性 CSS选择器:可设置 .zuto0

即可获得img图片链接

方法2. 可以用谷歌浏览器按 Ctrl + Shift +C 选择当前缩略图元素 右键点击HTML源代码img 出现 Copy 下面的 Copy selector 点击以后获取如下:

#news > div.list.first > div:nth-child(2) > div > a > img

div:nth-child(2) 2代表的是你选择的第二个 把2换成0 则可以选择所有

根据当前网址显示图片的默认属性,可以自己更换采集的图片属性。

文章网址匹配

长腿蜘蛛(CTspider)文章网址匹配

文章网址CSS选择器:同缩略图CSS选择器道理一样。

添加文章来源网址:定义一个字段例如:(url)采集后会把采集到文章网址添加到每篇相对应的文章ID下,可自己调用。

最后保存,然后点击列表测试。

长腿蜘蛛(CTspider)采集列表测试

发表评论

您必须 才能发表留言!