CTspider(长腿蜘蛛)v2.3更新发布 查看更新日志 2018/09/27

文章抓取

2017-04-19 入门指南

文章标题匹配规则

CSS选择器:h1

长腿蜘蛛ctspider文章标题css选择器

1.如果查找全文只有1个 h1 可直接填写CSS选择器为 h1

2.谷歌浏览器一键查找 F12 右键点击例图(h1) 出现Copy 然后选项 Copy Selector 

得到 #Main-Article-QQ > div > div.qq_main > div.qq_article > div.hd > h1 直接填入CSS选择器也可以 两种方法。

文章内容匹配规则

CSS选择器:#Cnt-Main-Article-QQ

ctspider长腿蜘蛛文章内容css规则

可以可到文章内容div节点ID Cnt-Main-Article-QQ 是唯一可以直接写入CSS选择器规则即可

发表评论 (1)

您必须 才能发表留言!


  1. Denys 1楼

    你好,提一条修改建议哈,目前爬取的文章是发布在post_type默认的文章里,如果主题有新注册的文章类型就没法选择,比如:我新注册了个游戏类型文章:register_post_type(‘game’, $args); 就没法发表,建议在CTspider->文章设置 里添加一项选择post_type的选项,这样就有 默认文章和游戏两个选项选择。