CTspider(长腿蜘蛛)v2.3更新发布 查看更新日志 2018/09/27

过滤功能

2017-04-20 入门指南

文章内容过滤

长腿蜘蛛ctspider文章内容过滤

CSS选择器:span  表示过滤 <span>*</span> 标签包含的内容

你也可以用class属性 例如.ad 表示过滤 HTML元素属性为 class=".ad" 包含的内容

索引:如果 索引0 为找到所有匹配的元素 ; 1 为找到第1个匹配的元素 ; -1 为找到最后1个匹配的元素.

HTML标签过滤

长腿蜘蛛ctspiderHTML标签过滤

HTML标签script 表示过滤 html中的javascript标签

是否删除标签内容:表示删除标签内所有的内容   :表示只过滤标签,不删除内容。

HTML标签属性过滤

长腿蜘蛛ctspiderHTML标签属性过滤

自动删除HTML中的 id 属性: <div id="Cnt-Main-Article-QQ" class="Cnt-Main-Article-QQ" bosszone="content">

例如 上面HTML代码中包含 id="Cnt-Main-Article-QQ"class="Cnt-Main-Article-QQ" 则只会过滤 id属性 class不会被过滤。

自动删除HTML中的 class 属性: 例如 上面HTML代码中包含 id="Cnt-Main-Article-QQ"class="Cnt-Main-Article-QQ" 则只会过滤 class属性 id不会被过滤。

自动删除HTML中的 style 属性( 例如 <p style="color:red"/> 形式的html标签属性 ) style属性会被过滤。

标签属性忽略:如果你imgp标签不想过滤任何属性,可填写即可,过个标签用 | 隔开。

发表评论 (1)

您必须 才能发表留言!


  1. 147187 1楼

    1