这个采集规则是杰奇后台的采集规则 不是关关采集器的规则

很多人用的linux服务器做小说网站异地采集不方便想从后台进行采集只是采集很慢,如果是用windows系统,直接用关关采集器好多了,linux下用后台采集还行。
或许看我这个,应该可以学会自己配置后台采集吧。

杰奇后台采集规则添加方法和采集(教程)

系统默认变量:<{articleid}> – 文章序号,<{chapterid}> - 章节序号, <{subarticleid}> - 文章子序号, <{subchapterid}> - 章节子序号。
系统标签 * 可以替代任意字符串。
系统标签 ! 可以替代除了<和>以外的任意字符串。
系统标签 ~ 可以替代除了<>'”以外的任意字符串。
系统标签 ^ 可以替代除了数字和<>之外字符串。
系统标签 $ 可以替代数字字符串。
采集规则中,需要获取的内容部分用四个以上系统标签代替,如 !!!!

文章序列号运算方式:floor(<{articleid}>/1000)   // 这里单独说下 有的小说站的伪静态链接是www.31234.net/22/2201/  就需要用这个运算方式转化下。

发送HTTP_REFERER标志,用于突破防采集设置:这里选择  是 

文章信息页面地址:http://www.31234.net/<{subarticleid}>/<{articleid}>/                     // 这里说明下  如果是链接是www.31234.net/22/2201/ 就写这个地址。

如果链接地址是:www.31234.net/book/2201/ 就要改成 http://www.31234.net/book/<{articleid}>/

隐藏内容
  • 普通用户购买价格:10¥
  • 会员用户购买价格:1¥1折
  • 永久会员用户购买价格:1¥

我把写好的例子规则 打包了 需要的话购买后可以直接下载测试,

如果不会写或者需要写杰奇后台的采集规则 可以单独联系我。

 

发表评论

后才能评论

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源