注:本版本为定制版本(作者只负责开发),功能较多,仅供学习和代替手工作业,请务必不要流传于网络,以免不法分子获取,作者对擅自传播本软件所造成的后果不承担责任。

此版经测试在杰奇全版本中表现良好,多开,多任务不卡线程,任务休眠期间会自动释放内存,采集速度较佳,较流畅!

仅分享软件,如果不会使用,可以联系站长付费购买教学服务。

可以采集分页规则

注意:虽然支持全线的采集入库,现已全线放弃2.4以下版本的功能维护!

1.8以上版本请严格配写分类及模版,具体请看本说明下面的内容,此问题不要在私问我,老生常谈的错误,问题基本上在下面都有解决方法

因为启用了最新MYSQL.DATA组件,支持UTF8MB4的字符集,如果您的MySQL服务器开启SSL了,或者您是用的centos8或其他字装MYSQL启用了SSL的系统,又不是采用本地localhost或者sock连接数据库(如IP链接:114.114.114.114),请在数据库配中加入:SslMode=none
或者直接在系统配置中点MYSQL默认的链接,格式如下:
Data Source=127.0.0.1;Database=数据库名;User ID=用户名;Password=密码;port=3306;SslMode=none;charset=gbk
启用了SSL的MYSQL不加“SslMode=none”直接远程调用会出现“调用 SSPI 失败”的错误,如何查看mysql是否启用了SSL命令:show global variables like ‘%ssl%’;如果出现have_ssl | YES|,这样表示已经开启了SSL

早已放弃2003系统,测试均在64位win10及win2019上进行
======================================================================================================
己亥年7月V1版(2020年7月26日)
1、回归3.X采集(选3.0即可)
2、BUG修正
己亥年5月V5版(2020年5月20日)
1、新增自定义杰奇配置文件参数,以达到脱离杰奇的目的,请自定义的同时配置好相关文件目录
2、修正手动模式加载日志只有一本问题
3、手动模式图片章节回归,新增,替换,删除,批量新增、删除,替换测试均正常(1.7及以上全版本均正常)
4、调整.NET回4.0
己亥年5月V4版(2020年5月16日)
1、回归图片章节采集(目前只支持自动采集模式)
2、调整手动模式加载日志时ID去重功能(测试中)
3、修正几处加载BUG
4、调整.NET为4.6.2,请自行安装:https://download.microsoft.com/download/0/5/C/05C1EC0E-D5EE-463B-BFE3-9311376A6809/NDP472-KB4054531-Web.exe
己亥年5月V3版
代理功能已放开,有自动代理功能,非芝麻代理,代理ip可以在http://www.kuaidaili.com/ 等站点购买,包月就行)
1.动态代理(测试发现快代IP很不好用,还是芝麻好用,可是,芝麻不支持国外用,没办法退而求次之)
有了他你就不怕被封ip了。
打开自动代理模式,输入获取代理ip的网址(
开启一个或者多个自动代理,他就是测试ip可用性并把他存储,等ip超过10个了,你就可以使用代理了。会自动不停的换ip,叫目标占始料不及。
http://dev.kdlapi.com/api/getproxy/?orderid=123456&num=10&protocol=1&method=2&an_an=1&an_ha=1&sep=1
orderid=123456把123456换成你自己的订单号就OK,num=10这个是取10条,你也可以取100条等,其它参数请官方的API文档

2、更改部分判断方法,运用更灵活!
3、修正1.7目录模版的一个判断BUG
4、修正一个2.3以上版本特有的标签导致1.7不能生成HTML,基于官方版本发布的测试OK,其他二开的版本不保证!
5、更新授权为QQ群验证,只要在我们房间就可以愉快玩耍了!
6、修正一处规则BUG

己亥年5月V2版
1、修正1.7不能生成HTML的问题,测试1.7官方版本的目录、章节、全文等生成均正常,如有错误请自行测试模版及相关配置
2、修正1.7删除TXT章节会出现查询字段不存的BUG(高版本杰奇有新字段,没有判断)
己亥年5月V1版
1、修正没有设置单项编码会出现“未将对象引用到实例的错误”
2、修正测试规则时没有图片章节的规则会无限循环的问题
3、调整规则排序,看上去更顺眼
4、增加跳过目录最后几章的功能,“PubChapter_EndSkip”项,和高级功能中的不采最后几章功能相似,这里是从源头上掐断最后几章
5、规则列表中获得书籍列表关键部分HTML有效,可以获取区间, “NovelListFilter”有效
6、调整频道、大类、小类的默认对应值
7、Cookies在规则中有效(不要干坏事)
8、调整自定义模版到“系统设置–>生成设置”,删除”DIY杰奇目录”模块
9、更新“User-Agent”的列表数据,删除比较的数值!增加MAC和IPONE及手机的UA,采手机端用手机UA值看上去更专业!
10、预留一些功能上的配置,为后期功能做准备!
己亥年3月V1版
1、加入注册KEY验证,请使用时联系本人获取KEY
2、加入首页、列表页的静态HTML生成,辅助–>生成首页列表页静态HTML里生成,已配备好常见规则
3、更新版本号以年月日时命名方式
4、优化重写部分代码流程,以提高效率
2020年2月10日 v6.0
最后还是说一下,修正了一些BUG,NET降级到V4.0,书盟采集器也同步发布(支持2.4和3.0,1.7也可以采集为本地模式)

2020年1月5日 v5.9
1.新年第一次修正空章节处理的设定不起作用的问题,修正之后完全按照设定执行!修改完成后切记保存方案后方能生效!
2019年12月28日 v5.8
1.修正手动模式下插入旧章节引起的一系列错误(严重BUG)
2.规则测试功能修正不写图片规则的死循环BUG:建议填写如下正则
<[^<]*((?<=<(?:img|IMG)[^>]*(?:(?:src|SRC)(?:\s*=\s*(?:[“‘]?))))(?:[^\s”‘>]*)\.(?:jpg|gif|jpeg|bmp|png|GIF|JPG))[^>]*>
2019年12月25日 v5.7
1.修正生成OPF时缺少“display”会提示小说未审核等错误导至无法正常访问目录及章节页
2.postdate、lastupdate、infoupdate,size或words、lastsummary等几个字段为0或为空的修正
3.多处运行流程的修正优化
4.本次更新不涉及配置文件的修改,只需要替换EXE和DLL文件即可
5.本次修正重点在生成OPF时的多处不合理BUG
2019年12月12日 v5.5
1.修正因特殊符号引起的入库问题,严重BUG,所有旧版本中都存在,可能会造成服务器卡死,数据库拥堵等现象!
2.修复“替换采集模式”不能正常替换的问题!
2019年11月26日 v5.4
1.增加章节表字段“summary”一键置空功能(不是清空章节表,只是将“jieqi_article_chapter”的预览字段“summary”置空,仅杰奇1.8及以上版本有此字段,1.7及以下请不要执行),具体在 ”设置“->”系统设置“->”生成设置“->”清空章节预览字段“ 点击执行!
2.修正V5.3一个严重BUG,可能会造成章节表数据错乱!
2019年11月26日 v5.3
1.本版本开始需要最低.NET4.6且只支持X64系统!
2.手动模式增加列出目标站的章节ID,以及本站的章节ID和字数,以便快速查看该章节是不是空章节,以及对方站对应的章节,快速修正!
2019年11月25日 v5.2
1.因杰奇1.8及以上版本默认将入库章节内容预览的TXT,会增加章节表的体积增长,现在可以在 ”设置“->”系统设置“->”生成设置“->”是否入库章节预览内容“ 自定义开关,开启后将入库章节的预览内容,章节表字段“summary”将增加TXT文本前100-150个汉字,会增加章节表的体积,仅对杰奇1.8及以上版本有用,默认开启入库,杰奇1.7请取消选择
2019年11月11日 v5.1
1.修复因单引号 ‘ 引起的严重错误”SQL logic error or missing database……”,会中断采集,并跳出错误窗口,强烈建议更新,这个问题从采集器发布开始就有,一直未能找到原因,今天终于解恨干掉了!可恶之及
2.空章节出现“请求失败”而中断采集的修复,现按采集设定是“入库章节名”还是“跳过本章”或者“停止本书更新”,自行设置
3.修复因V5.0.0.6版本的一个小BUG引起的无法采集封面

2019年10月31日 v5.0.0.5
配置必须更改,否则产生错误请自行解决!切记!切记!切记!
1.配置生成路径:设置–>系统设置–>生成设置
目录和内容路径:
这里写章节目录及章节内容静态文件存放的硬盘文件夹
如:D:\www.jieqi.com\files\article\html
注意:如果使用程序/configs/article/configs.php中的配置这里请留空
不留空生成的内容就在这里,切记!切记!切记!
目录和内容地址:
这里写章节目录及章节内容访问的静态根URL地址
如:https://www.jieqi.com/files/article/html
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空调用的URL就是这里的,切记!切记!切记!
全文阅读路径:
这里写全文阅读静态文件存放的硬盘文件夹
如:D:\www.jieqi.com\files\article\fullhtml
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空生成的内容就在这里,切记!切记!切记!
全文阅读地址:
这里写全文阅读访问的静态根URL地址
如:https://www.jieqi.com/files/article/fullhtml
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空调用的URL就是这里的,切记!切记!切记!
OPF和TXT路径:
这里写OPF及TXT文件存放的硬盘文件夹
如:D:\www.jieqi.com\files\article\txt
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空生成的内容就在这里,切记!切记!切记!
OPF和TXT地址:
这里请写OPF及TXT访问的根URL地址
如:https://www.jieqi.com/files/article/txt
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空调用的URL就是这里的,切记!切记!切记!
图片章节路径:
这里写图片章节附件文件存放的硬盘文件夹
如:D:\www.jieqi.com\files\article\attachment
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空生成的内容就在这里,切记!切记!切记!
图片章节地址:
这里写图片章节附件访问的根URL地址
如:https://www.jieqi.com/files/article/attachment
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空调用的URL就是这里的,切记!切记!切记!
封面路径:
这里写封面文件存放的硬盘文件夹
如:D:\www.jieqi.com\files\article\cover
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空生成的内容就在这里,切记!切记!切记!
封面地址:
这里写访问封面的根URL地址
如:https://www.jieqi.com/files/article/cover
注意:如果用程序/configs/article/configs.php中的配置这里请留空
不留空调用的URL就是这里的,切记!切记!切记!
==================以上部分请认真更改!或者清空后保存==============================
2.增加规则的多编码功能,以便采集一站多编码的变态行为!
规则–>采集规则管理器–>载入规则测试后保存,旧规则必须载入重新保存一下!
GetSiteCharset:全站默认编码(必填,不可留空)
NovelCharset: 简介页编码编码(可以留空,留空调用全站默认编码)
IndexCharset: 章节目录列表编码(可以留空,留空调用全站默认编码)
ContenCharset: 内容页编码(可以留空,留空调用全站默认编码)
TextCharset: 真实内容页编码编码(可以留空,留空调用全站默认编码)
3.优化章节名对比部分,以提高对比精准度

2019年10月25日23:00
1、修复日志记录格式,如果要用到超级修复功能必须更新,否则会出现SQL logic error or missing database no such column: ERROROK错误,虽然不影响,但是很讨厌
2019年10月20日
1、开放超级修复功能,按日志循环修复,测试后确定功能牛逼的不要不要的,可以彻底解放双手,坐等流量来,其他时间爱干啥干啥!比如:3P去、双飞、大宝剑等
2、规则测试中加入源码和入库时的效果对比,可以看到是不是心目中的入库效果!

2019年10月19日
1、采集时对Unicode解码,直接转换为明文!
2、修正采集时因无男女频道及分类造成的参数错误而不采集!现在无视,强制对应到默认分类中!

2019年10月7日
1、国庆假最后一天修正杰奇2.4生成HTML的一处BUG
2、杰奇2.4目录页生成时的字数调用标签的增加
3、手动模式下删除本地章节的一处细节调整

=======================以上开始只是BUG的修正,功能无增加=======================

2019年10月4日
里程碑的更新,支持章节目录的分页采集,从此可以告别外挂的痛苦,SO,版本号定格V5.0,以后专注研究PHP周边及大健康
1、PubIndexUrlPagekey:获取小说目录页的分页编码的正则
2、PubIndexUrlPage:分页目录组合URL
3、开启目录分页采集会减低生产效率,不想降低生产效率该如何解决?简单,以上两个规则空着,自己外挂即可!
4、采集器写到这里,该有的不该有的都写了,那么就此定格版,够用就好!

青山不改,绿水长流,有缘江湖再见或者再也不见!
最后祝大家流量一天十翻,10天过百万,100天收购李彦宏!

2019/10/03
1、更改自动采集模式下索引的对比方式,不管是全本还是连载均会对比!
2、更改10月2日的规则“PubChapter_GetSkip”跳过章节开头几个章节数的判断方式,可以留空表示不跳过,如需要跳过请按实际填写对应数字,如:9
2019/10/02
1、增加规则中加入跳过前几章不采,不跳过请写0,不能为空,切记切记!(此判断已经于2019年10月3日更新判断,可以留空)
2019/10/01
1、首先祝大家节日快乐,祖国繁荣昌盛!
2、修正分页采集,采集多页更快乐!具体格式:
PubContentPageUrl为分页URL,如:hrrps://www.abcd.com/book/{NovelKey/1000}/{NovelKey}/{NovelPubKey}_{Page}.html
PubContentPageKey分页结束的标识,如:下一章、或者 >下一章<
2019/09/28
1、注意请安装.NET4.5以上!
2、支持3.0的原生TXT、封面、图片章节等附件路径,当然也可以自定义!
3、3.0读取的的sort.php及config.php文件在”/cms/configs/article/”文件夹里,sort.php写法同2.4一样,只是统一顺序问题,内容是一样,注意:CODE的值不能为空!
4、3.0在”系统设置=>本地网站目录”时,请指向同public和CMS文件夹同级目录即可!
5、3.0的TXT文件默认放在 “storage/data”下属的子目录中,封面、HTML静态文件、章节附件默认放在“storage/files”下属的子目录中!
2019/09/27
1、去掉关闭时可选最下化到右下角功能!
2、修正配置文件引起的“索引超出了数组界限”的BUG,这是一个很讨厌的BUG,真的很讨厌!
3、修正1.8入库时因个别字段没有不能采集的BUG!
2019/09/25
1、修正几处BUG!
2019/09/24
1、重新启用”清理无用html页面”和”清理无用txt文本文件“,在标准模式->高级修复里开启或关闭!
2、修正多处读取和写入TXT及HTML时因编码不正确导致的乱码BUG!
2019/09/23
1、无聊弄了个最小化到右下角的功能,点关闭按钮会提示是最小化到右下角还是退出采集器,一是为了避免误点关闭,二是为可以节省任务栏,点右下角图标会自动还原窗口,就像QQ一样的可爱,可直接在状态栏双击书本图标快速打开和最小化窗口!
2019/09/21
1、自动采集索引对比优化,开启自动修复后,连载状态的内容改变任意章节均会自动修正,不再全部索引遍历,只要章节大于1的任意位置,对比不上就直接开始替换!
2019/09/16
1、修正手动模式下时间显示不正确的BUG!
2、调整部分页面布局,适应自动缩放!
2019/09/08
1、修正杰奇1.7版只能入库新书不能更新已有小说的BUG!
2、修正替换章节文本编码不正确的BUG!
2019/09/07
1、修正杰奇1.7版入库时字数不正确BUG!
2、杰奇1.7自动采集生成OPF时进行格式化处理,更易读!
2019/09/05
1、修正杰奇1.7版保存TXT和OPF时依旧为UTF-8编码问题
2、修正杰奇1.7书名拼音问题,采用同1.8以上版本相同的拼音字段articlecode,请在设置里生成拼音化,否则将不能采集
2019/09/01
1、说好的不更新了,手贱更新一下
2、增加网站编码定义,可通吃GBK及UTF8
3、更改章节自动修复的索引对比方式,理论上是更友好,更高效
4、去掉部分无用功能
5、若干小BUG修正
6、增加生成HTML的内链功能
2019/08/06
1、.net必须为V4.0以上,不是4.0请自行安装X64,不支持WINDOWS2008以下版本
2、修复若干小BUG,当然还是有BUG
3、支持jieqiv1.X-3.X版本,当然是UTF8(UTF8,UTF8,UTF8,说三遍)包括TXT及OPF均已生成为UTF8,已抛弃GBK,系统只测试了V2.3及2.4
4、MYSQL组件的更新,是为了支持MYSQL编码集utf8mb4
5、原生杰奇标签更友好
6、此版为终版,不再更新不再修复BUG,至于功能也不增加了
7、JieQiv2.4开始字数标签为{?$words?},及相关的有多处改动标签,自行查手册
8、工具只限个别内部流通
9、建议配合开源杰奇2.4UTF8版使用,配上PHP7.3+OPCache+MemCache,感觉人生从此达到了巅峰
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。