网站采集器是一款网页全自动采集工具!其功能包括定时计划任务、伪原创采集内容、给采集图片添加水印,批量添加图片水印等。一般站长如果想要全自动采集网页以及发布的话那么用他就没错了!附带dede织梦5.7和wordpress较新的免登录文章发布接口!。支持utf8和gbk!
网站批量采集器 v1.2 Beta版本更新:
[+]软件名由“网站批量采集器”简化成“网站采集器”
[+]文件下载更新为支持多线程下载
[+]增加了FTP文件上传,支持多线程,支持发布文章时同步或异步上传。
[+]增加简繁互转功能
[+]增加更新模块
[+]优化及增强采集内容排除功能
[+]简化和修正下载完毕后添加水印和复制文件步骤
[+]可以自定义下载文件名
[+]可以自定义对指定的后缀文件(下载的)进行添加水印
[+]发布模块编辑窗口添加另存为功能
[+]更新添加统计用户功能模块
[+]更新采集URL模块,添加采集URL规则可设置多行 和 可设置多行截取范围
[+]正则表达式采集
[+]因增加了正则获取内容,因此删除掉插入字符串到采集内容头部或尾部功能,因为可以使用正则匹配组合内容功能代替
[+]把采集内容的普通替换和正则替换合并在一起
[+]优化了采集数据写入速度
[+]更改showhint提示时间为半小时,之前太少了
[+]把添加编辑任务窗口集成到规则窗口
[*]修复http连接格式为有附加端口的时候会出现操作失败
[*]修正下载上传文件列表图标可能显示不了
[*]修正多页采集的时候可能出现无限采集
[*]修正没有分析页面的baseurl地址
[*]修复测试采集内容可以出现文字的色彩混乱
[*]修复下载文件的时候可能出现下载失败
[*]修复采集URL上限只针对采集的一个页面的有效数量而言。
[*]采集内容的时候对html代码进行解码。解决"等符号采集后变成&#adf等情况
[*]修复发布数据的时候对标签变量和全局常量没赋值的没进行赋值为null;
[*]修复发布数据提交表单时的时候对标签变量和全局常量有赋值的没进行编码;
[*]修复重命名任务该分组可能出现的错误
[*]修复删除下载数据的时候没从数据库中删除掉
[-]删除修改文件链接的【在发布内容时处理后发布】和【先处理后再写入数据库】选项,默认为【先处理后再写入数据库】
[-]减少了采集内容时排除内容和替换内容的时候信息显示