智动网页内容采集器可用多任务多线程方式采集任何网页上的任何指定文本内容,并进行你需要的相应过滤和处理,可以用搜索关键词方式采集需要的指定搜索结果。
1、采用底层HTTP方式采集数据,快速稳定,可建多个任务多线程采同时采集多个网站数据
2、用户可以随意导入导出任务
3、任务可以设置密码,并具有N页采集暂停,采集遇特殊标记暂停等多种防采集功能
4、可以直接输入网址采,或JavaScript脚本生成网址,或以关键词搜索方式采集
5、可以用登录采集方式采集需要登录帐号才能查看的网页内容
6、可以无限深入N个栏目采集内容、采链接
7、支持多种内容提取模式,可以对采到的内容进行你需要的处理,如清除HTML,图片等等
8、可自编JAVASCRIPT脚本来提取网页内容,轻松实现任意部分内容的采集
9、可按设定的模版保存采到的文本内容
10、可将采到的多个文件按模版保存到同一个文件中
11、可对网页上的多个部分内容分别进行分页内容采集
12、可自设客户信息模拟百度等
搜索引擎对目标网站采集
13、本软件长久终身免费使用
智动网页内容采集器 v1.9更新:
软件内置网址更新为
www.zdexe.com采用全新的智动软件控件UI
增加用户反馈到EMAIL功能
增加将初始化链接直接设置作为较终内容页处理功能
加强内核功能,支持关键词搜索替换POST内的关键词标记
优化采集内核
优化断线拨号算法
优化去重复工具算法
修正拨号显示IP不正确BUG
修正遇出错关键词暂停或拨号时没有重新采集出错页面的BUG
修正限定内容较大值为0时,较小值无法正确保存BUG