1、采用底层HTTP方式采集数据,快速稳定,可建多个任务多线程采同时采集多个网站数据
2、用户可以随意导入导出任务
3、任务可以设置密码,保障您采集任务的细节安全不泄漏
4、并具有N页采集暂停/拨号换IP,采集遇特殊标记暂停/拨号换IP等多种破解防采集功能
5、可以直接输入网址采,或JavaScript脚本生成网址,或以关键词搜索方式采集
6、可以用登录采集方式采集需要登录帐号才能查看的网页内容
7、可以无限深入N个栏目采集内容、采链接,支持多级内容分页采集
8、支持多种内容提取模式,可以对采到的内容进行你需要的处理,如清除HTML,图片等等
9、可自编JAVASCRIPT脚本来提取网页内容,轻松实现任意部分内容的采集
10、可按设定的模版保存采到的文本内容
11、可将采到的多个文件按模版保存到同一个文件中
12、可对网页上的多个部分内容分别进行分页内容采集
13、可自设客户信息模拟百度等搜索引擎对目标网站采集
14、支持智能采集,光输网址就可以采到网页内容
15、本软件永久终身免费使用
智动网页内容采集器 1.96
增加了支持TLS1.2,SSL3加密采集内核
智动网页内容采集器 1.95
增加了全局设置:合并HTTP请求COOKIE功能,可选
该功能默认合并,可以设置不合并避免个别网站检查新COOKIE限制采集
智动网页内容采集器 1.93
去除内置浏览器自动加http前缀,需要手动添加,排除特殊前缀无法打开问题
测试时获取的HTML自动清除WINDOWS不识别无意义字符,解决windows显示时HTML内容不全问题
智动网页内容采集器 1.92
增加采集规则JS方式提取时中当前网址参数JsLocUrl
保存内容模板插入标记时不再复制标记再插入,而是直接插入
强烈建议不会写规则的朋友使用智能采集方式,输入网址即可采集(方法:新建->智能采集任务)