飞采(NiniDown)是一款基于.NET编写的多线程信息采集系统。通过直观的的规则制订,模拟浏览器不同的提交行为,可以方便的将浏览器中看到的信息抓取下来,并可以通过在线发布工具或数据库入库工具,将该信息发布到您自己的网站上。其灵活的规则制定,强大的分页处理,计划任务,对Access,Mysql,MSsql的数据库支持等功能,将有效节约您的宝贵时间,让工作变得更加轻松......
特色介绍
支持多任务、多线程:可以同时执行多个采集任务,每个任务又可以使用多个线程。
支持多层导航技术:可以跨层采集,分页采集,分页内容可以合并为一条记录。
支持采集内容可以多表,跨表保存;可以通过关键字关联,自动整合成一条完整记录。
支持历史记录功能,方便增量采集,避免重复采集。
支持固定时间、间隔一定时间采集、全部任务完成后自动关机。
支持网站登录采集,可以采集需要登录才能看到的页面。
支持普通、POST、脚本链接采集。对采用函数生成的分页地址也可以采集,支持简单表达式计算
支持POST数据、Cookie捕获,通过内置浏览器可以捕获特殊cookie,如HttpOnly类型的ASP.NET_SessionId等,方便创建下载、发布