易采网站数据采集系统是一款功能全面、准确、稳定、易用的网络信息采集软件。它可以轻松将你想要的网页内容(包括文字、图片、文件、HTML源码等)抓取下来。
基本简介
易采网站数据采集系统,可以轻松将你想要的网页内容(包括文字、图片、文件、HTML源码等)抓取下来,采集到的数据可以直接导出到EXCEL、也可以按照你定义的模板保存成任何格式的文件(如保存成网页文件、txt文件等)。也可以在采集的同时,实时保存到数据库、发送到网站服务器、保存到文件。
软件特色
用户只需用鼠标点击就可以配置采集任务,实现所见即所得的采集任务配置界面;
网页内容的变化(如文字增减、变更,文字颜色、字体的变化等)不会影响采集的准确性。
支持任务嵌套,可采集无限级的页面内容 只需在当前任务的页面中选择指向你要采集的下级页面的链接,即可建立嵌套任务,采集下级页面的内容,且嵌套级数不限。这种便利都得益于我们全新的内容定位方式和图形化的采集任务配置界面。
可同时采集任何内容 除了最基本的文字、图片、文件外,还可以采集针对具体HTML标签的源码、属性值等。 强大的信息自动再加工能力 你可以在配置任务的时候,指定对采集到的内容进行任何的替换、筛选。
可对采集到的内容进行自动排序
支持采集结果保存到EXCEL和任意格式的文件 支持自定义文件模板。
支持实时保存到数据库 支持ACCESS、SQLSERVER、MYSQL数据库(后面版本还将支持更多类型的数据库)。
支持实时上传到网站服务器 支持POST和GET方式,可自定义上传参数,模拟人工提交。
支持实时保存到任意格式的文件 支持自定义模板,支持按记录保存和将多个记录保存到单个文件,支持大纲、明细式的保存(所有记录的某些内容保存到一个大纲文件中,然后每条记录又单独保存到一个文件。
支持多种灵活的任务调度方式,实现无人值守采集
支持多任务,支持任务导入和导出