八爪鱼采集器是一款免费的网站数据采集软件,帮助你收集网页上的各种数据。八爪鱼采集器通过强大的由其自主研发的分布式云计算平台为核心,能够在很短的时间内,轻松从各种不同的网站和网页获取大量规范化数据,帮助使用者实现数据自动化采集,编辑,规范化,摆脱人工的桎梏,降低获取成本,大大提高工作效率。举个简单的例子,如果你是一个商人,那么你必须掌握大量的商品市场价格、销量等等信息,来方便你知道商品如今是买方市场还是卖方市场,帮助你迅速掌握这些信息,以提高你的利润。
注:xp用户在使用这款软件之前,请先安装,net 3.5组件不然无法运行,下载链接:.net 3.5。安装说明
解压缩后运行安装程序(压缩包中有一个exe文件,一个msi文件,都能安装)开始安装,本软件安装十分简单,只需点击下一步就OK了。
使用说明
启动软件后会有使用指南,用户可以自行查看。
主要功能
简单来讲,使用八爪鱼可以非常容易的从任何网页精确采集你需要的数据,生成自定义的、规整的数据格式。八爪鱼数据采集系统能做的包括但并不局限于以下内容:1. 金融数据,如季报,年报,财务报告, 包括每日最新净值自动采集;2. 各大新闻门户网站实时监控,自动更新及上传最新发布的新闻;3. 监控竞争对手最新信息,包括商品价格及库存;4. 监控各大社交网站,博客,自动抓取企业产品的相关评论;5. 收集最新最全的职场招聘信息;6. 监控各大地产相关网站,采集新房二手房最新行情;7. 采集各大汽车网站具体的新车二手车信息;8. 发现和收集潜在客户信息;9. 采集行业网站的产品目录及产品信息;10. 在各大电商平台之间同步商品信息,做到在一个平台发布,其他平台自动更新。
产品优势
操作简单操作简单,完全可视化图形操作,无需专业IT人员,任何会使用电脑上网的人都可以轻松掌握。云采集采集任务自动分配到云端多台服务器同时执行,提高采集效率,可以很短的时间内 获取成千上万条信息。拖拽式采集流程模拟人的操作思维模式,可以登陆,输入数据,点击链接,按钮等,还能对不同情况采取不同的采集流程。图文识别内置可扩展的OCR接口,支持解析图片中的文字,可将图片上的文字提取出来。定时自动采集采集任务自动运行,可以按照指定的周期自动采集,并且还支持最快一分钟一次的实时采集。2分钟快速入门内置从入门到精通所需要的视频教程,2分钟就能上手使用,另外还有文档,论坛,qq群等。免费使用它是免费的,并且免费版本没有任何功能限制,你现在就可以试一试,立即下载安装。
更新日志:
主要体验改进
【云采集】新增云采集实况功能,展现任务的云端运行情况,如任务的拆分,分配节点,采集数据等过程
【云采集】新增云采集通知功能,可针对每个任务设置采集完成 、采集停止时进行邮件通知程
【云采集】新增单个子任务重启功能,对采集量较少或状态是已停止的子任务进行重启,可减少数据遗漏
Bug修复
修复「重试次数设置不生效」问题
修复「循环URL异常」问题
修复「最后一个字段,修改字段名保存无效」问题
提升性能,修复若干卡顿问题