网页采集器合集

最后更新于:2020-06-15 14:44:55

采集网页和数据,可以快速建立网站。除了使用采集器采集,还可以python爬虫定制,但是需要会编程。

采集器有独立软件、插件和云端采集等多种。独立软件需要单独电脑挂机,和对应CMS的发布接口。插件版和站点在一个服务器,采集会拖累网站。云端一般要发布到自己网站要不少钱。腰包不鼓,这里只提可以免费使用的。

采集方案又有填写正则等规则的,和所见即所得的模拟浏览器方式。

采集器软件

  • 火车采集器:都爱叫火车头采集器,可能是目前用得人最多的采集器,多年升级已经很完善,有免费版,基本功能都有,够用了。
    • 网上流传有火车头7.6企业版破解版、火车头采集器V9(高铁侠)内网加密狗版破解版,如果资金充足,请支持正版。
    • 视频教程
  • 火车浏览器:和上面一个厂家,可视化操作,免费版限制单任务运行30分钟。
  • ET采集软件:也是老牌子了,全自动无人值守工作。有免费版。
  • VG自动化神器:原用名VG浏览器,VG网页操作神器,主打网页自动化操作(自动登录、自动采集、自动提交、自动注册、 自动发帖、自动识别验证码。)有免费版, 限制单任务运行30分钟。
  • 八爪鱼采集器:需要下载软件,不过旗舰版采集工作可以是在云端采集,眼见即可采,浏览器能看到的就能采。有免费版,免费版只能本地采集,本地采集的话似乎导出需要积分。
  • 后羿采集器:所见即所得的浏览器类采集工具,同时支持Windows、Mac和Linux全操作系统的采集器。免费的爬虫软件,针对采集数据所需要的基础功能,没有任何限制,不需要积分,免费导出采集结果。不过想挂机定时采集是需要收费版。

采集插件

插件类采集器不用发布接口就可以直接发布数据,但是只能单独一种CMS或BLOG使用。

WordPress采集插件

  • WP-AutoBlog:原WP-AutoPost,支持翻译其他语言,可采集微信公众号、头条号等自媒体内容,支持远程图片下载到本地服务器。有免费版,但有功能限制。
    • 网上流传有WP-AutoPost破解版
  • 胖鼠采集:免费开源,使用 Html,Jquery语法,自动采集发布文章,
  • 长腿蜘蛛(WP-CTSPIDER):免费使用,需使用全功能需要在官网免费开通授权。似乎很久没更新了。支持伪原创,但需要自己填写。支持百度翻译。

DEDECMS采集插件

云端采集

  • 蓝天采集器:官方主打云端自动化数据采集发布系统,可以对接所有CMS或blog,但需要对应的发布插件。说是云端但是需要和发布网站在一个服务器,无法远程发布,感觉可能放在插件类更合适。
5 1 投票
Article Rating
订阅
提醒
guest
0 评论
内联反馈
查看所有注释