爬虫管理平台 Crawlab v0.6.3 正式发布


概览

Crawlab v0.6.3 是 Crawlab v0.6.x 的最新迭代版本,带来了一系列改进,包括问题修复、功能优化。

更新日志

问题修复

  • 取消任务时无法终止进程

  • Git拉取代码错误

  • 导出列表顺序不一致

  • 重启时无法重置待定任务状态

  • 节点下线时无法取消任务

  • 爬虫列表中无法加载节点数据

  • 导出数据乱码问题

功能优化

  • 爬虫文件导出

  • 调整任务获取时间为1秒

  • FileDriver关闭时异常捕获

  • 自动清理30天以前任务

  • 首页数据查询优化

  • 消息通知优化

  • 升级Gin版本

  • 支持MatterMost消息通知

  • 爬虫和定时任务中加入优先级

  • 前端加载性能优化

社区

如果您觉得 Crawlab 对您的日常开发或公司有帮助,欢迎在 Github 上进行 star,以及,如果遇到任何问题,请随时在 Github 上提 issue。另外,欢迎您对 Crawlab 做开发贡献。同时,您也可以加微信 tikazyq1 加入 Crawlab 技术交流群,在技术开发和部署使用上与其他开发者进行交流讨论。

参考

  • 官网: https://www.crawlab.cn

  • 文档: https://docs.crawlab.cn

  • GitHub: https://github.com/crawlab-team/crawlab

  • Demo: https://demo.crawlab.cn/


相關推薦

2023-06-18

概览 Crawlab v0.6.2 是 Crawlab v0.6.x 的最新迭代版本,带来了一系列改进,包括问题修复、功能优化以及环境变量功能的增强。 更新日志 问题修复 意外数据库连接 任务执行命令不生效 任务重启执行命令不一致 任务

2024-06-27

官方主页:https://docs.vmr.us.kg/#/zh-cn/(在github上,可能需要代理) 注意:不要去gitee仓库star,gitee只是一个被动同步仓库,也没有binaries。了解和关注最新的版本,请到github仓库。 特点: 1、支持60+编程语言和工具。 2、支

2023-11-03

无法解决的,目前将继续尝试用我们传统的桌面版Googlebot爬虫抓取这些网站,并将每年对名单进行几次重新评估。 Search Console 的变化方面,Google宣布将关闭Google搜索控制台设置页面中的索引爬虫信息。Google解释说:"由于所有在

2022-10-20

Scrapy 是一套纯 Python 实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。它也可以用于广泛的目的,从数据挖掘、监控到自动测试等。 v2.7.0 更新内容如下 添加了 Py

2022-10-16

构,提升系统可维护性; 简介 XXL-CRAWLER 是一个分布式爬虫框架。一行代码开发一个分布式爬虫,拥有"多线程、异步、IP动态代理、分布式、JS渲染"等特性; 特性 1、简洁:API直观简洁,可快速上手; 2、轻量级

2023-07-27

文档批量上传、文档批量转换、全文搜索、云存储、网络爬虫、VIP会员、手机号登录注册以及支付宝和微信支付等功能,拥有简洁美观的用户视觉和功能体验。 技术栈 Golang :gin + gRPC + GORM Vue.js : nuxt2 + element-ui Database : MyS

2023-07-15

功能] 用户注册、登录、找回密码等页面增加canonical优化爬虫路径 [新功能] StrUtil增加wordSplit通用分词功能 [新功能] GridFilter中like条件新增wordSplit模式,默认中文会分为单字查询,安装WordSpliter可对中文分词 [新功能] 增

2023-12-02

闭时候不能正常结束查询线程的问题。 修复数据源结构爬虫执行语句语法错误的问题。 📚 新功能部分运行效果 创建数据源,可以配置选择 SSH 隧道 SSH 隧道配置,按照自己的需求进行创建或者删除 SSH 隧道信息 PS: 随着

2024-07-23

兼容性 支持配置 robots.txt 文件: 更有效地控制搜索引擎爬虫访问,保护隐私 其他优化 可移除上传的文章预览头图: 更灵活的图片管理,更自由地选择展示方式 管理后台显示程序对磁盘的使用量: 方便查看系统资源占用情

2023-10-26

功能,包括广泛的法律研究材料支持。出版商屏蔽AI网络爬虫 Direcqt开发AI聊天机器人随着出版商阻止AI网络爬虫,Direqt与出版商合作,提供定制聊天机器人解决方案,以提高内容互动和流量。【AiBase提要】🤖 Direqt与出版商合作

2024-09-24

自定义过滤功能 ModelUtil::queryRemoveCondition [系统优化] 爬虫机器人检测规则优化,支持更多机器人识别 [系统优化] 图片上传增加处理提示,避免出现无状态情况 [系统优化] 链接生成参数合并过滤异常的 amp; 字段 [系统

2023-11-23

文档批量上传、文档批量转换、全文搜索、云存储、网络爬虫、VIP、手机号登录注册以及支付宝和微信支付等功能,拥有简洁美观的用户视觉和功能体验,以及配套的微信小程序。 技术栈 Golang :gin + gRPC + GORM Vue.js : nuxt2 +

2023-03-21

able特性可部分页面禁止头部滚动 [系统优化] 搜索引擎爬虫引导,增加部分链接ref=nofollow属性 [系统优化] 富文本编辑器UEditor样式缓存问题 [系统优化] 表单处理JS部分代码逻辑重构 [系统优化] modstart_config 函数根据默

2023-08-03

任意js为本地文件 headless模式,极大节省资源,适用于爬虫