爬虫管理平台 Crawlab v0.6.3 正式发布


概览

Crawlab v0.6.3 是 Crawlab v0.6.x 的最新迭代版本,带来了一系列改进,包括问题修复、功能优化。

更新日志

问题修复

  • 取消任务时无法终止进程

  • Git拉取代码错误

  • 导出列表顺序不一致

  • 重启时无法重置待定任务状态

  • 节点下线时无法取消任务

  • 爬虫列表中无法加载节点数据

  • 导出数据乱码问题

功能优化

  • 爬虫文件导出

  • 调整任务获取时间为1秒

  • FileDriver关闭时异常捕获

  • 自动清理30天以前任务

  • 首页数据查询优化

  • 消息通知优化

  • 升级Gin版本

  • 支持MatterMost消息通知

  • 爬虫和定时任务中加入优先级

  • 前端加载性能优化

社区

如果您觉得 Crawlab 对您的日常开发或公司有帮助,欢迎在 Github 上进行 star,以及,如果遇到任何问题,请随时在 Github 上提 issue。另外,欢迎您对 Crawlab 做开发贡献。同时,您也可以加微信 tikazyq1 加入 Crawlab 技术交流群,在技术开发和部署使用上与其他开发者进行交流讨论。

参考

  • 官网: https://www.crawlab.cn

  • 文档: https://docs.crawlab.cn

  • GitHub: https://github.com/crawlab-team/crawlab

  • Demo: https://demo.crawlab.cn/


相關推薦

2023-06-18

概览 Crawlab v0.6.2 是 Crawlab v0.6.x 的最新迭代版本,带来了一系列改进,包括问题修复、功能优化以及环境变量功能的增强。 更新日志 问题修复 意外数据库连接 任务执行命令不生效 任务重启执行命令不一致 任务

2023-11-03

无法解决的,目前将继续尝试用我们传统的桌面版Googlebot爬虫抓取这些网站,并将每年对名单进行几次重新评估。 Search Console 的变化方面,Google宣布将关闭Google搜索控制台设置页面中的索引爬虫信息。Google解释说:"由于所有在

2022-10-20

Scrapy 是一套纯 Python 实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。它也可以用于广泛的目的,从数据挖掘、监控到自动测试等。 v2.7.0 更新内容如下 添加了 Py

2022-10-16

构,提升系统可维护性; 简介 XXL-CRAWLER 是一个分布式爬虫框架。一行代码开发一个分布式爬虫,拥有"多线程、异步、IP动态代理、分布式、JS渲染"等特性; 特性 1、简洁:API直观简洁,可快速上手; 2、轻量级

2023-07-27

文档批量上传、文档批量转换、全文搜索、云存储、网络爬虫、VIP会员、手机号登录注册以及支付宝和微信支付等功能,拥有简洁美观的用户视觉和功能体验。 技术栈 Golang :gin + gRPC + GORM Vue.js : nuxt2 + element-ui Database : MyS

2023-07-15

功能] 用户注册、登录、找回密码等页面增加canonical优化爬虫路径 [新功能] StrUtil增加wordSplit通用分词功能 [新功能] GridFilter中like条件新增wordSplit模式,默认中文会分为单字查询,安装WordSpliter可对中文分词 [新功能] 增

2023-12-02

闭时候不能正常结束查询线程的问题。 修复数据源结构爬虫执行语句语法错误的问题。 📚 新功能部分运行效果 创建数据源,可以配置选择 SSH 隧道 SSH 隧道配置,按照自己的需求进行创建或者删除 SSH 隧道信息 PS: 随着

2023-10-26

功能,包括广泛的法律研究材料支持。出版商屏蔽AI网络爬虫 Direcqt开发AI聊天机器人随着出版商阻止AI网络爬虫,Direqt与出版商合作,提供定制聊天机器人解决方案,以提高内容互动和流量。【AiBase提要】🤖 Direqt与出版商合作

2023-11-23

文档批量上传、文档批量转换、全文搜索、云存储、网络爬虫、VIP、手机号登录注册以及支付宝和微信支付等功能,拥有简洁美观的用户视觉和功能体验,以及配套的微信小程序。 技术栈 Golang :gin + gRPC + GORM Vue.js : nuxt2 +

2023-03-21

able特性可部分页面禁止头部滚动 [系统优化] 搜索引擎爬虫引导,增加部分链接ref=nofollow属性 [系统优化] 富文本编辑器UEditor样式缓存问题 [系统优化] 表单处理JS部分代码逻辑重构 [系统优化] modstart_config 函数根据默

2023-08-03

任意js为本地文件 headless模式,极大节省资源,适用于爬虫

2022-10-23

phane Coillet-Matillon 称他们构建了 Sotoki (Stack Overflow to Kiwix) 爬虫,可以获取 Stack Exchange 网站中的每一个站点。 Stack Overflow 介绍了部分对离线版 Stack Overflow 有重度需求的场景,比如监狱里面的编程教育计划、位于极端环境的科考

2024-02-24

ansion未重写而出错的 bug #105365 [Connectors API] 修复爬虫配置解析和sync_nowflag 的错误#105024 Authentication 在重新加载 JWT 共享密钥之前验证设置#105070 Downsampling 更好地处理未分配源索引的 Downsampling 问题,并修复

2022-05-17

络取证分析工具(NFAT) Evil-WinRM - WinRM shell Hakrawler - 网络爬虫工具 Httpx - 多用途的 HTTP 工具箱 LAPSDumper - 转储 LAPS 密码 PEDump - 转储 Win32 可执行文件 Sparrow-wifi - Linux 下的图形化 Wi-Fi 分析器 …… Kali ARM 更新 Raspberry Pi: