What’s Changed
- feat: 支持集成仪表盘,支持将 grafana 的仪表盘集成到夜莺中
- feat: oidc 支持配置默认团队
- feat: 回调地址飞书卡片支持 at 指定人
- feat: 回调地址支持配置变量
- fix: 使用 postgres 作为数据库报错问题
v7 主要更新点
- 全站暗黑主题
- 新增指标视图,内置上百个 promql,无需手写 promql 即可方便地查看监控数据
- 新增模版中心,支持创建和修改模板,模版可以在一个地方集中维护和查看
- 优化边缘机房机器失联告警的实现逻辑,真正做到边缘机房告警自闭环
- 全局回调地址页面展示优化,增加详尽的文档提示信息
- 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
- 内置集成故障自愈能力,不需要再单独部署 ibex 模块
- 仪表盘变量支持和本业务组的机器联动,不同业务组组下的仪表盘只展示本业务组内的机器
- 机器列表和指标视图打通,可以选择多台机器直接看图,无需任何提前配置
- 告警规则,支持配置恢复时的 Promql,告警恢复通知也可以带上恢复时的值了
- 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
- 支持集成仪表盘,可以将 grafana 的仪表盘集成到夜莺中
v7 近期计划
- 告警规则:通知时支持配置过滤标签,避免告警事件中一堆不重要的标签
- 机器管理:标签拆成 user_tags 和 host_tags,host_tags 直接使用 categraf global tags 覆盖
- 机器管理:机器支持角色字段,即无头标签,用于描述混部场景
- 机器管理:把业务组的 busigroup 标签迁移到机器的属性里,让机器支持挂到多个业务组
- 告警规则:增加 Host Metrics 类别,支持按照业务组、角色、标签等筛选机器,规则 promql 支持变量,支持在机器颗粒度配置变量值
- 告警通知:重构整个通知逻辑,引入事件处理的 pipeline,支持对告警事件做自定义处理和灵活分派
升级步骤
替换二进制和 integrations 目录,重启即可。
表结构变更(所用的数据库连接账号具备建表权限的的可忽略)
夜莺会自动创建表结构,如果你的夜莺所用的数据库连接账号不具备建表权限,就需要手工建表了,建表语句见 https://github.com/ccfos/nightingale/blob/main/docker/migratesql/migrate.sql
v7 正式版何时发版?
现在虽然是 beta 版本,实际也是稳定的,可以上生产的。由于运营的诉求,正式版会放在每年 7 月底发布,每个大版本会持续支持 2 年。这也意味着,届时 v5 以前(含)版本将不再提供社区支持,建议 v5 版本的用户尽快升级到 v7 版本。升级方案可以查阅如下链接:
https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v7/install/upgrade/