beta13 重点变更
日志查询功能原本只支持 Lucene 模式,现在支持两种模式,Lucene 和 KQL,提升易用性。
Prometheus 类型的数据源,包括 Prometheus、VictoriaMetrics、Thanos、M3DB 等等,支持历史记录保存功能,可以很方便的找到曾经发起的查询语句。
记录规则支持 cron 表达式模式,可以指定每天定时执行,方便计算 SLO 指标
beta13 所有变更
- feat: 日志查询支持 KQL 模式,支持高亮显示匹配结果
- feat: Prometheus 即时查询新增 历史记录 功能
- feat: 记录规则支持 cron 表达式模式,可以指定每天定时执行,方便计算 SLO 指标
- feat: 仪表盘表格图新增 “单元格换行” 和 “表格布局” 设置项
- refactor: 即时查询和仪表盘图表的小数点后保留位数从默认 3 改成 6
- refactor: 告警规则添加 “级别” 列,默认不展示
- refactor: 用户密码相关的更新操作,支持加密处理
v7 主要更新点
- 全站暗黑主题
- 新增指标视图,内置上百个 promql,无需手写 promql 即可方便地查看监控数据
- 新增模版中心,支持创建和修改模板,模版可以在一个地方集中维护和查看
- 优化边缘机房机器失联告警的实现逻辑,真正做到边缘机房告警自闭环
- 全局回调地址页面展示优化,增加详尽的文档提示信息
- 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
- 内置集成故障自愈能力,不需要再单独部署 ibex 模块
- 仪表盘变量支持和本业务组的机器联动,不同业务组组下的仪表盘只展示本业务组内的机器
- 机器列表和指标视图打通,可以选择多台机器直接看图,无需任何提前配置
- 告警规则,支持配置恢复时的 Promql,告警恢复通知也可以带上恢复时的值了
- 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
- 支持集成仪表盘,可以将 grafana 的仪表盘集成到夜莺中
v7 近期计划
- 告警规则:通知时支持配置过滤标签,避免告警事件中一堆不重要的标签
- 机器管理:标签拆成 user_tags 和 host_tags,host_tags 直接使用 categraf global tags 覆盖
- 机器管理:机器支持角色字段,即无头标签,用于描述混部场景
- 机器管理:把业务组的 busigroup 标签迁移到机器的属性里,让机器支持挂到多个业务组
- 告警规则:增加 Host Metrics 类别,支持按照业务组、角色、标签等筛选机器,规则 promql 支持变量,支持在机器颗粒度配置变量值
- 告警通知:重构整个通知逻辑,引入事件处理的 pipeline,支持对告警事件做自定义处理和灵活分派
项目介绍
夜莺监控是一款开源云原生观测分析工具,采用 All-in-One 的设计理念,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析和告警能力。夜莺于 2020 年 3 月 20 日,在 github 上发布 v1 版本,已累计迭代 100 多个版本。
夜莺最初由滴滴开发和开源,并于 2022 年 5 月 11 日,捐赠予中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的第一个开源项目。夜莺的核心研发团队,也是 Open-Falcon 项目原核心研发人员,从 2014 年(Open-Falcon 是 2014 年开源)算起来,也有 10 年了,只为把监控这个事情做好。
项目截图
项目代码
- 后端:💡 https://github.com/ccfos/nightingale
- 前端:💡 https://github.com/n9e/fe
夜莺项目已收获 9000 多 github stars,1000 多 forks,100 多 contributors 参与其中,欢迎大家在 GitHub 上关注夜莺项目,及时获取项目更新动态,有任何问题,也欢迎提交 issues,以及提交 pull requests,开源社区需要大家一起参与才能有蓬勃的生命力。