🎉夜莺监控 V8 正式版,来了!


今天在北京举办了 第三届CCF·夜莺开源创新论坛 的线下大会,正式发布夜莺 V8 版本,一直在等待正式版再上生产的小伙伴们,可以升级啦!

先给大家贴几张照片,感受一下大会的盛况,再给大家介绍一下 V8 版本的主要更新 😎

首先由尊敬的 中国计算机学会开源发展委员会主任王怀民,为大会做了致辞。夜莺项目作为中国计算机学会开源发展委员会成立之后接收的第一个捐赠项目,王主任非常重视。

内核观测、SRE、AI、故障定位、观测数据的存储,讲师有深度,观众提问也能切重点 :)

今年没有到场的朋友,明年记得来呀 :) OK,下面为大家介绍一下 V8 的主要更新。

感谢各位开源社区小伙伴为项目输入的各种产品建议和 PR。V8 这个版本,产品完成度已经很高,明年的 V9 我都不知道该搞什么大的迭代了,哈哈哈。

更多数据源的告警支持

夜莺的核心定位就是做一款告警引擎,对接不同的数据源产生告警事件,并对事件做后续处理。那告警这块自然要支持更多数据源。

开源版支持了常见的一些数据源。注意,由于产品定位的考虑,后面支持的数据源都不支持看图,只支持告警,侧重把告警能力打透。

引入事件 Pipeline

告警事件产生之后,会有一些额外的处理需求:

  • 与内部系统联动,查询一些信息附加到告警事件上,为事件增加更多上下文信息,方便 On-call 人员根据告警信息快速定位问题
  • 与内部系统联动,对事件做判断,如果是符合某些条件,就 Drop 掉
  • 与 AI 整合,把事件丢给 AI 让 AI 帮忙分析、总结
  • 对事件做 Relabel,类似 Prometheus 对指标做 Relabel 的逻辑
  • Callback 给第三方系统,把告警事件扔过去,第三方系统做一些自动化的逻辑

这个功能很有想象空间,因为很方便和内部系统打通,更多落地场景欢迎大家分享哈。下面两篇文章是之前网友的投稿,可以参考:

  • 夜莺 + AI 重塑 MySQL MDL 锁监控实践
  • 开源夜莺监控实现发版时告警静默

抽象出通知规则

重新设计了整个通知链路,抽象了通知规则、通知媒介、消息模板等。内置支持了 20 种通知媒介,也很方便对接外部通知脚本、HTTP 地址。

优化机器告警

  • 机器支持挂载多个业务组,解决生产环境里机器混部的场景,机器分类不止有标签机制,更有分组机制,降低了类别信息硬要使用标签导致的非稳态概率
  • 告警规则支持变量,配合机器的业务组挂载关系,可以灵活定义不同业务组的机器不同的阈值,且支持底层节点的阈值高优覆盖上层通用阈值的情况

场景举例: 我们团队所有机器都使用一个通用的 CPU 使用率告警阈值,但是部分机器比较特殊,需要使用不同的阈值,这部分机器里有个别机器更特殊,还要使用更特殊的阈值。老运维应该懂得这类痛苦。🤣

新版告警全景看板

夜莺侧重在产生告警事件,那告警事件的展示,自然也很关键。我们优化了活跃告警事件的全景看板,更好的 UI、更方便的聚类和筛选,易用性大幅提升。

怎么都是告警相关的?仪表盘、可视化相关的没有增强么?也有一些,不过夜莺侧重点是告警,所以重点做的是告警能力。

如上就是 V8 版本的重点改进啦,更多信息可以参考:

  • 代码:https://github.com/ccfos/nightingale
  • 文档:https://n9e.github.io/zh/

相關推薦

2025-03-22

然是 beta 版本,实际是稳定的,只是为了配合市场活动,正式版放在 7 月份才发版。 beta9 这个版本有两个变更: 优化转发逻辑。原本是按照机器分队列,导致内存里有很多队列,对后端TSDB压力较大,改成了固定队列,减少

2025-06-25

8.beta14 版本,这个版本是可以上生产的,强烈建议升级。正式版会在每年夜莺大会上发布,今年预计是 7.4 号。 下面快速介绍一下 v8.beta14 的主要更新。 beta14 重点更新 支持 Postgres 告警 又支持了一个新的告警数据源:Postgres

2023-03-22

不止于监控,夜莺 V6 来了!今天我们郑重发布夜莺 6.0 beta 版本,全面支持 Metrics、Logging、Tracing,向着构建开源、开放、完整的可观测性解决方案迈进。您可以借助夜莺 V6,接入和管理 Prometheus、ElasticSearch、Jaeger 多种数据源,

2023-08-22

简介 夜莺项目发布v6.0.3版本,增强了一些功能,修复了一些bug,访问夜莺下载中心下载体验。 升级内容 1. 优化告警订阅逻辑 去掉了告警类别字段,因为从订阅角度,告警事件不太需要区分 Metric 和 Host 类别做不同的订阅规

2023-08-08

建。 夜莺V6版本开发了好几个月了,于2023.7月底发布了正式版,今天是8.7号,实际最新版本已经是v6.0.1了,V6相比之前的版本有重大的改进。本文给大家做一些重点介绍。 1. 项目目标 V6版本开始,项目目标不止于监控平台的

2023-04-29

What’s Changed feat: 饼图支持配置是否显示指标值和设置单位、小数位数 @masterjyq feat: 监控大盘变量新增别名设置 feat: 支持机器自动分组,在 categraf config.toml 的 heartbeat url 后面加上 ?gid=x 就可以根据业务组 ID 自动分

2025-06-04

,下下周也计划做一次直播讲解。 支持 ClickHouse 告警 夜莺最重要的定位是告警引擎,所以会持续增加各类数据源的告警支持,ClickHouse 之后还有 Doris、MySQL、Postgres 等。 开源版主要是支持告警,不会支持看图可视化,实在是

2024-07-23

v7.beta14 基本就是 v7 正式版了,不过按照发版惯例和运营需求,一般每年 7 月底发正式版,所以,想要尝试 v7 的朋友可以升级了,另外,v5 版本也将于 2024.7.26 结束社区支持(商业客户会继续支持),建议 v5 版本的用户尽快升级

2024-10-23

ontributors @nl594 made their first contribution in #2204 夜莺项目简介 夜莺监控是一款开源云原生观测分析工具,采用 All-in-One 的设计理念,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开

2024-07-06

企微等 支持集成仪表盘,可以将 grafana 的仪表盘集成到夜莺中 v7 近期计划  告警规则:通知时支持配置过滤标签,避免告警事件中一堆不重要的标签  机器管理:标签拆成 user_tags 和 host_tags,host_tags 直接使用 cate

2022-02-16

夜莺5.0发版之后,前面两周社区反馈了一些问题,做了集中修复系统很快稳定了,感谢社区小伙伴们的支持。近期又增加了一些新的优化项,这里给大家罗列一下,有兴趣的小伙伴可以升级尝试。 注意:如果是从低版本升级

2023-04-16

ub 静态文件路由 fix: 数据源更新时,状态被重置问题 夜莺简介 夜莺重点解决的是告警管理,一套规则自动生效到多个集群,灵活的告警规则、屏蔽规则、订阅规则、权限控制,可以和 Prometheus、VictoriaMetrics 等无缝集成

2023-04-09

le `chart_share` add datasource_id bigint unsigned not null default 0; 夜莺简介 夜莺重点解决的是告警管理,一套规则自动生效到多个集群,灵活的告警规则、屏蔽规则、订阅规则、权限控制,可以和 Prometheus、VictoriaMetrics 等无缝集成

2024-06-25

//github.com/ccfos/nightingale/blob/main/docker/migratesql/migrate.sql v7 正式版何时发版? 现在虽然是 beta 版本,实际也是稳定的,可以上生产的。由于运营的诉求,正式版会放在每年 7 月底发布,每个大版本会持续支持 2 年。这也意味着,