百川智能宣布正式开源医疗增强大模型Baichuan-M2。
针对医疗领域用户隐私考虑下的模型私有化部署需求,项目团队对Baichuan-M2进行了极致轻量化,量化后的模型精度接近无损,可以在RTX4090上单卡部署,相比DeepSeek-R1 H20双节点部署的方式,成本降低了57倍。
面向急诊、门诊等对于交互速度要求更高的场景,基于Eagle-3架构优化的Baichuan-M2-Spec版本在单用户场景下实现了74.9%的token速度跃升。
此外,M2模型在数学、指令遵循、写作等通用核心性能上不降反升,因此这个模型也可应用于医疗以外的其他领域。
测评结果表明,Baichuan-M2在HealthBench上得到60.1的高分,以32B的较小尺寸不仅反超OpenAI 最新开源模型gpt-oss120b(得分57.6),更是力压Qwen3-235B、Deepseek R1、Kimi K2等当前世界所有开源大模型。
在 HealthBench Hard 评测中,Baichuan-M2以34.7分成为全球第二款超过32分的模型,力压世界所有其他顶尖闭源大模型。
公告称,尽管真实医疗场景中还存在大量HealthBench Hard评测尚未包含的因素,但至少已经证明在多数医疗场景上的问答质量,GPT-5和Baichuan-M2已经超越资深医生,特别是在知识更新速度和全面性上,完全可以给人类医生强大支持。