Mistral Large 2 训练耗水 28 万吨,碳排放堪比中型城市


Mistral AI近日发布了一份详尽的环境影响评估报告,首次全面披露了其旗舰模型Mistral Large2在整个生命周期中的真实环境代价。

这份报告由Mistral AI携手企业ESG咨询公司Carbone4以及法国生态转型机构ADEME共同完成,采用了严格的科学评估方法,对模型从训练到推理全过程的温室气体排放和水资源消耗进行了精确测算。

报告数据显示,Mistral Large2在训练阶段产生的二氧化碳排放量达到20.4万吨,这一数字相当于一个拥有数十万人口的中型城市一年的碳排放总量。与此同时,模型训练过程还消耗了约28.1万吨水资源,这些水主要用于数据中心的冷却系统。

从日常使用角度来看,环境成本同样不容忽视。当用户使用Mistral Large2进行一次标准的文本生成任务时,比如输出约400个Token的内容(相当于一页文本),系统会产生1.14克的二氧化碳排放,同时消耗45毫升水资源。虽然单次使用的环境影响看似微小,但考虑到AI模型的广泛应用和高频使用,累积效应将十分可观。

报告中最具价值的发现之一是模型规模与环境影响之间的直接关系。研究显示,在产生相同数量的推理输出时,不同AI模型的环境影响与其参数规模呈现明显的正比关系。这一发现为AI行业的可持续发展指明了方向:开发小型化、专业化的AI模型不仅能够降低计算成本,更重要的是能够显著减少环境负担。

从行业发展趋势来看,这种透明化的环境影响披露可能将成为AI公司的新标准。随着全球对气候变化关注度的不断提升,以及各国政府对企业碳排放监管的日益严格,AI公司主动公开环境数据不仅体现了社会责任,也有助于建立更加可持续的商业模式。


相關推薦

2025-07-16

出的 AI Research SuperCluster(RSC,约5exaflops)。 Prometheus 专为训练下一代大语言模型(如 Llama4)及通用人工智能(AGI)设计,目标是支持多模态 AI 任务,包括实时语音翻译、增强现实(AR)应用及元宇宙相关技术。 与传统超级计算机不

2024-07-26

布最强开源大模型 Llama 3.1 后,法国 AI 初创公司 Mistral AI 也加入了竞争,今天发布了全新的旗舰开源模型 Mistral Large 2。 该模型拥有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行,在代码生成、数学、推理等方面

2025-04-11

将在2030年前翻倍,这将对全球能源安全和减少二氧化碳排放目标提出新的挑战。数据中心目前占全球电力消费的约1.5%,过去五年间年均增长12%。而随着生成式人工智能的兴起,对巨量计算能力的需求日益增加。 美国、欧洲和

2025-07-17

Mistral AI 宣布推出其首个针对企业的音频模型系列 Voxtral。包含两种规模:适用于生产规模应用的 24B 版本,以及适用于本地和边缘部署的 3B 版本。两个版本均基于 Apache 2.0 许可证发布。 公告称,Voxtral 解决了开发者需要在低成

2024-08-01

要。 从国家到全球焦点:美国以外的法学硕士,例如 Mistral 的 Mistral-large 和阿里巴巴的 qwen2- 72b -instruct,是该领域的新兴参与者,并且越来越受欢迎,代表了全球创建有效语言模型的努力。 改进空间:虽然 Google 的开

2025-03-25

空压机重点设备节能内容 5. 完善单耗相关内容 6. 增加碳排放因子相关内容 7. 增加源网荷储(微电网)相关功能 8. 增加自定义报表 9. 增加组态自定义配置 10. 或者其他内容,开发者可以提issue我们来排

2023-02-04

对于非常大的工作室来说,这不是一个感兴趣的领域,但中型工作室仍然依赖大量资产和预制功能。Godot 中目前存在的资产库仅链接到开源资源(例如托管在 GitHub 或 GitLab 上),无法用于商业资产。 对于 Godot 项目,商业资产

2025-07-26

Mistral AI发布了Magistral Small 1.1(版本号 Magistral-Small-2507),这是一个拥有240亿参数的小型高效推理模型。 该模型在Mistral Small 3.1 (2503)的基础上,通过Magistral Medium的轨迹进行SFT和RL训练,增加了推理能力,并优化了格式和模型行

2025-05-15

质,搭配10-bit HDR视频录制与Galaxy Log格式,后期调色空间堪比专业摄像机。无论是记录孩子的第一次舞台表演,还是拍摄纪录片级的自然风光,Galaxy S25 Ultra都能让每个人成为自己生活的导演。 黑科技,为冒险者点亮灯塔 &

2024-09-27

合边缘和移动设备的小型纯文本模型(1B 和 3B),包括预训练和指令调整版本。 LLaMA 3.2 支持同时处理文本、图像和视频,能够理解并生成跨媒体内容。例如,用户可以在同一交互中结合文字和图像。 官方的评估结果显示,Llam

2024-08-27

摩耳)。公告称,MooER是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型,不仅支持中文和英文的语音识别,还具备中译英的语音翻译能力。 摩尔线程AI团队在该工作中开源了推理代码和5000小时数据训练的模型

2025-03-29

        (2025年3月28日,OSCHINA特稿)在"双碳"战略推动下,全球能源管理系统正经历智能化转型。作为企业级开发的首选语言,Java凭借其技术优势成为能源管理领域的核心引擎。本文深度解析Java技术栈在能源管理

2025-05-23

法国人工智能模型制造商 Mistral 在因其最新闭源模型 Medium3受到部分开源社区批评后,迅速回归开源路线。该公司近日与开源初创公司 All Hands AI(OpenDevin 的创建者)合作,推出了全新的开源语言模型 Devstral。这款拥有2400万参数

2022-09-06

临在、岑鸣、熊兮 一 导读 随着 BERT、Megatron、GPT-3 等预训练模型在NLP领域取得瞩目的成果,越来越多团队投身到超大规模训练中,这使得训练模型的规模从亿级别发展到了千亿甚至万亿的规模。然而,这类超大规模的模型运用