Docker 将原生支持运行 LLM

2025-03-27 發表於开源资讯

根据Docker官网消息，其即将推出Docker Model Runner工具，旨在通过容器化技术简化LLM本地运行流程。

其主要功能包括：

模型获取：支持从Docker Hub直接获取AI模型，简化配置流程。
操作便捷：通过Docker命令行工具使用，符合开发者日常操作习惯。
接口兼容：适配OpenAI标准接口，方便现有项目集成。
运行效率：支持苹果芯片和NVIDIA显卡加速，提升本地计算性能。
安全隔离：沿用Docker容器技术，保障运行环境的安全性。

当前开发者普遍使用ollama开源工具部署AI模型。相比而言，Docker Model Runner对已在使用容器技术的开发者具有天然适配优势。而ollama作为成熟的开源工具，拥有丰富的模型支持和活跃的社区资源。

有意思的是，ollama本身也支持在Docker环境中运行，这为用户提供了更多选择空间。

相關推薦

Docker 与 Neo4j 等合作推出 GenAI Stack

2023-10-08

Docker 在其年度 DockerCon 开发者大会主题演讲中宣布与 Neo4j、LangChain 和 Ollama 合作推出新的 GenAI Stack。该 GenAI Stack 简化了 AI/ML 集成，旨在帮助开发人员快速轻松地构建生成式 AI 应用程序，而无需搜索和配置各种技术。根据介

全球首发｜原生开源大模型托管项目 CSGHub

2024-01-16

服务和CSGHub Web Service的管理界面，普通用户可以快速使用Docker compose或Kubernetes Helm Chart启动服务，实现生产级的资产管理。具备自研能力的用户可利用CSGHub Server进行二次开发，将核心管理功能集成到外部系统或自定义高级功能。

Docker Desktop 4.42 发布，集成 MCP 工具包

2025-06-19

Docker Desktop 4.42 已发布，新增原生支持 IPv6 网络，智能 DNS 解析、集成 Docker MCP Toolkit、增强 AI 相关功能等。在网络功能方面，Docker Desktop 4.42 为满足多样化的企业网络需求，引入了原生 IPv6 网络支持，开发者可灵活选择 IPv

英伟达发布 Windows 版 TensorRT-LLM 库，为本地运行大模型提速

2023-10-19

用 AI 处理器，正在为超过 1 亿台 Windows PC 和工作站带来原生生成式 AI 的强大功能。 TensorRT-LLM 是一个开源库，用于提升上述 GPU 运行最新 AI 大模型（如 Llama 2 和 Code Llama）的推理性能。上个月英伟达发布了面向数据中心的 TensorR

Web LLM：将语言模型聊天直接带到 Web 浏览器中

2023-04-17

私。“如果我们可以简单地打开一个浏览器并直接将 AI 原生地带到你的浏览器选项卡，这不是更令人惊奇吗？生态系统中有一定程度的准备。这个项目为这个问题提供了肯定的答案。” Web LLM 中采用的关键技术是机器学习

InfoWorld 公布 2023 年最佳开源软件

2023-10-26

Clear Containers 和 Hyper.sh runV。Kata Containers 可与 Kubernetes 和 Docker 协同工作，同时支持多种硬件架构，包括 x86_64、AMD64、Arm、IBM p 系列和 IBM z 系列。获得了谷歌云、微软、AWS、阿里云、思科、戴尔、英特尔、红帽、SUSE 和 Ubuntu 等

=Document(text='world')) print(docs.texts) Flow：使用 Kubernetes 和 Docker Compose 运行 Kubernetes：使用 Flow .to_k8s_yaml('./k8s_flow') 从一个 Flow 中生成一组部署的 YAML 文件，然后使用 Kubernetes 和 kubectl 来启动和协调 Executors。Docker Compose：使用

开源机器学习框架 PyTorch 2.8 正式发布，提升量化 LLM 推理性能

2025-08-09

Intel CPU 上的量化 LLM 推理性能显著提升 PyTorch 2.8 强调在原生 PyTorch 框架下实现高性能的量化大语言模型（LLM）推理（支持 A16W8、DA8W8、A16W4 等模式）。据称其性能可达或超越 vLLM 等热门 LLM 服务框架在单 x86_64 CPU 离线模式下的

GitHub 报告：TypeScript 取代 Java 成为第三受欢迎语言

2023-11-17

言越来越多，云部署的标准化程度更高，开发人员使用 Dockerfile 和容器、IaC 以及其他云原生技术的速度也急剧加快。 2023 年 first-time 开源贡献者数量最多。其中，有商业支持的开源项目依旧最受贡献者欢迎。但生成式 AI 项目

微软近 5 万 star 的开源项目 —— MarkItDown 已支持 MCP

2025-04-22

定主机和端口上运行，支持基于 Web 和网络的集成。 Docker 支持为了增强可移植性和隔离性，MarkItDown-MCP 提供了 Docker 支持。这在以下情况特别有用：确保在不同系统上的环境一致性将转换过程与主机系统隔离与 C

微软开源“原生 1-bit”模型：超过 20 亿参数、大幅减少内存占用

2025-04-23

iv.org/pdf/2310.11453 微软表示，这是第一个参数20亿的开源原生1-bit LLM。它是以4兆字词的数据集训练而成，具备4096 token的context length。研究团队说明，在BitNet b1.58模型中，单一参数或权重是三元（ {-1, 0, 1}）的。此类新模型架构

Fedora 36 将原生支持 OCI/Docker 容器,go开发者的福音

2021-12-14

一项变更提案，以增强 RPM OSTreee 堆栈，使其原生支持 OCI/Docker 容器，并作为操作系统内容的传输和交付机制。这项功能是"CoreOS Layering"的基础，它允许从容器镜像对操作系统进行更新，并从 CoreOS 基础镜像中轻松生成分层镜像 (la

xinference 0.13.0 版本发布

2024-07-10

像也如约而至，且容量大幅缩减，解决大家在国内拉取 docker 的痛点。详细更新内容如下： - 新增内置支持模型 📦 - qwen2 gguf格式 📝 - gemma-2-it 💻 - 新功能 🚀 - transformers推理后端支持开启continuous

🔥Xinference v1.4.1 重磅发布！分布式推理全面升级，AI 模型效率大幅提升

2025-04-09

🆓 社区版更新指南 pip：pip install 'xinference==1.4.1' Docker：拉取最新版本即可，或者在镜像内使用 pip 更新。 🚀 更新日志 🔥 新增模型 LLM： 🦄 Qwen2.5-VL 32B 💰 Fin-R1（金融领域） &