Ollama 推出付费服务“Turbo”

2025-08-07 發表於开源资讯

Ollama 推出了名为“Turbo”的付费服务，旨在解决本地运行超大模型的性能瓶颈，让用户在数据中心级的硬件上运行大型开源模型，服务月费为 20 美元。

Ollama “Turbo”适用场景：

本地显卡显存不足，无法加载 120B 级别模型
需要快速原型验证、批量推理或高并发调用
希望保持本地环境简洁，同时获得接近数据中心的性能

据介绍，Ollama “Turbo”服务主要解决新模型体积过大、在普通 GPU 上难以运行或运行缓慢的问题。通过将模型运行负载转移到云端，用户可以释放本地计算机（Mac, Windows, Linux）的性能。在预览阶段，Turbo 支持 gpt-oss-20b 和 gpt-oss-120b 模型。

该服务与 Ollama 的 CLI、API 以及 JavaScript/Python 库完全兼容。Ollama 承诺不会记录或保留通过 Turbo 模式进行的任何查询，所有硬件均位于美国。

相關推薦

Runway 发布 AI 视频生成模型 Gen-4 Turbo

2025-04-09

Runway 宣布推出最新 AI 视频生成模型 Gen-4 Turbo，称其是 Runway 迄今为止最强大的视频生成模型，也是生成视频的最快方式。使用 Gen-4 Turbo，用户只需 30 秒即可生成 10 秒的视频，非常适合快速迭代和创意探索。现在已在所有计

Ollama 已支持 RWKV-7 模型，可灵活开关思考模式

2025-06-21

Ollama 最新版本已支持 RWKV7-G1 和 RWKV-7-World 系列模型。 3 月初，随着 RWKV 社区成员 @MollySophia 的 PR 被合并，llama.cpp 正式支持 RWKV-7 模型。Ollama 近期更新了最新版 llama.cpp，因此同步支持 RWKV-7 架构和对应模型。 Ollama 官方模型仓库

基于 Java 的 LLM 应用开发及编排框架，Agents-Flex beta.8 发布

2024-07-16

为 ChainNode 添加 "async" 属性标识的设置新增：添加基于 Ollama 大语言模型的对接，非 openai 适配模式新增：新增 DnjsonClient 用于和 Ollama 的 stream 模型对接优化：重构 ChainCondition 优化：chat 时当大语言模型发生错误时抛出异

OpenAI 发布重磅更新：增加函数调用能力、支持处理更长上下文、降低价格

2023-06-15

penAI 也开发了一个 32000 个 token 的 GPT-4 版本，但尚未公开推出。 OpenAI 刚刚发布的gpt-3.5-turbo-16k模型支持 16000 tokens 的上下文长度，这意味着可以一次处理大约 20 页的文本，这对于需要模型处理和生成较大文本块的开发者来说是

支持对接 OpenAI、Ollama 和本地向量模型，MaxKB 开源知识库问答系统发布 v1.4.0 版本

2024-08-02

v1.4.0版本。在这一版本中，MaxKB的社区版支持对接OpenAI、Ollama和本地的向量模型，并且支持设置模型的使用权限，同时MaxKB还支持知识库自定义向量模型。自v1.4.0版本开始，MaxKB正式推出专业版。MaxKB专业版在社区版基础上提供X-

案例研究丨MaxKB+Ollama：深圳市公共信用中心探索信用服务创新

2024-08-29

引入了MaxKB作为自身知识库问答系统的核心系统，并结合Ollama搭建的本地私有大模型，构建了AI工具——即“信用AI助手”，并创新性地将“信用AI助手”嵌入到深圳信用网的页面中，为用户提供更加智能、便捷的信用信息查询服

Docker 与 Neo4j 等合作推出 GenAI Stack

2023-10-08

DockerCon 开发者大会主题演讲中宣布与 Neo4j、LangChain 和 Ollama 合作推出新的 GenAI Stack。该 GenAI Stack 简化了 AI/ML 集成，旨在帮助开发人员快速轻松地构建生成式 AI 应用程序，而无需搜索和配置各种技术。根据介绍，GenAI Stack 中

讯飞星火 V4.0 发布，全面对标 GPT-4 Turbo

2024-06-29

革。此外，科大讯飞还发布了星火企业智能体平台，并推出星火商机助手、星火评标助手等典型智能体案例，助力企业价值创造。

为作者提供更多收入，WordPress 新增付费订阅功能

2023-06-04

不过当时的 Newsletter 功能还比较简单。现在 WordPress 再推出一个重大的更新，无论作者是 WordPress 的付费用户还是免费用户，现在都能够为自己的内容添加付费订阅和高级内容。从而让作者通过 Newsletter 业务产生收入。这个

微语 0.7.6 发布，开源 RAG 客服系统

2025-05-08

单管理工单SLA管理工单统计和报表 ... AI Agent Ollama/DeepSeek/ZhipuAI/... 智能体工作流 ... 客户之声意见反馈服务投诉问卷调查 ... 项目看板待办todo卡片日报/周报统计 ... 工作流自定义表

微语 0.8.0 发布，基于 RAG 智能客服

2025-05-25

单管理工单SLA管理工单统计和报表 ... AI Agent Ollama/DeepSeek/ZhipuAI/... 智能体工作流 ... 工作流自定义表单自定义流程工单流程可视化 ... 客户之声意见反馈服务投诉问卷调查 ... 呼叫中心

微语 0.8.4 发布，开源智能客服

2025-06-20

单管理工单SLA管理工单统计和报表 ... AI Agent Ollama/DeepSeek/ZhipuAI/... 智能体工作流 ... 工作流自定义表单自定义流程工单流程可视化 ... 客户之声意见反馈服务投诉问卷调查 ... 呼叫中心

微语 0.8.3 发布，开源智能客服系统

2025-06-13

单管理工单SLA管理工单统计和报表 ... AI Agent Ollama/DeepSeek/ZhipuAI/... 智能体工作流 ... 工作流自定义表单自定义流程工单流程可视化 ... 客户之声意见反馈服务投诉问卷调查 ... 呼叫中心

微语 0.8.5 发布，开源智能客服

2025-06-27

单管理工单SLA管理工单统计和报表 ... AI Agent Ollama/DeepSeek/ZhipuAI/... 智能体工作流 ... 工作流自定义表单自定义流程工单流程可视化 ... 客户之声意见反馈服务投诉问卷调查 ... 呼叫中心

熱門推薦

Kimi K2 和 Qwen-3 Coder 针对编程任务的详细对比 07-25
微语 0.8.9 发布，开源智能客服 07-26
Qwen3-Coder 和 Kimi-K2 均已上线模力方舟 07-26
开源 AI 客户端 Cherry Studio v1.5.3 发布 07-26
阶跃星辰发布最强开源多模态推理模型 Step3 07-26
“给予”超越“莲花”，支持图片在线编辑 07-27
Ruby 3.2.9 发布 07-25
阿里巴巴 1688 发布“AI 版”App 与“88 查” 07-31