🎁Xinference v0.16.0 正式发布!注册即送 500 积分,畅享云上推理新体验🎉


Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。
 
Xinference 的功能和亮点有:

  • * 🌟 模型推理,轻而易举:大语言模型,语音识别模型,多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
  • * ⚡️ 前沿模型,应有尽有:框架内置众多中英文的前沿大语言模型,包括 baichuan,chatglm2 等,一键即可体验!内置模型列表还在快速更新中!
  • * 🖥 异构硬件,快如闪电:通过 ggml,同时使用你的 GPU 与 CPU 进行推理,降低延迟,提高吞吐!
  • * ⚙️ 接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。
  • * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,让不同大小的模型按需调度到不同机器,充分使用集群资源。
  • * 🔌 开放生态,无缝对接:与流行的三方库无缝对接,包括 LangChain, LlamaIndex, Dify,以及 Chatbox。

🎉 Xinference v0.16.0 发布,本次发布会同时带来企业版和云上版本更新。

社区版

📋 更新指南

* 🏷️ pip:pip install 'xinference==0.16.0’
* 🐳 Docker:拉取最新版本即可,也可以直接在镜像内用 pip 更新

🆕 更新日志

* 新功能
    * 🏎️ transformers 引擎的 continuous batching 成为默认推理行为,原来的推理逻辑已被废弃。参考文档 📖: Continuous Batching
    * 🖼️ FLUX.1 的文生图接口支持动态 batch,提升吞吐。详情请参考文档 📖
    * 👁️ 部分 vllm 引擎的 vision 模型支持 awq / gptq 量化
    * ⚙️ qwen2.5-instruct 支持 MLX 引擎
    * 🕒 xinference 命令行响应时间缩短
* 🐞 BUG修复
    * 修复 glm4-chat 模型 padding 相关问题
* ⏳ 即将废弃
    * v0.17.0 将支持 Python 3.12,移除对 Python 3.8 的支持

企业版

📦 已更新至 v0.0.6 版本,企业版包含社区全部功能,并提供高可用、可观测性、国产卡支持。详细请联系 📞 @李鹏

🆕 主要更新内容

1. 🎥 支持 minicpm base64 格式视频解析
2. 🚀 默认开启 SGLANG 引擎
3. 🔧 暴露删除运行实例的接口,便于处理数据不一致
4. 🛠️ 修复运行实例列表的一致性问题
5. 在社区版 v0.16.0 正式发布前,其功能已提前更新并可供使用

云上版本

访问 🔗 inference.top。注册即送 🎁 500 积分!

* 💳 微信支付功能上线,充值后享受更少的并发限制
* 💬 文本对话滚动优化
* 🖼️ 图像模型添加进度条显示


我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持,也欢迎更多使用者和开发者参与体验和使用 Xinference。
 
欢迎您在 https://github.com/xorbitsai/inference 给我们一个 星标,这样你就可以在 GitHub 上及时收到每个新版本的通知。


相關推薦

2024-10-04

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-09-25

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-10-16

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-08-07

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-08-15

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-07-10

🎉 Xinference v0.13.0 正式发布!Apple M系列专用后端 MLX 来临,Mac 上加速高达 40% 🚀。目前已支持 qwen2 和 gemma-2。阿里云镜像也如约而至,且容量大幅缩减,解决大家在国内拉取 docker 的痛点。详细更新内容如下: - 新增内置支持

2024-06-23

Xinference v0.12.2 正式发布! 🎉v0.12.2 得益于社区的贡献,稳定性得到了极大提高 🙏 新功能 🚀   Qwen moe系列支持tool call 🔧   rerank模型支持输出usage,兼容Cohere API 📊 BUG修复 🐛   修复自定义rerank模型的问题

2022-09-08

训练、端侧部署推理。 五 Roadmap 后续我们计划每个月发布Release版本。近期的Roadmap如下: Transformer 分类任务训练性能优化 & benchmark 自监督学习增加检测&分割benchmark 开发更多基于Transformer的下游任务,检测 & 分

2023-04-01

Swift 5.8 已经正式发布了! 这个版本包括改进开发者体验,改进 Swift 生态中的工具,包括 Swift-DocC、Swift Package Manager 和 SwiftSyntax,完善Windows 支持 等等。 开发者体验 改进的 Result Builder 实现 在 Swift 5.8 中对 Result Builder 的实现进

2024-08-02

即下即用】 GodoOS 实现了真正的零配置安装,无需繁琐的注册过程。下载后即可直接使用,省去了繁琐的设置步骤。更重要的是,它纯净无插件依赖,确保您的办公环境干净、安全,远离恶意软件的侵扰。 【轻巧便携,功能强

2023-11-18

24日,2023 拓数派年度技术论坛在上海圆满落幕。拓数派正式发布大模型数据计算系统「πDataCS」,基于云原生技术重构数据存储和计算,重塑数仓、向量和机器学习等数据计算引擎,实现“一份数据存储,多引擎数据计算”。作

2024-09-26

事、ICT基础设施业务管理委员会主任汪涛发表主题演讲时正式宣布,为加快AI在企业的创新和落地,华为全面开放openMind应用使能套件,助力企业快速构建自己的AI社区,繁荣产业生态。 “openMind应用使能套件,加速AI社区生态汇

2022-06-02

经过 58 个国家共 500 多位贡献者的努力,WordPress 6.0 近日正式发布。此次更新将数百个增强和修复交付到一个稳定的版本中,证明了 WordPress 社区的力量和能力。 WordPress 6.0 主要更新内容如下: 增强的写作体验 WordPress 6.0 大幅

2022-10-23

当 当 当 当~ openKylin成长体系正式上线啦!!!   不仅有各种花式玩法让你轻松获取积分, 解锁不同社区等级和权益~ 同时,还有超多社区精美礼品等你来兑换~ 话不多说 快和小K一起“研究”下这份openKylin成长攻略吧!