🔍Xinference v0.15.3 深度解读:新功能、新特性,助力智能推理!


Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。
 
Xinference 的功能和亮点有:

  • * 🌟 模型推理,轻而易举:大语言模型,语音识别模型,多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
  • * ⚡️ 前沿模型,应有尽有:框架内置众多中英文的前沿大语言模型,包括 baichuan,chatglm2 等,一键即可体验!内置模型列表还在快速更新中!
  • * 🖥 异构硬件,快如闪电:通过 ggml,同时使用你的 GPU 与 CPU 进行推理,降低延迟,提高吞吐!
  • * ⚙️ 接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。
  • * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,让不同大小的模型按需调度到不同机器,充分使用集群资源。
  • * 🔌 开放生态,无缝对接:与流行的三方库无缝对接,包括 LangChain, LlamaIndex, Dify,以及 Chatbox。

🎉Xinference v0.15.3 发布,本次带来的更新如下:

📚 更新指南

* 📦 pip:pip install 'xinference==0.15.3’
* 🐳 Docker:拉取最新版本即可,也可以直接在镜像内用 pip 更新

📝 更新日志

* 🆕 新增内置支持模型
    * embedding模型:jina-embedding-v3
    * Rerank 模型:minicpm-reranker
* 🚀 新功能
    * sd图像模型支持deepcache集成,提升推理速度2x+
    * internvl支持多image chat
* 🐛 BUG修复
    * 优化vllm引擎自动重启机制
    * 修复vllm引擎的max_model_len的默认值问题
* 🎨 UI
    * 修复模型注册页面model format相关的问题
* 🚧 即将废弃:
    * v0.16.0 transformers引擎的continuous batching将代替现有的推理逻辑成为默认推理行为。

🎉 祝大家国庆节快乐!


我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持,也欢迎更多使用者和开发者参与体验和使用 Xinference。
 
欢迎您在 https://github.com/xorbitsai/inference 给我们一个 星标,这样你就可以在 GitHub 上及时收到每个新版本的通知。


相關推薦

2024-08-02

深度学习框架作为基础软件,不仅促进了深度学习技术的飞速进步,更为人工智能技术的广泛应用铺设了坚实的基础。 深度学习框架为开发者提供了便捷易用的开发接口,这些接口对数据和操作进行了高度抽象,使得开发者能

2024-08-24

用户数据的隐私和安全。   UOS AI 功能亮点 deepin 23深度融合AI技术,上线了一系列实用的AI应用和功能,为用户提供智能操作系统新体验。 UOS AI:更懂你的桌面助手 通过快捷键“Super+C”唤醒UOS AI桌面助手,得益于UOS AI对

2024-08-07

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-09-25

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-10-16

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-08-14

台。以搜索问答为互动起点,提供精准的企业知识搜索、深度内容提炼、专业文档撰写等服务。助力企业快速搭建安全、可靠的专属知识中台;构建持续、高效的企业知识生态系统;打造 AI 2.0 企业知识生产力新范式。 麒麟软

2024-08-15

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-08-16

体围绕开源生态合作与发展、 RISC-V、多模态具身智能、深度学习平台、企业引入开源、开源 AI 发展、垂域大模型技术等话题展开主题演讲。 2024 GOTC × GOGC 将 GOTC(全球开源技术峰会)与 GOGC(全球开源极客嘉年华)进行品牌联

2024-07-10

🎉 Xinference v0.13.0 正式发布!Apple M系列专用后端 MLX 来临,Mac 上加速高达 40% 🚀。目前已支持 qwen2 和 gemma-2。阿里云镜像也如约而至,且容量大幅缩减,解决大家在国内拉取 docker 的痛点。详细更新内容如下: - 新增内置支持

2024-09-26

商业持续闭环。 开源PHPCTO刘冬介绍了Gitee AI的主要功能特性,并发布了与昇腾的合作计划。他提到,“Gitee AI的Serverless API为AI开发者提供开箱即用的大模型推理API服务,可大幅降低AI应用开发的技术门槛和成本。该项技术是与清

2023-08-01

nbsp;ACM 中国图灵大会上,就文心大模型的核心技术进行了解读。 文心一言是百度自主研制的知识增强大语言模型,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学

2023-07-13

引了众多参会者前往会场参会。除此之外,华为云开源还深度参与了展区、CodeLabs训练营、极客挑战赛等环节,现场与开发者们进行深度交流与互动。未来,华为云开源将继续坚持开源开放,践行技术普惠,使能开发者轻松使用

2024-09-21

面迈出了重要一步。JetBrains AI Assistant与多款JetBrains产品深度集成,能够以高度的适配性完成代码生成与重构、回答和解释代码相关问题、撰写文档和提交信息等工作,助力中国本土开发者提升效率和代码质量,实现生产力的全

2022-09-30

和性能进行部署。 注意 这是标准版本,适用于偏好最新功能和出色性能的开发人员。标准版本将每年更新三至四次。此外还提供长期支持 (LTS) 版本。每年发布一个新 LTS 版本,并提供两年支持(一年错误修复和两年安全补丁