Stability AI 发布最新语言模型:Stable LM 3B


Stability AI 昨日发布最新语言模型:Stable LM 3B,可在笔记本和手机等智能设备上运行。

公告写道,Stable LM 3B 包含 30 亿个参数,相比于行业通常使用的 70 亿参数,它更小、更高效。主要功能如下: 

  • 文本生成:可以用于生成文本
  • 自回归:基于变换器解码器架构
  • 多样性的训练数据:使用了多个开源大规模数据集

Stable LM 3B 主要特点:

  1. 高性能:尽管只有 30 亿个参数,但性能与更大的模型相当,甚至有时超过它们。
  2. 低功耗:设计为在便携式设备上高效运行,因此电力需求较低。
  3. 多平台兼容:可以在边缘设备、家用电脑以及其他便携式数字设备上运行。
  4. 可微调:模型可以根据特定需求进行微调,如编程辅助或其他专用应用。
  5. 开源:该模型已在 Hugging Face 平台上开源 (https://huggingface.co/stabilityai/stablelm-3b-4e1t),方便开发者使用和改进。
  6. 训练细节:该模型在 Stability AI 的集群上进行了训练,使用了 256 个 NVIDIA A100 40GB GPU(AWS P4d 实例)。

详情:https://stability.ai/blog/


相關推薦

2023-07-15

图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 宣布推出 Stable Doodle,一项可将草图一键生成图片的新服务。主要是通过利用最新的 Stable Diffusion 模型分析草图轮廓,然后生成“视觉上令人愉悦”的艺术再现。 Stability

2022-10-19

是什么,那毫无疑问要属 Stable Diffusion,它是由初创公司 StabilityAI 于今年发布的深度学习文字转图像模型,它主要用于根据文字的描述产生详细图像。Stable Diffusion 的诞生除了让 AI 绘画这个领域突然火爆,还催生出了售卖 AI 关

2023-11-23

Stability AI 发布了开源视频生成模型 Stable Video Diffusion,该模型基于该公司现有的 Stable Diffusion 文本转图像模型,能够通过对现有图像进行动画化生成视频。 主要特性 文本到视频 图像到视频 14 或 25 帧,576 x 1024分辨率 多

2022-11-26

器(OpenCLIP)训练的文本转图像模型,该模型由 LAION 在 Stability AI 的支持下开发,与早期的 V1 版本相比,大大改善了生成图像的质量。该版本中的文本转图像模型可以生成默认分辨率为 512x512 像素和 768x768 像素的图像。 这些模

2023-11-11

彭博社援引消息人士的话报道称,AI 初创公司 Stability AI 已获得了由英特尔领投的新一轮融资。该公司在这笔交易中以可转换票据的形式筹集了近 5000 万美元,交易于 10 月份完成。 Stability AI 是 Stable Diffusion 背后的公司,Stable Di

2023-01-18

日前,三位艺术家对 Stability AI(Stable Diffusion 背后的开发商)提起了诉讼,指控 Stability AI 直接、间接侵犯版权、违反 DMCA 和不正当竞争等。 这三位艺术家(Sarah Andersen、Kelly McKernan、Karla Ortiz)认为 Stability AI 在「未经原艺术

2022-12-22

今年 8 月,Stability AI 开源了一个叫 Stable Diffusion 的 AI 模型,它可以根据用户给定的文本生成对应的图像。Stable Diffusion 的原理是通过 “学习”从互联网上抓取的大量图像数据集,以获得生成图像的能力。 这个 AI 在艺术圈引

2023-06-25

Stability AI 近日发布了 Stable Diffusion XL 0.9,这是 Stable Diffusion 文本-图像模型套件中最先进的开发成果。继 4 月发布 Stable Diffusion XL Beta 之后,Stable Diffusion XL 0.9 在图像和构图细节方面比前者有了巨大的改进。 示例 在 SDXL Beta 版

2023-08-10

Stability AI 刚刚宣布了他们首个用于编程的生成式 LLM AI 产品——StableCode。该产品旨在帮助程序员完成日常工作,并为新手开发者提供实用的学习工具。 官方介绍道,StableCode 提供了一种独特的方式,通过使用三种不同的模型

2023-06-10

LLaMA 论文的 RedPajama 基础数据集(5 TB 大小),自 4 月份发布至今已被下载数千次,并被用来训练了 100 多个模型;以及一个在 5 月份就宣布训练完成的 RedPajama 3B,和刚宣布训练完成的 RedPajama 7B 大模型。 RedPajama-INCITE-7B-Base

2023-09-27

AIdea 终于在 Apple Store 恢复上架了。 大约在 4 周前,我发布了 花了小半年开发了一个 AI 套壳 APP,然而大势已过,直接开源了 这篇文章,将开发了近半年的 APP 完全开源了,感谢大家的支持,在不到一个月的时间内,Github 上

2023-02-10

Open-Assistant,这是一个 AI 聊天机器人项目,能够理解自然语言问题,可以与第三方系统交互并动态检索相关信息。该项目代码是用 Python 编写的,并在 Apache 2.0 许可下发布。 官方在项目愿景中写道: 我们不会止步于复制 ChatG

2023-01-03

I 绘画/图片生成这个领域,Stable Diffusion 背后的创业公司 StabilityAI 在今年 10 月就借着这股风潮获得了 1 亿美元的融资,估值甚至达到了 10 亿美元。而且随着人工智能驱动的内容生成需求越来越高的情况,Stability AI 未来的估值有

2023-08-19

在生物医药专业领域问答能力比肩人类专家水平,在自然语言、分子、蛋白质跨模态问答任务上达到 SOTA,已成功通过了美国医师资格考试。 开源地址: https://github.com/PharMolix/OpenBioMed https://huggingface.co/PharMolix/BioMedGPT-LM-7B