复旦大学与阶跃星辰合作推出最强 SVG 生成大模型:OmniSVG


复旦大学和阶跃星辰将要出一款端到端多模态 SVG 生成模型:OmniSVG,核心是支持从简单图标到复杂动漫角色的生成。

  • OmniSVG 主页:https://omnisvg.github.io/
  • 论文地址:https://arxiv.org/abs/2504.06263v1

OmniSVG 支持三种生成模式:

  • 文字生成SVG
  • 图片转SVG
  • 角色参考SVG生成

OmniSVG 基于 Qwen2.5-VL,并集成了 SVG 标记化器。该模型将文本和图像输入都标记为前缀标记,同时 SVG 标记化器将矢量图形命令编码到一个统一的空间表示,从而将结构逻辑与底层几何图形解耦,实现高效训练和生成,带来了超级震撼的 SVG 生成效果。


相關推薦

2025-03-21

阶跃星辰宣布开源图生视频模型 Step-Video-TI2V,一款基于30B参数Step-Video-T2V训练的图生视频模型,支持生成102帧、5秒、540P分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。 公

2025-03-27

码库,并于近日继续开源上线了升级后的DeepSeek-V3模型。 阶跃星辰则在一个月左右时间开源三款多模态大模型,其最新开源的是图生视频模型Step-Video-TI2V,支持生成的视频具备运动幅度可控和镜头运动可控两大核心特点,同时自

2024-07-27

一轮融资,即智谱AI与月之暗面。此外,新晋大模型公司阶跃星辰也跻身AI独角兽序列。今年6月,该公司被传正在进行一轮估值约20亿美元的新融资,阿里在投资者之列。 相关数据显示,今年上半年,招投标市场已经产生了498次

2024-08-08

虎”(智谱AI、零一万物、百川智能、MiniMax、月之暗面、阶跃星辰),正以惊人的速度,跨过200亿元的估值大关。 2024年8月5日,据彭博社报道,月之暗面刚交割一轮超过3亿美元的融资,投后估值高达33亿美元。 前不久,王小

2024-01-13

中国电信宣布将自研星辰 AI 大型模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。 用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化

2023-07-22

而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了 ChatGLM(chatglm.cn)。 此外,

2023-10-24

国立大学、牛津大学和北京人工智能研究院的研究人员,合作开发了一种名为“3D-GPT”的新型人工智能系统,该系统可以简单地根据用户提供的基于文本的描述生成 3D 模型。相较传统的 3D 建模工作流,提供了一种更高效直观的

2023-10-21

用于基座大模型的进一步研发,更好地支撑行业生态,与合作伙伴一同高速发展。 智谱 AI 成立于 2019 年,是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超

2023-09-22

而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了 ChatGLM(chatglm.cn)。 此外,

2025-04-08

列此前各模型所具有的全部功能。 同一天,OpenAI也正式推出了基于GPT-4o模型的原生图像生成功能,能够直接从文本提示生成图像,同时支持多轮迭代优化图像时保持角色形象一致。 作为AI领域的新兴竞争者,DeepSeek3月也推出了

2024-04-18

近日中国电信开源了12B参数规模星辰语义大模型TeleChat-12B。相较于1月开源的7B版本,内容、性能和应用等方面整体效果提升了30%。其中,多轮推理、安全问题等领域提升超40%。另外,据了解,中国电信将于年内开源千亿级参数大

2023-09-13

多元共进|2023 Google 开发者大会精彩演讲回顾 新加坡国立大学下一代搜索技术联合研究中心(NExT++)近日公布新计划——开发一款可以突破输入端多模态理解限制的大模型 NExT-GPT。 项目主页:https://next-gpt.github.io/ 论文地址

2024-05-27

了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是目前国内支持最多方言的语音识别大模型。 据悉,中国电信人工智能

2023-03-02

发布的FlagOpen大模型技术开源体系,是智源及上下游生态合作机构联合开展技术攻关的成果展现,为大模型技术创新提供了“北京贡献”。同时,他对于大模型的发展提出了三点期望:一是要抓住大模型发展机会,保持定力,强