中国电信发布首个支持 30 种方言混说语音大模型


中国电信人工智能研究院(TeleAI)于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是目前国内支持最多方言的语音识别大模型。

据悉,中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库,研发团队采用的“蒸馏+膨胀”联合训练算法可解决超大规模多场景数据集和大规模参数条件下预训练坍缩的问题,实现1B参数80层模型稳定训练。

中国电信方面表示,星辰语音大模型是业内首个开源的、基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率大幅降低。

据中国电信方面透露,星辰语音大模型现已对外开源及应用落地,在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服试点应用。通过接入星辰大模型,智能客服能够迅速理解30种方言,日均处理电话量达到约200万通,极大地提高了服务效率和用户体验。


相關推薦

2024-01-13

中国电信宣布将自研星辰 AI 大型模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。 用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化

2025-04-01

百度宣布发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约50%-90%。 文小言宣布率先接入该模型,同时带来

2024-06-29

科大讯飞在北京发布基于全国首个国产万卡算力集群“飞星一号”的讯飞星火大模型 V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。 据介绍,讯飞星火V4.0在8个国际主流测试集中排名第一,并在文本生成、语言理解

2023-09-22

预训练模型技术和应用评估方法第1部分:金融大模型》发布成为国内首个金融行业大模型标准,为金融行业智能化的高质量发展提供了重要支撑,为全面促进大模型安全合规和可信发展提供了重要保障。 具体来看,该标准涵盖

2023-07-08

的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提

2023-10-11

国信通院的战略合作单位、标准核心参编单位,共同编订发布全球首个AI模型开发管理标准、全国首个商用人工智能开发平台等多项人工智能基础软件领域、大模型领域的标准。作为大模型生态共同体中的通用大模型代表企业,

2024-08-27

在日前举行的第四届RISC-V中国峰会上,中国电信研究院、天翼云科技公司联合中国科学院软件所、达摩院等合作伙伴发布业界首个RISCV云计算试验平台“北海”,RVEI战略指导委员会主任、中国工程院院士倪光南共同参与发布。

2023-06-29

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的

2024-08-17

与开源PHP宣布正式开启战略合作 openKylin 园区运营战略发布暨全球首个园区站——浦软站成立 国际开源技术人才培养基地挂牌仪式暨国内首个 OSPO 课程联合发布 LFOSSA 国际人才培养认证中心暨 RISC-V 国际人才师资培养基地

2025-03-27

创新再次在AI音乐领域领跑全球。” 2024年4月,昆仑万维发布了第一代音乐生成模型:Mureka V1(SkyMusic)。Mureka V6是当前Mureka的基座模型,支持纯音乐生成,还支持10种语言的AI音乐创作,包括英语、中文、日语、韩语、法语、西

2023-06-29

6月28日,上海世界移动通信大会期间,中国联通发布图文大模型“鸿湖图文大模型1.0”,并表示这是首个面向运营商增值业务的大模型。 鸿湖图文大模型目前拥有8亿训练参数和20亿训练参数两个版本,可以实现以文生图、视频

2025-04-02

国家天文台联合阿里云发布国际首个太阳大模型——“金乌”。“金乌”基于通义千问系列开源模型打造,目前在M5级太阳耀斑预报上准确率超91%,为该级别太阳预报最高水平。 根据介绍,基于Qwen-VL等模型,“金乌”太阳大

2024-08-10

型正在提前开源,以便可以用于研究。我们希望该模型的发布能够帮助国内外 AI 研究人员进行更有意义的研究,帮助 AI 生态系统向前迈进一步。" LG 声称,EXAONE 3.0 与上一代产品相比,推理时间缩短了 56%,内存使用量减少了

2023-03-02

,涉及数据、算法、算力及训练基础设施等。智源研究院发布的FlagOpen大模型技术开源体系,是智源及上下游生态合作机构联合开展技术攻关的成果展现,为大模型技术创新提供了“北京贡献”。同时,他对于大模型的发展提出