中国电信将于年内开源千亿级参数大模型


近日中国电信开源了12B参数规模星辰语义大模型TeleChat-12B。相较于1月开源的7B版本,内容、性能和应用等方面整体效果提升了30%。其中,多轮推理、安全问题等领域提升超40%。另外,据了解,中国电信将于年内开源千亿级参数大模型。

根据介绍,TeleChat-12B将7B版本1.5T训练数据提升至3T,优化数据清洗、标注策略,持续构建专项任务SFT(监督微调)数据,优化数据构建规范,大大提升数据质量;同时,基于电信星辰大模型用户真实回流数据,优化奖励模型和强化学习模型,有效提升模型问答效果。

TeleAI通过更彻底地开源推动大模型技术进步和大模型国产化进程。此次开源提供基础模型以及基于相应版本的对话模型、不仅支持传统的全量参数更新还支持 LoRA 等只更新部分参数的高效微调方法、支持Deepspeed微调、支持int8、int4量化和国产芯片训练推理,推动大模型国产化进程。

与此同时,星辰大模型也在深入推动人工智能与各行各业的融合,积极探索新兴的应用场景。星辰语义大模型已应用于行文写作、代码编程、网络故障分析以及经营分析等场景。行文写作方面,平均生成字数超过1500字,有效采纳率为85.7%。

早在2023年年报中,中国电信就表示,2024年公司将把握以人工智能为代表的新一轮科技革命和产业变革趋势。

开源项目地址:https://gitee.com/Tele-AI/tele-chat


相關推薦

2023-07-22

tGLM(内测版)发布。 相关阅读: 清华系公司智谱 AI 开源 ChatGLM-6B 大模型,千亿基座对话模型开启内测 360 合作智谱 AI,共研千亿级大语言模型 360GLM 智谱 AI 官宣:ChatGLM2-6B 可免费商用

2023-11-06

、以及模型能力均达到了“4+级”。 10月30日,昆仑万维开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。「天工」Skywork-13B系列目前包括130亿参数的两大模型,Skywork-13B-Ba

2023-10-21

【源创会预告】1024 程序员节(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> 北京智谱华章科技有限公司(简称“智谱AI”)宣布,今年已累计获得超 25 亿人民币融资。 参与方主要包括社保基金中关村自主创新基金(君

2023-09-22

力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了 ChatGLM(chatglm.cn)。 此外,智谱 AI 还推出了

2023-11-01

下载相关APP进行体验。 阿里云CTO周靖人宣布,将在11月开源通义千问720亿参数模型,继续支持全球开发者开展模型和应用创新。 阿里云是国内最早开源自研大模型的头部科技企业,已先后开源通义千问70亿参数模型Qwen7B和140

2024-01-13

中国电信宣布将自研星辰 AI 大型模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。 用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化

2023-09-08

技术特色。 2023年3月20日,百度官微消息文心一言云服务将于3月27日上线。6月,百度文心大模型3.5版本已内测可用。8月31日,文心一言全面开放。 文心一言在线体验:https://yiyan.baidu.com/ 抖音(云雀大模型) 8 月中旬,字

2023-06-29

演讲中也表示,生成式 AI 正在迎来发展的奇点,未来 2 年内 50% 的工作将受到人工智能深刻影响。他还透露了中国联通在 AI 大模型领域的布局,包括构建大算力平台底座、行业多场景大模型、高可靠的安全体系,让 AI“用得起

2023-09-25

新一代对话式药物研发助手 ChatDD (Drug Design) 和全球首个千亿参数多模态生物医药对话大模型ChatDD-FM 100B。水木分子成立于今年6月,由清华大学智能产业研究院(AIR)孵化,专注于生物医药垂直行业大模型的研发与应用。 根据

2023-09-22

A360、AI 数字员工等大模型服务。 据介绍,360 智脑拥有千亿参数规模,预训练超万亿 tokens,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,能够覆盖大模型应用的所有场景。基于 360 智脑的企业级垂直

2023-09-13

倍,服务质量、数量提升效果非常明显,能给未来大体量千亿级参数模型的训练提供非常好的支持,服务范围可从天津扩大到整个京津冀区域。 活动现场,天津市残联、天津理工大学、天津市人工智能计算中心、华为公司四

2023-06-17

所联合发布《共建人工智能框架生态倡议》、昇思MindSpore开源社区理事会成立、上海昇思AI框架&大模型创新中心正式启动及首批22家单位入驻、全模态大模型“紫东·太初2.0”正式发布等。 本次峰会以“一起昇思 无尽创新”

2023-09-01

测领域的神器 or 鸡肋? 腾讯云向量数据库 SDK 宣布正式开源。根据介绍,腾讯云向量数据库(Tencent Cloud VectorDB)的 Python SDK 与Java SDK 是基于数据库设计模型,遵循 HTTP 协议,将 API 封装成易于使用的 Python 与 Java 函数或类,为

2023-06-22

alGLM-6B 由清华大学知识工程和数据挖掘小组发布,是一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM-6B,具有 62 亿参数;图像部分通过训练 BLIP2-Qformer 构建起视觉模型与语言模型的桥梁,整体模