清华系创企推出千亿参数生物医药大模型


清华系创企水木分子宣布发布新一代对话式药物研发助手 ChatDD (Drug Design) 和全球首个千亿参数多模态生物医药对话大模型ChatDD-FM 100B。水木分子成立于今年6月,由清华大学智能产业研究院(AIR)孵化,专注于生物医药垂直行业大模型的研发与应用。

根据介绍,水木分子提出的ChatDD,基于大模型能力,能够对多模态数据进行融合理解,与专家自然交互人机协作,将人类专家知识与大模型知识联结,重新定义药物研发模式。

ChatDD 基于水木分子千亿参数多模态生物医药对话大模型底座 ChatDD-FM,具备专业知识力、认知探索力和工具调用能力。作为生物医药研发助手Copilot 可以服务医药研发全流程场景,从立项调研,早期药物发现,临床前研究到临床试验、药物重定位等各环节。

在具体应用场景方面,发布会上展示了 ChatDD-BI 立项场景、ChatDD-Discovery研发探索场景和ChatDD-Trail 临床试验场景应用。

ChatDD的底座为千亿参数多模态生物医药对话大模型ChatDD-FM 100B,在通用语言模型基础上经过:生物医药专业知识增强、生物医药多模态对齐、专业领域指令微调和RLHF三层淬炼。ChatDD-FM 100B在C-Eval 评测榜单中达到综合成绩Top10,全部医学专项4项评测排名第一,是唯一在该4项评测中平均分超过90分(93.1分)的模型。


相關推薦

2023-07-22

务及科技中介服务等。 根据官网介绍,智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-09-22

亿元融资,由美团战投独家投资。   智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-10-21

合作伙伴一同高速发展。 智谱 AI 成立于 2019 年,是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-08-19

学智能产业研究院(AIR)宣布开源全球首个可商用多模态生物医药百亿参数大模型 BioMedGPT-10B,可用于提升药物研发各个环节的效率,包括新药立项评估、药物设计和优化、临床试验设计、适应症拓展等。 此外,该模型在生物

2023-09-08

于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技术成果转化。 智谱清言在线体验:https://chatglm.cn/ 百川智能(百川大模型) 8 月 31 日,前搜狗 CEO 王小川创立的百川智能宣布率先通

2023-10-11

体、新材料、新能源、智能汽车、人工智能、数字经济和生物医药等多个方向,全面助力国家产业升级转型和经济发展。 太平创新是国内首批经原中国银保监会批准设立的保险系私募基金管理公司之一,作为中国太平保险集团

2023-11-04

深言科技与清华大学 NLP 实验室共同研发的语鲸LingoWhale-8B模型已面向社会开源。 深言科技(DeepLang AI)由清华大学计算机系自然语言处理实验室(THUNLP)与北京智源人工智能研究院(BAAI)共同孵化,是国内最早开展大模型研发

2024-04-18

等领域提升超40%。另外,据了解,中国电信将于年内开源千亿级参数大模型。 根据介绍,TeleChat-12B将7B版本1.5T训练数据提升至3T,优化数据清洗、标注策略,持续构建专项任务SFT(监督微调)数据,优化数据构建规范,大大提

2023-09-22

A360、AI 数字员工等大模型服务。 据介绍,360 智脑拥有千亿参数规模,预训练超万亿 tokens,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,能够覆盖大模型应用的所有场景。基于 360 智脑的企业级垂直

2023-08-16

清华大学研究团队发表的《LLM As DBA》论文介绍了用大模型管理数据库的技术。 论文地址:Arxiv  根据论文的内容,该团队开发了一款名为 D-Bot 的大语言模型工具,可以帮助对数据库进行管理。D-Bot 从文本来源中持续获取

2023-06-25

是 MosaicML 的第一步,接下来他们将以降低成本为前提,推出更大的、更高质量的模型。 开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在自己的硬件上用自己的数据对模型进行微调。

2023-11-01

023云栖大会现场,作为通义大模型基础模型的通义千问2.0千亿参数模型正式发布。 据介绍,通义千问2.0模型参数达到千亿级别,不管是在阅读理解还是逻辑思维、数据等方面,都有大幅度提升,能够全面达到国际先进水平。

2023-07-25

本次发布会的主讲人为知未智能的联合创始人兼CTO段清华,毕业于北京大学计算机系,长期以来从业于金融科技领域,具备多年金融科技的项目经验,同时在机器学习和自然语言处理领域有着深入的研究。 以段清华为核心的

2023-06-22

从而更好地理解世界。” 值得一提的是,6 月 19 日,由清华大学计算机系教授、人工智能研究院副院长朱军带领的新团队完成了近亿级天使轮融资,由蚂蚁集团领投。这是自去年 11 月 ChatGPT 发布至今,蚂蚁集团投资的第一个 AI