清华开源的 LongCite 项目挺不错


清华开源的这个叫 LongCite 的项目挺不错的,现在的大语言模型读取和检索文档内容,基本都是依靠 RAG,才能成为我们常说的知识库功能。

https://github.com/THUDM/LongCite

但 LongCite 有点不太一样,它的定位是信息检索工具,虽然也依托 GLM-4-9B 和 Meta-Llama-3.1-8B 训练了专用的 LongCite-glm4-9b 和 LongCite-llama3.1-8b 这两个模型,支持最大 128K 上下文。

但它更擅长生成准确的回答和精确的句子级别的内容引用,如果说其他的知识库可能会经常出现幻觉甚至胡说八道的情况,那么 LongCite 相比精确度要高很多。

如果你的电脑性能足够强悍的话,LongCite 将会给你带来快如闪电的信息检索速度和精准的内容返回,从我的测试上看,确实比其他的 RAG 工具要强不少。

——摇摆时间线ZHLMI


相關推薦

2024-09-26

例如文本模型 GLM-4-9B 以及基于其训练的Longwriter-glm4-9b,LongCite-glm4-9b,codegeex4-all-9b 等模型,GLM-4V-9B等多模态模型,LongCite-45k等开源数据集。智谱积极构建开源生态,通过标准化模型权重发布、提供推理与微调代码、快速响应社

2023-10-27

理根目录 最新版下载地址 https://4bit.cn/p/b0pass (项目官网,电脑端和安卓 App 直接下载) 3. 代码仓库 https://github.com/bitepeng/b0pass GitHub(主库) 欢迎 star 支持 https://gitee.com/b0cloud/b0pass GitEE(国内同步) 欢迎 s

2023-11-04

深言科技与清华大学 NLP 实验室共同研发的语鲸LingoWhale-8B模型已面向社会开源。 深言科技(DeepLang AI)由清华大学计算机系自然语言处理实验室(THUNLP)与北京智源人工智能研究院(BAAI)共同孵化,是国内最早开展大模型研发

2023-07-22

务及科技中介服务等。 根据官网介绍,智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-10-21

合作伙伴一同高速发展。 智谱 AI 成立于 2019 年,是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-07-05

清华大学人工智能研究院基础模型研究中心(简称“研究中心”)于 6 月 30 日下午正式宣布成立。 清华大学校长王希勤,中国科学院院士、清华大学人工智能研究院名誉院长张钹,中国工程院院士、清华大学网研院院长、中关

2023-11-09

。 完整回顾:https://rsc.sseinfo.com/roadshowIndex.do?id=16536 开源、技术相关 您好!先前路演中,提过龙芯对于开源(个人理解为免费授权)与收费的思考,圈子里很多同学对关于“不开源”的论述有顾忌。能否借此机会明确下:龙

2023-03-01

会、电子信息教学指导委员会领导,北京航空航天大学、清华大学等三十余所高校领导,以及圆梦杯获奖单位代表、老师代表、学生代表等百余人参加了颁奖典礼。 签到现场 典礼现场 操千曲而后晓声 观千剑而后识器 正

2023-09-22

亿元融资,由美团战投独家投资。   智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-06-22

从而更好地理解世界。” 值得一提的是,6 月 19 日,由清华大学计算机系教授、人工智能研究院副院长朱军带领的新团队完成了近亿级天使轮融资,由蚂蚁集团领投。这是自去年 11 月 ChatGPT 发布至今,蚂蚁集团投资的第一个 AI

2023-09-25

清华系创企水木分子宣布发布新一代对话式药物研发助手 ChatDD (Drug Design) 和全球首个千亿参数多模态生物医药对话大模型ChatDD-FM 100B。水木分子成立于今年6月,由清华大学智能产业研究院(AIR)孵化,专注于生物医药垂直行业

2023-08-16

清华大学研究团队发表的《LLM As DBA》论文介绍了用大模型管理数据库的技术。 论文地址:Arxiv  根据论文的内容,该团队开发了一款名为 D-Bot 的大语言模型工具,可以帮助对数据库进行管理。D-Bot 从文本来源中持续获取

2023-12-06

OneFlow 创始人袁进辉(微博人称老师木),2008 年 7 月自清华大学计算机系获得工学博士学位,获得清华大学优秀博士学位论文奖,2013 年加入微软亚洲研究院从事大规模机器学习平台的研发工作。 其团队上次创业一流科技时,

2023-08-11

清华大学新闻与传播学院沈阳团队近日发布的《大语言模型综合性能评估报告》显示,百度文心一言在三大维度20项指标中综合评分国内第一,超越ChatGPT,其中中文语义理解排名第一,部分中文能力超越GPT-4。 据了解,报告本