清华开源的 LongCite 项目挺不错


清华开源的这个叫 LongCite 的项目挺不错的,现在的大语言模型读取和检索文档内容,基本都是依靠 RAG,才能成为我们常说的知识库功能。

https://github.com/THUDM/LongCite

但 LongCite 有点不太一样,它的定位是信息检索工具,虽然也依托 GLM-4-9B 和 Meta-Llama-3.1-8B 训练了专用的 LongCite-glm4-9b 和 LongCite-llama3.1-8b 这两个模型,支持最大 128K 上下文。

但它更擅长生成准确的回答和精确的句子级别的内容引用,如果说其他的知识库可能会经常出现幻觉甚至胡说八道的情况,那么 LongCite 相比精确度要高很多。

如果你的电脑性能足够强悍的话,LongCite 将会给你带来快如闪电的信息检索速度和精准的内容返回,从我的测试上看,确实比其他的 RAG 工具要强不少。

——摇摆时间线ZHLMI


相關推薦

2024-09-26

例如文本模型 GLM-4-9B 以及基于其训练的Longwriter-glm4-9b,LongCite-glm4-9b,codegeex4-all-9b 等模型,GLM-4V-9B等多模态模型,LongCite-45k等开源数据集。智谱积极构建开源生态,通过标准化模型权重发布、提供推理与微调代码、快速响应社

2023-10-27

理根目录 最新版下载地址 https://4bit.cn/p/b0pass (项目官网,电脑端和安卓 App 直接下载) 3. 代码仓库 https://github.com/bitepeng/b0pass GitHub(主库) 欢迎 star 支持 https://gitee.com/b0cloud/b0pass GitEE(国内同步) 欢迎 s

2023-11-04

深言科技与清华大学 NLP 实验室共同研发的语鲸LingoWhale-8B模型已面向社会开源。 深言科技(DeepLang AI)由清华大学计算机系自然语言处理实验室(THUNLP)与北京智源人工智能研究院(BAAI)共同孵化,是国内最早开展大模型研发

2025-04-17

据首都教育微信公众号消息,继今年 3 月清华大学宣布适度扩招、成立新书院后,学校教学委员会近期审议通过了 AI 辅修学位培养方案,决定今年秋季学期起推出新的 AI 辅修学位。 清华大学表示 AI 辅修学位将面向校内有志于

2025-04-02

清华大学开源软件镜像站今年的愚人节彩蛋颇有意思: 进入页面后点击鼠标左键自动进入「扔番茄」游戏 被番茄砸中的选项卡才会打开 所以你希望打开的选项卡多半都不能如愿,因为有“抛物线”导致的偏差 来体验

2023-07-22

务及科技中介服务等。 根据官网介绍,智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-10-21

合作伙伴一同高速发展。 智谱 AI 成立于 2019 年,是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-11-09

。 完整回顾:https://rsc.sseinfo.com/roadshowIndex.do?id=16536 开源、技术相关 您好!先前路演中,提过龙芯对于开源(个人理解为免费授权)与收费的思考,圈子里很多同学对关于“不开源”的论述有顾忌。能否借此机会明确下:龙

2025-04-24

日前,由清华博士曹越创立的 Sand.AI,公布了一款名为「Magi-1」的自回归视频生成模型,其主打两个能力: 无限长度扩展:通过前一段生成的内容进行后一段视频的制作,从而实现跨时间的无缝连贯叙事; 生成时长控制精

2025-03-27

清华大学的研究团队近日开源了其最新的研究成果——Video-T1。这项技术的核心在于测试时缩放 (Test-Time Scaling, TTS),旨在通过在视频生成过程的推理阶段投入更多的计算资源,显著提升生成视频的质量和与文本提示的一致性

2023-03-01

会、电子信息教学指导委员会领导,北京航空航天大学、清华大学等三十余所高校领导,以及圆梦杯获奖单位代表、老师代表、学生代表等百余人参加了颁奖典礼。 签到现场 典礼现场 操千曲而后晓声 观千剑而后识器 正

2023-07-05

清华大学人工智能研究院基础模型研究中心(简称“研究中心”)于 6 月 30 日下午正式宣布成立。 清华大学校长王希勤,中国科学院院士、清华大学人工智能研究院名誉院长张钹,中国工程院院士、清华大学网研院院长、中关

2023-09-22

亿元融资,由美团战投独家投资。   智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-06-22

从而更好地理解世界。” 值得一提的是,6 月 19 日,由清华大学计算机系教授、人工智能研究院副院长朱军带领的新团队完成了近亿级天使轮融资,由蚂蚁集团领投。这是自去年 11 月 ChatGPT 发布至今,蚂蚁集团投资的第一个 AI