清华开源的这个叫 LongCite 的项目挺不错的,现在的大语言模型读取和检索文档内容,基本都是依靠 RAG,才能成为我们常说的知识库功能。
https://github.com/THUDM/LongCite
但 LongCite 有点不太一样,它的定位是信息检索工具,虽然也依托 GLM-4-9B 和 Meta-Llama-3.1-8B 训练了专用的 LongCite-glm4-9b 和 LongCite-llama3.1-8b 这两个模型,支持最大 128K 上下文。
但它更擅长生成准确的回答和精确的句子级别的内容引用,如果说其他的知识库可能会经常出现幻觉甚至胡说八道的情况,那么 LongCite 相比精确度要高很多。
如果你的电脑性能足够强悍的话,LongCite 将会给你带来快如闪电的信息检索速度和精准的内容返回,从我的测试上看,确实比其他的 RAG 工具要强不少。
——摇摆时间线ZHLMI