GoForum › 🌐 V2EX
说实话,你们觉得 RAG 真的好使吗?这种情况应该怎么优化?
wingor2015 ·
2026-03-02 16:32 ·
0 次点赞 · 3 条回复
尝试了使用 Langchain 和其他几种开源的方案搭建 RAG 系统,效果都感觉差强人意。比如我有一个关于消防安全的制度文档,我想检索发生消防安全事故时的处置流程,用了混合检索和 rerank ,还是会检索到其他跟消防安全事故相关,但不是处置流程的分片。即使是找到了最准确的分片,但是因为分片的前面部分还包含了是消防安全但不是处置流程的其他内容,到了 LLM 这里,LLM 全都一股脑的把分片里的所有内容都拼成答案输出出来了。
3 条回复
wingor2015 · 2026-03-02 16:52
rerank+embedding 都是用的 BGE 。有考虑 RAG 后用大模型再筛选一遍跑题元素吗?—没有试过呢,有效果吗?
@wingor2015 换 Qwen/Qwen3-Reranker-8B + Qwen/Qwen3-Embedding-8B 。不行再加处理跑题环节。
添加回复
你还需要 登录
后发表回复
用的什么模型 rerank+embedding?
有考虑 RAG 后用大模型再筛选一遍跑题元素吗?