一、概述 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合检索系统与生成模型的技术架构。其核心思想是:在 LLM 生成回答之前,先从知识库中检索相关文档或片段(chunk),将检索结果作为上下文提供给 LLM,从而提升回答的准确性和可信度,同时有效缓解 LLM 的「幻觉」问题。 RAG 主要解决以下问题…
在 LLM 应用遍地开花的今天,检索增强生成(RAG)几乎成了知识库问答的标配。但很多人忽略了:关键词搜索并没有过时。理解两者的区别与联系,是做好检索系统的第一步。 一、一句话讲清区别 简单讲,关键词搜索适用于精确匹配,RAG 检索适用于语义模糊匹配。 这是两者最本质的分野。关键词搜索盯着"字"看,RAG 检索盯着"意…
做RAG(检索增强生成)的朋友,一定踩过这个坑:明明Prompt写得很好,大模型也很强,但检索出来的内容就是不靠谱。 问题很可能出在Embedding模型上。 今天就来聊聊,RAG检索中那些主流的Embedding模型,以及到底该怎么选。 一、主流Embedding模型盘点 1. OpenAI系列:曾经的绝对主力 早期做RAG,OpenAI的emb…
如果把 RAG 系统比作一道菜,Embedding 模型是火候,向量数据库是锅具,那 Chunk 切分就是刀工。刀工不对,再好的食材也出不来好菜。 一、为什么 Chunk 切分如此重要? RAG 检索的文档切分是关乎检索质量的关键步骤,如何高效正确地切分,直接决定了能否检索到正确的答案。 切分之所以关键,原因有二:一方面,向量 Embedding …