2026年5月21日 – hupcのblog

从数据到答案：RAG 工作流深度拆解

2026-5-21 15:13

|

7

|

0

|

AI

2285 字

|

9 分钟

一、概述 RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合检索系统与生成模型的技术架构。其核心思想是：在 LLM 生成回答之前，先从知识库中检索相关文档或片段（chunk），将检索结果作为上下文提供给 LLM，从而提升回答的准确性和可信度，同时有效缓解 LLM 的「幻觉」问题。 RAG 主要解决以下问题…

agent ai rag

RAG 检索与关键词搜索的区别：从原理到实践

2026-5-21 13:37

|

3

|

0

|

AI

2743 字

|

11 分钟

在 LLM 应用遍地开花的今天，检索增强生成（RAG）几乎成了知识库问答的标配。但很多人忽略了：关键词搜索并没有过时。理解两者的区别与联系，是做好检索系统的第一步。一、一句话讲清区别简单讲，关键词搜索适用于精确匹配，RAG 检索适用于语义模糊匹配。这是两者最本质的分野。关键词搜索盯着"字"看，RAG 检索盯着"意…

agent ai rag

RAG检索效果差？可能是你的Embedding模型没选对！

2026-5-21 10:45

|

6

|

0

|

AI

1469 字

|

6 分钟

做RAG（检索增强生成）的朋友，一定踩过这个坑：明明Prompt写得很好，大模型也很强，但检索出来的内容就是不靠谱。问题很可能出在Embedding模型上。今天就来聊聊，RAG检索中那些主流的Embedding模型，以及到底该怎么选。一、主流Embedding模型盘点 1. OpenAI系列：曾经的绝对主力早期做RAG，OpenAI的emb…

agent ai rag

RAG 检索的 Chunk 切分策略完全指南

2026-5-21 10:43

|

5

|

0

|

AI

2954 字

|

12 分钟

如果把 RAG 系统比作一道菜，Embedding 模型是火候，向量数据库是锅具，那 Chunk 切分就是刀工。刀工不对，再好的食材也出不来好菜。一、为什么 Chunk 切分如此重要？ RAG 检索的文档切分是关乎检索质量的关键步骤，如何高效正确地切分，直接决定了能否检索到正确的答案。切分之所以关键，原因有二：一方面，向量 Embedding …

agent ai rag

2026年 5月
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

每日归档： 2026年5月21日