分类: learn

38 篇文章

thumbnail
从数据到答案:RAG 工作流深度拆解
一、概述 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合检索系统与生成模型的技术架构。其核心思想是:在 LLM 生成回答之前,先从知识库中检索相关文档或片段(chunk),将检索结果作为上下文提供给 LLM,从而提升回答的准确性和可信度,同时有效缓解 LLM 的「幻觉」问题。 RAG 主要解决以下问题…
thumbnail
RAG 检索与关键词搜索的区别:从原理到实践
在 LLM 应用遍地开花的今天,检索增强生成(RAG)几乎成了知识库问答的标配。但很多人忽略了:关键词搜索并没有过时。理解两者的区别与联系,是做好检索系统的第一步。 一、一句话讲清区别 简单讲,关键词搜索适用于精确匹配,RAG 检索适用于语义模糊匹配。 这是两者最本质的分野。关键词搜索盯着"字"看,RAG 检索盯着"意…
thumbnail
RAG检索效果差?可能是你的Embedding模型没选对!
做RAG(检索增强生成)的朋友,一定踩过这个坑:明明Prompt写得很好,大模型也很强,但检索出来的内容就是不靠谱。 问题很可能出在Embedding模型上。 今天就来聊聊,RAG检索中那些主流的Embedding模型,以及到底该怎么选。 一、主流Embedding模型盘点 1. OpenAI系列:曾经的绝对主力 早期做RAG,OpenAI的emb…
thumbnail
RAG 检索的 Chunk 切分策略完全指南
如果把 RAG 系统比作一道菜,Embedding 模型是火候,向量数据库是锅具,那 Chunk 切分就是刀工。刀工不对,再好的食材也出不来好菜。 一、为什么 Chunk 切分如此重要? RAG 检索的文档切分是关乎检索质量的关键步骤,如何高效正确地切分,直接决定了能否检索到正确的答案。 切分之所以关键,原因有二:一方面,向量 Embedding …
thumbnail
Claude Code 是怎么运转的:一篇讲清主循环、上下文、工具、记忆与安全
很多人第一次接触 Claude Code,会把它理解成“一个会写代码的大模型”。但如果你真的拆开看它的内部实现,就会发现它的核心竞争力并不只是模型本身,而是一整套围绕模型构建出来的 Agent 运行时。 它不是回答一次问题就结束的聊天机器人,而是一个能持续思考、调用工具、压缩上下文、恢复错误、管理权限、协调子 Agent 的执行系统。换句话说,Cl…
thumbnail
百万令牌的效率革命 DeepSeek_V4技术报告全景解读
当"能处理多少 token"成为衡量模型能力的新维度,如何在不让成本和延迟失控的前提下,把上下文从几万推向百万,成了各家大模型最棘手的工程难题。DeepSeek 给出了自己的答案。 DeepSeek-V4 发布已有一段时间,其极具竞争力的定价与高效的缓存机制,给开发者们带来了不小的惊喜。然而,模型出色的表现背后,支撑它的技术创新更值得深入探究。今天…
thumbnail
网信办发布AI智能体重磅文件:《智能体规范应用与创新发展实施意见》
2026年5月8日,中央网络安全和信息化委员会办公室(国家网信办)发布《智能体规范应用与创新发展实施意见》。这是中国首份系统性针对AI智能体(AI Agent) 的顶层政策文件,全文覆盖技术底座、安全治理、应用场景、产业生态四大维度,为智能体从"野蛮生长"走向"规范发展"划定了清晰的路线图。 一、背景:智能体为何需要"实施意见"? 文件开篇给出了明…
thumbnail
Agent 时代的三层通信协议:MCP、A2A 与 ANP
📖 本文已同步发布到公众号《浪浪山客栈》 https://mp.weixin.qq.com/s/-VfuWtXcVnwNA4iJmjBAZg 随着 AI Agent 的快速普及,一个现实问题浮出水面:Agent 越来越多,但它们彼此说不上话。 不同框架、不同公司构建的 Agent,各有各的接口、各有各的数据格式。想让它们协作,开发者必须手写大量胶水…
thumbnail
大语言模型(LLM)全景解读:从 N-gram 到 Transformer 的演进之路
📖 本文是学习 Hello-Agents 项目时整理的笔记与思考。 文章已同步发布到微信公众号【浪浪山客栈】 https://mp.weixin.qq.com/s/r170l35dSyKLPlpA3NZwlQ 一、发展脉络:语言模型是如何一步步进化的? 语言模型的核心任务,是对自然语言的概率分布进行建模——简单来说,就是让机器"理解&qu…
thumbnail
上下文工程:让Agent真正用好记忆与知识
📖 本文是学习 Hello-Agents 项目时整理的笔记与思考。 拥有记忆和检索能力,只是 Agent 智能化的第一步。如何在有限的上下文窗口内,高效地组织、筛选和利用这些信息,才是决定 Agent 实际表现的关键——这正是上下文工程(Context Engineering)所要解决的问题。 文章已同步发布到微信公众号【浪浪山客栈】 https:…