🌊 AI 航海家俱乐部 · 日报

2026-05-23 · 扫读版

2026-05-23 星期六 3 分钟读完
📝 开篇

知识库方法论日。上海迎新日落地飞书总部,群里 RAG / Q&A / 拆库三连。

今日重点

2
亦仁定调(RAG 漏召回怎么破)

亦仁

  • 不靠切片调参,靠提示词锚定。
  • 前置一层搜索,比死磕分段更划算。
希望特定的内容一定要被引入进来,提示词上要做好设定。—— 亦仁
判断公司 AI 转型成功的唯一问题

波波(HEXIN 转述)

  • 难受才对——认知差正在持续放大(茅矛补刀)。
  • 转型路径没有捷径,就是持续试错。
AI 发展快,你是难受的,还是开心的?—— 波波(HEXIN 转述)
嘉宾入群

今日无新嘉宾入群。

抄作业

6
1

知识库先建索引文档(一条枸杞 实测)

在主文档外再做一个小索引文档,把内容和你的使用习惯关联起来,召回率立刻提一档。

关键:「知识库一定要建索引。」
2

Q&A 格式 = 命中率最优解(刘同学-明天AI 实测)

任何内容先扔给 AI 转成 Q&A 再入库,命中率 upup。比调切片参数有效得多。

3

不要建大杂烩,拆 10 个垂直小库(张波 实测)

一个库塞所有内容→索引慢、结果差、token 爆。每库只管一个领域,需要多领域时再组合调用。

4

Agent 套娃法:已有调索引,没有就建索引(张波 观察)

已处理过的内容直接调索引;新内容现场建新索引;不满意就细化重建。一环套一环出闭环。

关键:「类似奥特曼融合胶囊——能力不行,融合别人的。」
5

知识库本质 = 搜索引擎(斩天 复盘)

先索引分割(=百度收录),再召回粗排精排重排,最后把片段喂给大模型加工返回。

关键:推论:文档格式 / 段落划分直接决定上限。
6

用便宜大模型先给文档加摘要(斩天 观察)

入库前让小模型给每段加一段总结性内容,能显著缓解切片切坏的问题,比硬调 chunk size 划算。

机会对接

2

斩天

Dify RAG 分段被切坏,逻辑断层怎么破?

回应:→ 亦仁:提示词锚定;一条枸杞:建索引;刘同学:转 Q&A;张波:拆垂直库。

初阳AI

知识库交付要不要带问答系统?

回应:→ 茅矛:「除非持续更新,否则做问答系统是多此一举。」

群里大事

仪式

上海站航海家迎新日 · 落地飞书总部,茄子 / 王大仙接待。

时间
2026-05-23
上海迎新日 · 飞书总部
(名额已满,Lin 等没抢到)

群氛围切片

茅矛 最难受的点在于,认知差在持续放大。
坤大汀 运气是守恒的,看来你下半年要行大运了。
张波 我能力不行,就用胶囊获取别人的能力。
小鹅 刚输完手机号的 100% 纯新号。