分类:RAG / 检索系统 / 混合检索 / Rerank / 面试准备
基本信息
- 标题:
蚂蚁面试官怒怼:"你说用了混合检索加 Rerank 精排,那检索函数的核心代码你能手撕出来吗?连 retrieval 的调用流程都讲不清?"
- 来源:微信公众号 / 吴师兄学大模型
- 原文链接:点击打开原文
- 收录时间:2026-04-15
内容归类
- 主题方向:RAG 工程实现
- 细分标签:混合检索 / BM25 / 向量检索 / RRF / Rerank / 面试准备
- 适合用途:项目复盘、面试表达、检索链路梳理
核心内容摘录
文章围绕一个问题展开:
你说自己做过混合检索 + Rerank,那 retrieval 函数从接到用户 query 到返回最终结果,中间到底经历了什么?
文章指出,很多人会讲策略,但讲不清实现。
面试官会继续追问:
- 向量检索和 BM25 是串行还是并行?
- 结果怎么融合?用 RRF 还是加权求和?
- 为什么参数这么设?
- Rerank 是不是对所有结果都做?
- Top100 全部过 Cross-Encoder 会不会太慢?
文中把 retrieval 函数拆成了几步:
- 构建检索请求
- 执行混合检索
- 做结果融合
- 做 rerank 精排
- 返回最终 TopK 结果
核心不是只知道这些名词,而是能讲清楚:
- 每一步的输入输出
- 为什么这样串起来
- 性能和效果怎么平衡
讲解分析文档
这篇对应的分析版我已经单独整理好了:
备注
这篇更偏工程实现和面试追问,不是偏论文理论。后面如果继续积累,可以单独整理成「RAG 面试追问」小专题。