卷一 · 文章

蚂蚁面试官怒怼：混合检索 + Rerank 精排的 retrieval 调用流程

2026/5/25 · post

正文

分类：RAG / 检索系统 / 混合检索 / Rerank / 面试准备

基本信息

标题：蚂蚁面试官怒怼："你说用了混合检索加 Rerank 精排，那检索函数的核心代码你能手撕出来吗？连 retrieval 的调用流程都讲不清？"

来源：微信公众号 / 吴师兄学大模型

原文链接：点击打开原文

收录时间：2026-04-15

内容归类

主题方向：RAG 工程实现

细分标签：混合检索 / BM25 / 向量检索 / RRF / Rerank / 面试准备

适合用途：项目复盘、面试表达、检索链路梳理

核心内容摘录

文章围绕一个问题展开：

你说自己做过混合检索 + Rerank，那 retrieval 函数从接到用户 query 到返回最终结果，中间到底经历了什么？

文章指出，很多人会讲策略，但讲不清实现。

面试官会继续追问：

向量检索和 BM25 是串行还是并行？

结果怎么融合？用 RRF 还是加权求和？

为什么参数这么设？

Rerank 是不是对所有结果都做？

Top100 全部过 Cross-Encoder 会不会太慢？

文中把 retrieval 函数拆成了几步：

构建检索请求

执行混合检索

做结果融合

做 rerank 精排

返回最终 TopK 结果

核心不是只知道这些名词，而是能讲清楚：

每一步的输入输出

为什么这样串起来

性能和效果怎么平衡

讲解分析文档

这篇对应的分析版我已经单独整理好了：

备注

这篇更偏工程实现和面试追问，不是偏论文理论。后面如果继续积累，可以单独整理成「RAG 面试追问」小专题。

← Back to Posts