Skip to content

Agent_Application 面试专题手册

💡 本章节共收录 3867 道面试真题,建议每天复习 10-20 题。


Q1: 深挖实习中的AI Agent架构与Java后端落地细节。

【核心解析】 Agent架构设计,如感知-规划-执行循环;Java后端集成LLM的方式,如API调用与异步处理;工具注册与调用机制;状态管理与持久化;性能优化与错误处理;实际业务场景中的挑战与解决方案。


Q2: 提问第一个项目:MinerU相对于传统OCR有什么优势

【核心解析】 MinerU可能结合多模态大模型,不仅提取文字,还能理解文档布局、表格、公式等复杂结构;端到端处理,减少后处理步骤;可能支持语义理解与信息抽取,超越传统OCR的纯文本识别


Q3: 在跨境汇款业务场景下,Agent超时或失败时如何应对,并保证资金安全?

【核心解析】 设计幂等性机制防止重复扣款;采用分布式事务或补偿事务确保数据一致性;实现超时重试与异常回滚策略;利用状态机管理交易生命周期;记录审计日志以便追溯


Q4: langgraph 和 langchain 的区别?为什么选 langgraph?

【核心解析】 LangChain 的链式调用与局限性;LangGraph 的图结构与状态管理;循环与条件分支的支持;与多 Agent 协作的适配性;实际项目中的选型理由


Q5: 在Agent系统中如何设计人工审批断点?

【核心解析】 在关键决策点(如资金操作、内容发布)设置暂停,等待人工确认;提供清晰的上下文信息,使审批者能快速理解当前状态和待审批动作;支持灵活的审批流程,如单人审批、多人会签;记录审批日志,便于审计和回溯;设计超时和默认处理机制,避免流程阻塞。


Q6: 平时用哪些大语言模型?

【核心解析】 列举常用模型如GPT系列、Claude、Gemini、LLaMA、Qwen等;说明各模型的特点和适用场景;提及模型调用方式(API、本地部署);关注点包括模型能力、上下文长度、成本、安全性等。


Q7: Redis持久化机制有哪些?各自优缺点是什么?

【核心解析】 RDB快照:定时保存内存数据,恢复快但可能丢失最近数据;AOF日志:记录写命令,数据更完整但文件大恢复慢;混合持久化:结合两者优点;需根据数据安全性与性能要求选择。


Q8: 请描述你开发的 Agent 的具体职责、输入和输出。

【核心解析】 明确 Agent 的应用场景和目标;输入格式(如自然语言指令、结构化数据);输出形式(如动作序列、API 调用、自然语言回复);内部决策流程(规划、工具调用、记忆利用)。


Q9: 如果让你用 Agent 的方式重新设计这个项目,你会如何考虑?

【核心解析】 识别项目中可自主决策的环节;设计 Agent 的感知-规划-执行循环;选择合适的工具和记忆机制;评估引入 Agent 带来的灵活性与复杂性权衡。


Q10: 请设计一个用户购物 Agent,并说明其工作方式。

【核心解析】 理解用户意图(商品查询、比价、下单);集成商品搜索、推荐、购物车管理等工具;处理多轮对话和上下文;考虑安全与支付环节的确认机制;异常处理与回退策略。


Q11: 问GUI-Agent项目:背景是什么

【核心解析】 GUI-Agent项目的应用场景与目标;为什么选择GUI交互作为Agent的切入点;项目要解决的具体问题(如自动化操作、辅助用户等);技术背景与行业需求


Q12: 介绍一下agent实习的项目架构

【核心解析】 Agent项目的整体架构设计(如感知、规划、执行模块);技术栈与关键组件(LLM、工具、记忆、检索等);模块间的交互流程与数据流;架构的扩展性与实际部署考虑


Q13: 请介绍你的GUI-Agent项目,包括技术实现、异步训练方法和任务完成评判方式。

【核心解析】 GUI-Agent通过视觉理解和动作预测操作图形界面;技术栈可能包括视觉模型(如ViT)、动作空间定义(点击、输入)和规划模块;异步训练通过多环境并行采样、经验回放和离线策略更新实现;评判标准包括任务成功率、步骤效率、动作准确率;可能使用强化学习或模仿学习,结合人工标注或自动评估。


Q14: 如果让你设计智能体与大模型相关的分布式系统,会从哪些方面进行综合考量?

【核心解析】 系统架构设计(如微服务、事件驱动);高并发与弹性伸缩;模型服务化与推理优化;数据一致性;容错与监控


Q15: 智能体在高并发场景下可能遇到哪些问题?如何解决?

【核心解析】 模型推理延迟与排队;工具调用超时与重试;状态一致性与会话管理;资源隔离与限流;分布式缓存与消息队列


Q16: 对业务agent的理解,业务背景等

【核心解析】 业务Agent的定义与特点;业务场景下的需求分析;Agent如何与现有业务系统集成;业务Agent的定制化与通用性平衡;业务Agent的评估指标(业务指标、用户满意度等)


Q17: 为什么选择用 LangChain?有没有了解或对比过 LangGraph?LangChain 和 LangGraph 的区别是什么?

【核心解析】 LangChain 的核心优势(链式调用、组件化、生态集成);LangGraph 的设计理念(图结构、状态管理、循环控制);两者在复杂 Agent 流程中的适用场景对比;从 LangChain 迁移到 LangGraph 的考量


Q18: 如果入职后让你做一些纯 Agent 链路开发,或者纯 Prompt 调优的工作,你能接受吗?

【核心解析】 对 Agent 链路开发的理解(如工具集成、流程编排);Prompt 调优的方法论(如少样本、思维链);对专注性工作的接受度;如何平衡工程与调优的意愿


Q19: 说明项目推进过程中,针对AI相关功能的设计思路以及功能迭代的思考逻辑。

【核心解析】 需求分析:明确AI能解决的核心痛点;原型验证:快速构建MVP并评估效果;迭代优化:基于用户反馈和指标(如准确率、延迟)持续改进;可观测性:埋点监控AI行为;风险控制:设计降级方案和人工兜底


Q20: 说明项目推进过程中,针对AI相关功能的设计思路以及功能迭代的思考逻辑

【核心解析】 需求分析与AI能力匹配;原型验证与可行性评估;功能模块化与可扩展性设计;用户反馈驱动的迭代流程;模型选型与成本控制;评估指标与线上监控


Q21: 这个 Agent 的作用是什么?

【核心解析】 需结合具体项目说明 Agent 的业务目标;阐述 Agent 在自动化流程、信息处理或决策支持中的角色;强调其解决的核心痛点与预期价值。


Q22: 你在B公司做的Agent核心是做什么的?这个Agent实际是在部署什么?Agent是中心化部署还是每台机器一个?Agent和Jenkins的关系是什么?

【核心解析】 Agent的核心功能与业务场景;部署对象与目标环境;中心化与分布式部署的架构差异;Agent与Jenkins的集成方式与职责划分


Q23: 这个过程是基于全量扫描,还是事件驱动?

【核心解析】 全量扫描与事件驱动两种触发机制的差异与适用场景;事件驱动在实时性和资源消耗上的优势;在Agent平台中可能用于故障匹配、配置同步等场景的触发方式选择


Q24: 项目的需求从哪里来?如何将模糊需求拆解为可落地的 Agent 能力?

【核心解析】 需求来自内容安全运营、创作者工具、客服申诉、审核质检等团队;不能直接做成万能问答,需拆解为明确能力如违规识别、规则解释、相似案例检索、改写建议、人工复核摘要、申诉材料生成;每项能力需定义输入、输出和停止条件;违规识别必须输出风险类型、证据片段和置信度;申诉摘要需区分用户陈述和系统证据;拆解粒度需支持工具接入和评测闭环


Q25: 对于项目中具体一个例子拷打:可能出现什么回答,这种回答的原因,调用什么工具,会反馈什么信息,信息代表了什么,以及 agent 如何自我判断出现了这个问题?

【核心解析】 需结合具体业务场景分析 Agent 可能的错误回答(如幻觉、工具调用失败、上下文误解);原因可能包括检索不准确、prompt 设计缺陷、工具描述不清或模型能力不足;调用的工具可能为搜索引擎、数据库、API 等;反馈信息如错误码、空结果、超时或低置信度;Agent 可通过校验工具返回状态、置信度阈值、结果一致性检查或自我反思机制判断问题。


Q26: AI coding,开发一个符合具体要求的代码自动审核和修复的Agent,限时半小时评论

【核心解析】 理解代码审核与修复的自动化流程;Agent架构设计(如ReAct循环、工具调用);时间约束下的快速原型实现;代码质量与安全性考量;实际应用中的挑战与解决方案


Q27: 既然 Jenkins 本身就能做自动化,为什么还要引入 Agent?引入 Agent/AI 的价值在哪里?

【核心解析】 区分确定性自动化与智能决策;Agent 能处理非结构化输入和动态目标;Agent 具备推理、规划和自适应能力;Agent 可整合多工具协同,实现复杂工作流;Jenkins 作为执行器,Agent 作为大脑,两者互补。


Q28: 在完全没有规范流程、系统很混乱的情况下,你怎么落地这个 Agent?

【核心解析】 从最小可行场景切入,逐步验证价值;通过 Agent 反向推动流程标准化;利用 LLM 理解混乱环境并提取关键信息;设计灵活的工具接口适配异构系统;建立反馈循环持续优化 Agent 行为。


Q29: SSE 和 WebSocket 有什么区别?在模型推流场景中为什么更倾向于选择 SSE?

【核心解析】 SSE 是服务器到客户端的单向流式推送,基于 HTTP,适合模型生成 token 的流式输出;WebSocket 是全双工协议,适合双向频繁通信场景;SSE 工程上更轻量,与现有 HTTP 基础设施兼容性好,浏览器原生支持 EventSource;WebSocket 需要额外的连接管理、心跳和负载均衡复杂度;只有在需要客户端中途强交互或实时控制时 WebSocket 优势才更明显


Q30: RocketMQ 如何保证消息不丢失?如何处理重复消费和幂等性问题?

【核心解析】 消费端在业务处理成功后再 ack,避免刚收到消息就确认;通过多层机制将丢失概率压到足够低;MQ 语义通常为至少一次,重复消费不可避免;使用唯一业务键(如订单号)进行幂等去重,消费前检查幂等表或 Redis;支付、退款等关键业务消费逻辑必须天然幂等


Q31: 如何将中文需求映射到代码检索?通常需要经过哪些阶段?

【核心解析】 通常包括 query 理解、实体抽取、混合检索、重排和证据扩展等阶段;例如抽取“订单、超时、取消”等业务意图;结合仓库中的函数名、类名等信息进行检索;需要处理中文口语化表达与代码符号的语义差异;最终通过重排和扩展提高检索准确性


Q32: 开发 Agent 时采用什么流程?是否借鉴了现有产品的思路?

【核心解析】 开发流程通常包括需求分析、场景定义、工具选择、提示词设计、记忆与规划模块实现、评测迭代;借鉴现有产品(如 AutoGPT、MetaGPT、Claude 等)的架构设计、工具使用模式和交互范式,结合自身场景进行定制;强调快速原型验证和基于反馈的持续优化。


Q33: 谈谈你对AI的看法以及AI在编程中的应用。

【核心解析】 AI辅助编程(代码生成、补全、审查)的优势与局限;AI Coding工具(如Copilot)的实际问题(代码质量、上下文理解);人类开发者的不可替代性;未来发展趋势


Q34: 在 Redis 项目中,如何利用 Redis + Token 实现会话管理,并保证多节点部署下的一致性?

【核心解析】 Token 生成与验证机制;Redis 集中存储会话;多节点下的 Session 共享;分布式一致性协议(如 Raft)或缓存同步策略


Q35: 如何利用 Redis 保证高并发场景下的系统稳定性?引入本地缓存后,如何设计多级缓存及读写更新策略?

【核心解析】 Redis 性能优化(连接池、管道);本地缓存(如 Caffeine)与 Redis 的多级缓存架构;缓存更新策略(Cache-Aside、Write-Through);数据一致性保证(版本号、延迟双删)


Q36: 如何设计分布式锁?在同时存在本地缓存和分布式缓存的情况下,如何保证数据一致性?

【核心解析】 基于 Redis 的分布式锁实现(SETNX、Redlock);本地缓存与分布式缓存的同步机制;缓存双写一致性方案;锁的粒度与性能权衡


Q37: 大流量冲击下 Redis 被打满,如何设计系统降级方案以防止雪崩?

【核心解析】 限流与熔断机制;缓存降级策略(返回默认值、静态化);热点数据预加载;Redis 集群扩容与故障转移


Q38: 当数据量和QPS增大时,Agent架构应如何改进?所需的硬件资源大概如何规划?

【核心解析】 高并发场景下的系统瓶颈分析;水平扩展与垂直扩展的策略;负载均衡、缓存、异步处理等优化手段;硬件资源估算(CPU、GPU、内存、存储)。


Q39: 请介绍AI商家运营助手Agent的架构设计。

【核心解析】 整体架构分层(交互层、决策层、工具层);意图识别与任务规划;商家数据接入与分析;运营动作执行(如优惠券发放、消息推送);效果评估与反馈循环


Q40: 如果重新设计Agent项目,哪些地方可以改进?

【核心解析】 架构解耦与模块化(如分离规划、执行、记忆);工具调用的标准化与扩展性;评估与监控体系的完善;多Agent协作与人类交互的优化


Q41: 有没有用过市面上一些Agent产品,印象最深刻的设计有哪些?Agent项目,有没有调研过市面上其他的Agent搭建框架?如果Agent项目用OpenClaw搭建会怎么样?

【核心解析】 主流Agent产品体验(如AutoGPT、GPTs、Coze);优秀设计点分析(交互体验、任务拆解、工具集成);常见Agent框架对比(LangChain、AutoGen、CrewAI、OpenClaw);框架选型考量(易用性、扩展性、生态、性能);OpenClaw的特点与适用场景


Q42: Agent项目是否有上线部署?

【核心解析】 考察实际工程经验,包括部署环境、服务架构、监控、日志、迭代流程;关注如何保证Agent在生产环境下的稳定性、性能和安全性;可能涉及CI/CD、容器化、负载均衡等


Q43: 在大型项目中添加新功能时,典型的工作流程是怎样的?

【核心解析】 需求分析:明确功能目标、输入输出和约束;设计:确定技术方案、模块划分和接口;开发:编码实现功能,遵循项目规范;测试:单元测试、集成测试和端到端测试;部署与监控:上线并监控性能、错误和用户反馈。


Q44: 如何提升模型回答的性能?

【核心解析】 优化提示词设计,提供清晰的指令和上下文;使用更强大的基础模型或进行领域微调;引入缓存机制减少重复计算;采用并行处理或异步调用提高响应速度;通过RAG或工具调用增强模型的知识和行动能力。


Q45: 双路召回是怎样的结构?如何判断召回的结果?

【核心解析】 双路召回指同时使用两种不同召回策略(如基于内容的召回和协同过滤召回);结构上通常并行执行,结果合并;判断召回结果:离线评估指标(召回率、准确率、F1)、在线A/B测试、多样性指标;融合策略(加权、动态融合)


Q46: Agent项目有没有尝试部署到云?

【核心解析】 云部署的架构设计(客户端与服务端分离,服务端调用API);部署流程与工具(如Docker、Kubernetes);云环境下的性能优化与监控;成本与扩展性考量


Q47: 如何判断一个 LLM 业务问题该用 RAG、微调还是规则系统解决?

【核心解析】 知识更新频繁、需引用依据时优先RAG;强确定性约束(如金额、权限、合规)用规则系统兜底;领域风格或格式不稳定时考虑微调;三者非互斥,稳定系统通常是规则兜底、RAG提供证据、LLM做理解和生成;避免所有问题都交给微调或RAG。


Q48: 在业务场景中,如何快速将问题拆解为模型问题和工程问题?

【核心解析】 能定位问题(如知识库脏、召回不准、prompt约束弱、模型不会拒答、指标设计不对);具备端到端思维(数据采集、清洗、标注、训练、评测、部署、监控);关注业务指标、线上延迟、badcase闭环、GPU成本下降;推动上线能力。


Q49: 在 LLM 应用落地中,有哪些推理侧优化技巧?

【核心解析】 KV Cache;continuous batching;量化;prefix cache;路由小模型;不要盲目微调整个模型;优先通过RAG、结构化输出、后校验和数据清洗解决知识更新、格式、证据引用问题;仅当模型能力缺口(复杂分类边界、领域表达习惯、拒答策略)时才考虑微调。


Q50: AI Coding题(冷启商品推荐&线上指标异常排查)你是怎么思考的?

【核心解析】 冷启动问题解决方案(内容特征、探索策略);指标异常排查流程(数据校验、模型性能、特征分布);A/B测试;监控与告警;根因分析


Q51: 平时是否使用AI Coding/AI数据分析?

【核心解析】 AI辅助编程工具(如Copilot);自动化数据分析;效率提升;代码质量;实际应用场景


Q52: 大模型qwen以及后端开发复杂程度会导致消息延迟,怎么解决

【核心解析】 模型推理优化(量化、批处理);异步处理与消息队列;缓存常用响应;负载均衡;流式输出减少等待


Q53: 你的agent还可以用到哪些场景

【核心解析】 智能客服;自动化办公;教育辅导;内容生成;数据分析助手


Q54: 端到端生成式推荐、生成式召回、生成式排序这几个方向各自的代表成果以及侧重是什么?你认为目前哪一块融合得最好或价值最高?

【核心解析】 生成式推荐(如P5、RecLLM)将推荐任务统一为文本生成;生成式召回(如TIGER、SEATER)用生成模型直接生成候选集;生成式排序(如PRP、RankT5)用生成模型进行列表排序;融合最好或价值最高需结合业务场景,通常召回与排序的端到端联合优化潜力较大;评估指标包括Recall、NDCG等,模态对齐可通过对比学习或语义ID实现


Q55: 平时用过哪些 Code Agent?

【核心解析】 熟悉主流 Code Agent 工具(如 Copilot、Codex、Cursor、Devin 等);理解 Code Agent 的核心能力(代码生成、调试、重构、解释);了解 Code Agent 的底层模型与工作流(如 RAG、工具调用);能结合实际场景说明使用体验与局限性


Q56: Redis 缓存穿透、击穿和雪崩分别是什么?如何解决?

【核心解析】 缓存穿透:查询不存在的数据,解决方案有空值缓存、布隆过滤器、加锁或非法请求校验;缓存击穿:热点key过期,解决方案有互斥锁(如singleflight);缓存雪崩:大量key同时过期,解决方案有随机TTL抖动。


Q57: WebSocket 和 SSE 的区别是什么?在项目中如何选择?

【核心解析】 WebSocket是全双工通信,适合双向实时交互;SSE是单向流式传输,适合服务端推送场景;在Agent应用中可用SSE推送分析进度。


Q58: FFmpeg 的性能瓶颈通常在哪里?如何优化?

【核心解析】 瓶颈主要在IO,可利用Redis的IO多路复用优化并发;CPU瓶颈可通过top/htop分析,降低分辨率;磁盘瓶颈通过iostat分析,采用分片上传。


Q59: Java工程和Agent工程的对比,你觉得有哪些区别,有哪些要注意的点

【核心解析】 确定性逻辑 vs 概率性推理:Java工程基于明确规则,Agent工程依赖模型推理,输出不确定;开发范式:Java面向对象、强类型、编译期检查,Agent工程以提示工程、链式调用为主,调试困难;状态管理:Java工程状态通常持久化在数据库,Agent工程需管理对话上下文、记忆和工具调用状态;错误处理:Java通过异常机制,Agent需处理幻觉、工具调用失败、输出格式错误等;部署与监控:Java工程有成熟监控体系,Agent工程需关注模型延迟、Token消耗、安全护栏等


Q60: Agent项目里用的框架是什么

【核心解析】 主流Agent框架:LangChain、LlamaIndex、AutoGPT、MetaGPT、Dify、Coze等;框架选型依据:任务复杂度、工具集成、多Agent协作需求、生态成熟度;框架核心组件:模型调用、工具定义与调用、记忆管理、规划模块;实际项目中的定制化开发与框架局限;框架对开发效率和可维护性的影响


Q61: 系统推理延迟(首 Token 延迟)大概多少?

【核心解析】 首 Token 延迟是衡量 LLM 推理性能的关键指标;受模型大小、硬件、输入长度、网络等因素影响;典型值在几百毫秒到几秒之间;优化方法包括模型量化、KV 缓存、流式输出等;在 Agent 应用中需考虑整体延迟对用户体验的影响。


Q62: 在 Prompt 自动推荐模块中,有哪些优化策略可以提高效果?

【核心解析】 Prompt 推荐需根据任务意图、历史表现和模型反馈动态选择,而非简单模板匹配;优化策略包括:结构化拆分 prompt、高频成功模板的 embedding 检索、低质量提示的压缩和去冗余、不同任务阶段的 prompt 分层;工程上需将 prompt 版本、命中率和失败样本挂钩,持续灰度和回放;系统应能随场景变化自动迭代,而非依赖人工堆文案。


Q63: 设计一个全自动 AI 漫剧创作 Agent,你会怎么搭建?

【核心解析】 拆分为世界观设定 Agent、剧情规划 Agent、角色一致性 Agent、分镜生成 Agent、对白润色 Agent 和评审 Agent;输入需包含题材、时长、角色设定、禁用内容、风格参考和目标受众;维护显式 story state(角色关系、时间线、关键伏笔、已用设定、未回收线索);保证人物前后一致和长剧情闭环,将角色卡和剧情状态外置,避免仅靠 prompt 临时记忆


Q64: 在创作型 Agent 中,如何保证人物前后一致性?

【核心解析】 不能仅靠 prompt 指令;将角色属性拆分为不可变属性(年龄区间、世界观身份、说话风格底色)、弱可变属性和动态状态;通过外置角色卡和剧情状态实现持久化,避免模型越写越飘


Q65: 如果只发第一版 Agent 系统,你会保留哪些最重要的功能?

【核心解析】 保留能形成闭环的核心能力:任务入口、状态管理、一个高价值主流程、少量稳定工具、审计日志和人工接管;延后多角色风格细化、自反思、多轮自动重写、复杂记忆检索等增强功能;主链路需可控、可追踪、可回滚


Q66: 设计一个AI漫剧创作Agent,你会怎么搭?

【核心解析】 可拆分为世界观设定Agent、剧情规划Agent、角色一致性Agent、分镜生成Agent、对白润色Agent和评审Agent;输入需结构化,包括题材、时长、角色设定、禁用内容、风格参考和目标受众;需维护显式story state,包含角色关系、时间线、伏笔、已用设定和未回收线索;最大难点是人物前后一致和长剧情闭环,不能仅靠每轮prompt临时记忆,必须外置角色卡和剧情状态,防止内容偏离


Q67: Coze 新旧两种编排方式的差异是什么,你在设计节点时怎么取舍?

【核心解析】 拖拽式编排适合流程稳定、路径清晰、节点边界明确的场景,如固定审批、FAQ 问答;Agent 化编排适合目标不稳定、路径动态变化、需要中间决策的场景,如多轮任务执行、复杂信息搜集;节点设计应按状态边界和失败恢复边界拆分,而非功能菜单式;节点需输入清晰、输出结构化、失败可恢复;避免一个节点承担过多职责导致难定位难重试。


Q68: 在Agent业务中,如何清晰阐述业务逻辑?请结合实习经历说明。

【核心解析】 能够结构化描述Agent在业务中的角色与流程;理解业务需求到技术方案的映射;强调Agent决策的可解释性;举例说明如何优化业务逻辑


Q69: 为什么在agent方面实践不多

【核心解析】 Agent实践中的常见挑战,如工具调用可靠性、规划能力不足;Agent开发成本与收益权衡;实际业务场景与Agent能力的匹配度;Agent评估与监控的复杂性


Q70: 通过与大模型交互,设计算法解决广告商品预算分配问题,在限定预算下最大化投放 GMV。

【核心解析】 理解电商广告投放基础知识,如 ROI、CTR、CVR 等指标;将问题建模为带约束优化,如线性规划或强化学习;利用大模型生成分配策略或辅助特征工程;设计奖励函数(GMV)和约束(预算);可能需要多轮交互获取市场反馈并调整。


Q71: 简单介绍 LangChain 和 LangGraph,以及它们与 Harness 的区别,为什么 Harness 现在这么火?

【核心解析】 LangChain 是构建 LLM 应用的框架,提供链式调用、工具集成等抽象;LangGraph 是 LangChain 的扩展,支持有状态、多步骤的 Agent 工作流,基于图结构;Harness 可能指特定 Agent 评估或部署平台,强调生产级可靠性、监控和可扩展性;Harness 火的原因可能是简化了 Agent 从开发到部署的全流程,提供企业级特性。


Q72: 如果 RocketMQ 出现消息积压,你会怎样定位?

【核心解析】 区分生产过快、消费变慢或分区热点;分析堆积是持续增长还是短时尖峰;检查消费线程是否阻塞在数据库、RPC、锁竞争、反序列化或重试逻辑;拆解到 Topic、Queue、Consumer Group 和业务键定位热点;结合重试次数、死信比例和消费耗时分布综合排查


Q73: RocketMQ 在业务里最容易被忽略的问题是什么?为什么很多系统用了 MQ 还是会把故障放大?

【核心解析】 消费端副作用没有隔离;消费逻辑同步调用多个下游且失败无限重试;缺乏退避和幂等机制;MQ 只转移压力不自动稳定系统;消费动作需可重试、可中断、可收敛


Q74: 在实际工作中怎么用 AI 工具解决问题?如果跟 AI 工具协作时上下文变长、记忆丢失了怎么办?

【核心解析】 AI工具在开发流程中的应用场景(代码生成、调试、文档等);上下文管理策略:分步记录、摘要生成、关键信息提取;使用外部记忆或持久化存储保存中间状态;设计结构化的交互协议,减少上下文依赖;定期重置或压缩上下文,避免记忆丢失影响任务


Q75: 在AI Infra中,TensorFlow MUSA Extension 是框架层的改动还是 runtime 层的支持?

【核心解析】 MUSA Extension 定位:在 runtime 和插件层做适配,而非修改 TensorFlow 框架本身;主要工作:算子支持、图优化、算子融合;与底层硬件交互:通过 MUSA 驱动和 runtime 实现 GPU 计算;插件机制:利用 TensorFlow 的插件接口注册自定义算子和设备


Q76: 在业务场景中,如何进行Prompt Engineering(PE)?做到什么程度可以停止优化?

【核心解析】 PE的迭代流程:设计、测试、评估、优化;停止标准:达到业务指标阈值、边际收益递减;PE技巧:少样本示例、角色设定、思维链;结合业务场景的特定约束


Q77: 如果模型输出不符合预期,你会怎么办?

【核心解析】 错误分析:定位是数据、模型还是评估问题;调整策略:修改Prompt、增加约束、后处理;模型层面:微调、RLHF;引入安全兜底机制;建立反馈闭环


Q78: 设计一个智能客服Agent,需要根据用户提问进行准确回答,你会如何设计?

【核心解析】 意图识别与任务规划;知识库构建与检索增强生成(RAG);对话状态管理与多轮交互;安全与兜底策略;可观测性与持续优化


Q79: Redis为什么在高并发情况下表现得比较好

【核心解析】 基于内存操作,读写速度极快;单线程模型避免上下文切换和锁竞争;使用IO多路复用技术处理大量并发连接;高效的数据结构如哈希表、跳表等;支持数据持久化和主从复制,保证高可用性


Q80: 请分享一个你在技术实践中遇到的失败经历,并说明你从中学到了什么

【核心解析】 描述具体失败案例,如性能优化导致吞吐量下降;分析失败原因,如未充分评估改动影响;总结教训,如避免盲目统一设计,需理解原有设计意图;强调从失败中学习并改进后续决策;体现复盘和持续改进的意识


Q81: 你平时是如何开展技术研究的?请描述你的研究方法论

【核心解析】 将大任务拆解为小任务,分步推进;通过查阅论文、开源项目等资料快速建立理解;先实践再深入,遇到问题回头补知识;利用AI工具辅助代码理解和问题排查;注重从实践中总结和迭代


Q82: 你接触过哪些新技术或新流程,它们对你的工程协作有什么启发?

【核心解析】 列举具体技术如Docker、CI/CD、Git等;说明它们如何提升协作效率,如环境一致性、自动化测试;强调从个人开发到规范化团队协作的转变;理解工具背后的流程思想,如持续集成与交付;体现对新技术的敏感度和应用能力


Q83: 我们来做一道 AI coding 相关的题目。

【核心解析】 考察代码生成与理解能力;可能涉及 agent 工具调用或规划逻辑;评估 prompt 工程与结构化输出;对 AI 辅助编程的实践认知。


Q84: 介绍你的 agent 实习经历。

【核心解析】 实习中 agent 项目的具体职责与成果;使用的框架与技术栈;遇到的挑战与解决方案;对 agent 实际落地的理解。


Q85: 做过 AI Coding 吗?我们来做一道题。

【核心解析】 AI 辅助编程的实践经验(如使用 Copilot、Codex);编程题考察点(算法、数据结构、代码质量);如何利用 AI 工具提高开发效率;对 AI 生成代码的审查与调试能力。


Q86: 在图优化中,如何识别高频热点算子并进行针对性优化?请举一个具体的例子说明优化手段和效果。

【核心解析】 通过 profiling 或日志分析找出出现次数多且 shape 高频的算子;针对高频 shape 实现 fast path,例如逻辑运算中利用广播避免显式扩展矩阵,减少内存申请和拷贝;优化热点算子虽只占一部分,但整体吞吐可明显提升;需要从具体案例中抽象出优化思路,而非仅依赖自动化脚本。


Q87: 大模型推理中常见的资源瓶颈有哪些?PagedAttention 是如何优化 KV Cache 管理的?

【核心解析】 资源瓶颈包括计算能力(算力)、内存带宽、显存容量(尤其 KV Cache 占用);PagedAttention 通过分页管理 KV Cache,避免固定大块分配造成的显存浪费,提高显存利用率;允许非连续存储,减少碎片,支持更大 batch size 或更长序列;本质是提高资源使用效率。


Q88: Agent框架有哪些?应用场景是什么?

【核心解析】 LangChain、AutoGPT、MetaGPT等框架;应用场景包括自动化办公、代码生成、数据分析、客户服务;框架提供规划、记忆、工具调用等抽象;选择框架需考虑任务复杂度、集成难度和社区生态


Q89: 如何设计一个SQL查询Agent?可能存在的问题及解决方案是什么?

【核心解析】 设计:NL2SQL解析、数据库连接、查询执行与结果解释;问题:SQL注入风险、复杂查询的歧义性、性能优化;解决方案:参数化查询、用户确认机制、查询优化与缓存、错误处理与重试


Q90: 你对市面上主流的agent产品有了解吗?

【核心解析】 了解主流agent产品如AutoGPT、MetaGPT、ChatDev等的功能与架构;能对比不同产品的设计理念与适用场景;理解agent产品在任务自动化、多智能体协作等方面的实际应用;关注产品背后的技术栈与实现难点;具备评估agent产品成熟度与局限性的能力


Q91: 如果不用 Agent,只用规则、检索、模板 SQL,能做到几成效果?为什么还要上 Agent?

【核心解析】 评估非 Agent 方案(规则、检索、模板)在灵活性、复杂推理、动态环境适应上的局限性;量化 Agent 带来的增益(如处理长尾问题、多步推理、工具使用);说明引入 Agent 的成本与收益权衡,包括开发维护成本、延迟、可靠性等。


Q92: Redis 缓存在 Agent 或后端系统中通常放在哪几层?为什么不能只理解成“缓存数据库查询”?

【核心解析】 热点对象缓存层(用户画像、配置快照、知识片段);调度层(延迟任务、限流计数、分布式锁);高性能状态中间层(分离慢数据、热数据、临时状态和协调信息)


Q93: 如果没有热点缓存,系统里的数据通常会从哪里取?代价差异体现在哪?

【核心解析】 数据回源到 MySQL、ES、对象存储、向量检索库或下游 RPC 服务;代价模型不同:数据库擅长精确查但扛不住高频重复访问;缓存降低延迟、减少下游抖动放大、避免雪崩风险


Q94: 如果业务方认为数据库 10ms 和缓存 1ms 的延迟差异不大,为什么还要坚持做缓存?

【核心解析】 热点请求下数据库访问导致连接池争抢、锁竞争和 QPS 放大;缓存减少下游抖动放大,避免数据库变慢沿线程池和连接池扩散;高并发系统关注 P99 和雪崩风险,缓存改变链路脆弱性


Q95: 假如缓存失效后仍然大量回源,且数据库已经变慢,你会优先采取哪些止血措施?

【核心解析】 先做限流和热点隔离;使用 singleflight 或请求合并减少回源;本地缓存兜底、过期时间错峰、热点 key 永不过期加主动刷新;最后考虑数据库索引优化、只读副本、结果裁剪和旁路降级


Q96: 在缓存回源场景中,如何用 singleflight 实现请求合并?请给出示例代码并解释。

【核心解析】 使用 synchronized 对 key 加锁实现单线程查库;双重检查 Redis 避免重复加载;查库后回写缓存并设置过期时间;减少数据库压力,防止缓存击穿


Q97: 如果主表按订单 ID 或用户 ID 分片,但后台需要支持按创建时间、状态、店铺 ID 组合筛选,你会怎么设计?

【核心解析】 引入查询友好的旁路索引层(ES、宽表索引库、查询中间表);将事务主存储与检索友好存储分离;主表负责正确性和写入,索引层负责复杂读查询;通过重放、补偿和定时对账保证最终一致性


Q98: 在Agent项目中,语义意图识别是怎么做的?

【核心解析】 意图识别的常用方法(规则、分类模型、LLM);基于嵌入的语义相似度匹配;少样本或零样本学习;多轮对话中的上下文意图理解;意图识别的评估与迭代优化


Q99: 请选一个你参与的项目,介绍其中的 React 机制是如何设计的,以及在实际应用场景中的表现如何?

【核心解析】 React 机制的核心设计思想(如响应式、组件化、状态管理);实际项目中的架构设计与技术选型;性能优化与可维护性考量;具体业务场景下的表现与局限性


Q100: 在使用AI Coding工具的过程中,你觉得有什么问题或体验不够好的地方

【核心解析】 生成代码的准确性和可靠性不足,可能需要多次修正;对复杂业务逻辑的理解能力有限,容易产生不符合需求的代码;上下文窗口限制导致长代码或跨文件协作困难;缺乏对项目整体架构的理解,生成代码风格不一致;调试和错误处理能力较弱