Agent_Application 面试专题手册

💡 本章节共收录 3867 道面试真题，建议每天复习 10-20 题。

Q1: 深挖实习中的AI Agent架构与Java后端落地细节。

【核心解析】 Agent架构设计，如感知-规划-执行循环；Java后端集成LLM的方式，如API调用与异步处理；工具注册与调用机制；状态管理与持久化；性能优化与错误处理；实际业务场景中的挑战与解决方案。

Q2: 提问第一个项目：MinerU相对于传统OCR有什么优势

【核心解析】 MinerU可能结合多模态大模型，不仅提取文字，还能理解文档布局、表格、公式等复杂结构；端到端处理，减少后处理步骤；可能支持语义理解与信息抽取，超越传统OCR的纯文本识别

Q3: 在跨境汇款业务场景下，Agent超时或失败时如何应对，并保证资金安全？

【核心解析】 设计幂等性机制防止重复扣款；采用分布式事务或补偿事务确保数据一致性；实现超时重试与异常回滚策略；利用状态机管理交易生命周期；记录审计日志以便追溯

Q4: langgraph 和 langchain 的区别？为什么选 langgraph？

【核心解析】 LangChain 的链式调用与局限性；LangGraph 的图结构与状态管理；循环与条件分支的支持；与多 Agent 协作的适配性；实际项目中的选型理由

Q5: 在Agent系统中如何设计人工审批断点？

【核心解析】 在关键决策点（如资金操作、内容发布）设置暂停，等待人工确认；提供清晰的上下文信息，使审批者能快速理解当前状态和待审批动作；支持灵活的审批流程，如单人审批、多人会签；记录审批日志，便于审计和回溯；设计超时和默认处理机制，避免流程阻塞。

Q6: 平时用哪些大语言模型？

【核心解析】 列举常用模型如GPT系列、Claude、Gemini、LLaMA、Qwen等；说明各模型的特点和适用场景；提及模型调用方式（API、本地部署）；关注点包括模型能力、上下文长度、成本、安全性等。

Q7: Redis持久化机制有哪些？各自优缺点是什么？

【核心解析】 RDB快照：定时保存内存数据，恢复快但可能丢失最近数据；AOF日志：记录写命令，数据更完整但文件大恢复慢；混合持久化：结合两者优点；需根据数据安全性与性能要求选择。

Q8: 请描述你开发的 Agent 的具体职责、输入和输出。

【核心解析】 明确 Agent 的应用场景和目标；输入格式（如自然语言指令、结构化数据）；输出形式（如动作序列、API 调用、自然语言回复）；内部决策流程（规划、工具调用、记忆利用）。

Q9: 如果让你用 Agent 的方式重新设计这个项目，你会如何考虑？

【核心解析】 识别项目中可自主决策的环节；设计 Agent 的感知-规划-执行循环；选择合适的工具和记忆机制；评估引入 Agent 带来的灵活性与复杂性权衡。

Q10: 请设计一个用户购物 Agent，并说明其工作方式。

【核心解析】 理解用户意图（商品查询、比价、下单）；集成商品搜索、推荐、购物车管理等工具；处理多轮对话和上下文；考虑安全与支付环节的确认机制；异常处理与回退策略。

Q11: 问GUI-Agent项目：背景是什么

【核心解析】 GUI-Agent项目的应用场景与目标；为什么选择GUI交互作为Agent的切入点；项目要解决的具体问题（如自动化操作、辅助用户等）；技术背景与行业需求

Q12: 介绍一下agent实习的项目架构

【核心解析】 Agent项目的整体架构设计（如感知、规划、执行模块）；技术栈与关键组件（LLM、工具、记忆、检索等）；模块间的交互流程与数据流；架构的扩展性与实际部署考虑

Q13: 请介绍你的GUI-Agent项目，包括技术实现、异步训练方法和任务完成评判方式。

【核心解析】 GUI-Agent通过视觉理解和动作预测操作图形界面；技术栈可能包括视觉模型（如ViT）、动作空间定义（点击、输入）和规划模块；异步训练通过多环境并行采样、经验回放和离线策略更新实现；评判标准包括任务成功率、步骤效率、动作准确率；可能使用强化学习或模仿学习，结合人工标注或自动评估。

Q14: 如果让你设计智能体与大模型相关的分布式系统，会从哪些方面进行综合考量？

【核心解析】 系统架构设计（如微服务、事件驱动）；高并发与弹性伸缩；模型服务化与推理优化；数据一致性；容错与监控

Q15: 智能体在高并发场景下可能遇到哪些问题？如何解决？

【核心解析】 模型推理延迟与排队；工具调用超时与重试；状态一致性与会话管理；资源隔离与限流；分布式缓存与消息队列

Q16: 对业务agent的理解，业务背景等

【核心解析】 业务Agent的定义与特点；业务场景下的需求分析；Agent如何与现有业务系统集成；业务Agent的定制化与通用性平衡；业务Agent的评估指标（业务指标、用户满意度等）

Q17: 为什么选择用 LangChain？有没有了解或对比过 LangGraph？LangChain 和 LangGraph 的区别是什么？

【核心解析】 LangChain 的核心优势（链式调用、组件化、生态集成）；LangGraph 的设计理念（图结构、状态管理、循环控制）；两者在复杂 Agent 流程中的适用场景对比；从 LangChain 迁移到 LangGraph 的考量

Q18: 如果入职后让你做一些纯 Agent 链路开发，或者纯 Prompt 调优的工作，你能接受吗？

【核心解析】 对 Agent 链路开发的理解（如工具集成、流程编排）；Prompt 调优的方法论（如少样本、思维链）；对专注性工作的接受度；如何平衡工程与调优的意愿

Q19: 说明项目推进过程中，针对AI相关功能的设计思路以及功能迭代的思考逻辑。

【核心解析】 需求分析：明确AI能解决的核心痛点；原型验证：快速构建MVP并评估效果；迭代优化：基于用户反馈和指标（如准确率、延迟）持续改进；可观测性：埋点监控AI行为；风险控制：设计降级方案和人工兜底

Q20: 说明项目推进过程中，针对AI相关功能的设计思路以及功能迭代的思考逻辑

【核心解析】 需求分析与AI能力匹配；原型验证与可行性评估；功能模块化与可扩展性设计；用户反馈驱动的迭代流程；模型选型与成本控制；评估指标与线上监控

Q21: 这个 Agent 的作用是什么？

【核心解析】 需结合具体项目说明 Agent 的业务目标；阐述 Agent 在自动化流程、信息处理或决策支持中的角色；强调其解决的核心痛点与预期价值。

Q22: 你在B公司做的Agent核心是做什么的？这个Agent实际是在部署什么？Agent是中心化部署还是每台机器一个？Agent和Jenkins的关系是什么？

【核心解析】 Agent的核心功能与业务场景；部署对象与目标环境；中心化与分布式部署的架构差异；Agent与Jenkins的集成方式与职责划分

Q23: 这个过程是基于全量扫描，还是事件驱动？

【核心解析】 全量扫描与事件驱动两种触发机制的差异与适用场景；事件驱动在实时性和资源消耗上的优势；在Agent平台中可能用于故障匹配、配置同步等场景的触发方式选择

Q24: 项目的需求从哪里来？如何将模糊需求拆解为可落地的 Agent 能力？

【核心解析】 需求来自内容安全运营、创作者工具、客服申诉、审核质检等团队；不能直接做成万能问答，需拆解为明确能力如违规识别、规则解释、相似案例检索、改写建议、人工复核摘要、申诉材料生成；每项能力需定义输入、输出和停止条件；违规识别必须输出风险类型、证据片段和置信度；申诉摘要需区分用户陈述和系统证据；拆解粒度需支持工具接入和评测闭环

Q25: 对于项目中具体一个例子拷打：可能出现什么回答，这种回答的原因，调用什么工具，会反馈什么信息，信息代表了什么，以及 agent 如何自我判断出现了这个问题？

【核心解析】 需结合具体业务场景分析 Agent 可能的错误回答（如幻觉、工具调用失败、上下文误解）；原因可能包括检索不准确、prompt 设计缺陷、工具描述不清或模型能力不足；调用的工具可能为搜索引擎、数据库、API 等；反馈信息如错误码、空结果、超时或低置信度；Agent 可通过校验工具返回状态、置信度阈值、结果一致性检查或自我反思机制判断问题。

Q26: AI coding，开发一个符合具体要求的代码自动审核和修复的Agent，限时半小时评论

【核心解析】 理解代码审核与修复的自动化流程；Agent架构设计（如ReAct循环、工具调用）；时间约束下的快速原型实现；代码质量与安全性考量；实际应用中的挑战与解决方案

Q27: 既然 Jenkins 本身就能做自动化，为什么还要引入 Agent？引入 Agent/AI 的价值在哪里？

【核心解析】 区分确定性自动化与智能决策；Agent 能处理非结构化输入和动态目标；Agent 具备推理、规划和自适应能力；Agent 可整合多工具协同，实现复杂工作流；Jenkins 作为执行器，Agent 作为大脑，两者互补。

Q28: 在完全没有规范流程、系统很混乱的情况下，你怎么落地这个 Agent？

【核心解析】 从最小可行场景切入，逐步验证价值；通过 Agent 反向推动流程标准化；利用 LLM 理解混乱环境并提取关键信息；设计灵活的工具接口适配异构系统；建立反馈循环持续优化 Agent 行为。

Q29: SSE 和 WebSocket 有什么区别？在模型推流场景中为什么更倾向于选择 SSE？

【核心解析】 SSE 是服务器到客户端的单向流式推送，基于 HTTP，适合模型生成 token 的流式输出；WebSocket 是全双工协议，适合双向频繁通信场景；SSE 工程上更轻量，与现有 HTTP 基础设施兼容性好，浏览器原生支持 EventSource；WebSocket 需要额外的连接管理、心跳和负载均衡复杂度；只有在需要客户端中途强交互或实时控制时 WebSocket 优势才更明显

Q30: RocketMQ 如何保证消息不丢失？如何处理重复消费和幂等性问题？

【核心解析】 消费端在业务处理成功后再 ack，避免刚收到消息就确认；通过多层机制将丢失概率压到足够低；MQ 语义通常为至少一次，重复消费不可避免；使用唯一业务键（如订单号）进行幂等去重，消费前检查幂等表或 Redis；支付、退款等关键业务消费逻辑必须天然幂等

Q31: 如何将中文需求映射到代码检索？通常需要经过哪些阶段？

【核心解析】 通常包括 query 理解、实体抽取、混合检索、重排和证据扩展等阶段；例如抽取“订单、超时、取消”等业务意图；结合仓库中的函数名、类名等信息进行检索；需要处理中文口语化表达与代码符号的语义差异；最终通过重排和扩展提高检索准确性

Q32: 开发 Agent 时采用什么流程？是否借鉴了现有产品的思路？

【核心解析】 开发流程通常包括需求分析、场景定义、工具选择、提示词设计、记忆与规划模块实现、评测迭代；借鉴现有产品（如 AutoGPT、MetaGPT、Claude 等）的架构设计、工具使用模式和交互范式，结合自身场景进行定制；强调快速原型验证和基于反馈的持续优化。

Q33: 谈谈你对AI的看法以及AI在编程中的应用。

【核心解析】 AI辅助编程（代码生成、补全、审查）的优势与局限；AI Coding工具（如Copilot）的实际问题（代码质量、上下文理解）；人类开发者的不可替代性；未来发展趋势

Q34: 在 Redis 项目中，如何利用 Redis + Token 实现会话管理，并保证多节点部署下的一致性？

【核心解析】 Token 生成与验证机制；Redis 集中存储会话；多节点下的 Session 共享；分布式一致性协议（如 Raft）或缓存同步策略

Q35: 如何利用 Redis 保证高并发场景下的系统稳定性？引入本地缓存后，如何设计多级缓存及读写更新策略？

【核心解析】 Redis 性能优化（连接池、管道）；本地缓存（如 Caffeine）与 Redis 的多级缓存架构；缓存更新策略（Cache-Aside、Write-Through）；数据一致性保证（版本号、延迟双删）

Q36: 如何设计分布式锁？在同时存在本地缓存和分布式缓存的情况下，如何保证数据一致性？

【核心解析】 基于 Redis 的分布式锁实现（SETNX、Redlock）；本地缓存与分布式缓存的同步机制；缓存双写一致性方案；锁的粒度与性能权衡

Q37: 大流量冲击下 Redis 被打满，如何设计系统降级方案以防止雪崩？

【核心解析】 限流与熔断机制；缓存降级策略（返回默认值、静态化）；热点数据预加载；Redis 集群扩容与故障转移

Q38: 当数据量和QPS增大时，Agent架构应如何改进？所需的硬件资源大概如何规划？

【核心解析】 高并发场景下的系统瓶颈分析；水平扩展与垂直扩展的策略；负载均衡、缓存、异步处理等优化手段；硬件资源估算（CPU、GPU、内存、存储）。

Q39: 请介绍AI商家运营助手Agent的架构设计。

【核心解析】 整体架构分层（交互层、决策层、工具层）；意图识别与任务规划；商家数据接入与分析；运营动作执行（如优惠券发放、消息推送）；效果评估与反馈循环

Q40: 如果重新设计Agent项目，哪些地方可以改进？

【核心解析】 架构解耦与模块化（如分离规划、执行、记忆）；工具调用的标准化与扩展性；评估与监控体系的完善；多Agent协作与人类交互的优化

Q41: 有没有用过市面上一些Agent产品，印象最深刻的设计有哪些？Agent项目，有没有调研过市面上其他的Agent搭建框架？如果Agent项目用OpenClaw搭建会怎么样？

【核心解析】 主流Agent产品体验（如AutoGPT、GPTs、Coze）；优秀设计点分析（交互体验、任务拆解、工具集成）；常见Agent框架对比（LangChain、AutoGen、CrewAI、OpenClaw）；框架选型考量（易用性、扩展性、生态、性能）；OpenClaw的特点与适用场景

Q42: Agent项目是否有上线部署？

【核心解析】 考察实际工程经验，包括部署环境、服务架构、监控、日志、迭代流程；关注如何保证Agent在生产环境下的稳定性、性能和安全性；可能涉及CI/CD、容器化、负载均衡等

Q43: 在大型项目中添加新功能时，典型的工作流程是怎样的？

【核心解析】 需求分析：明确功能目标、输入输出和约束；设计：确定技术方案、模块划分和接口；开发：编码实现功能，遵循项目规范；测试：单元测试、集成测试和端到端测试；部署与监控：上线并监控性能、错误和用户反馈。

Q44: 如何提升模型回答的性能？

【核心解析】 优化提示词设计，提供清晰的指令和上下文；使用更强大的基础模型或进行领域微调；引入缓存机制减少重复计算；采用并行处理或异步调用提高响应速度；通过RAG或工具调用增强模型的知识和行动能力。

Q45: 双路召回是怎样的结构？如何判断召回的结果？

【核心解析】 双路召回指同时使用两种不同召回策略（如基于内容的召回和协同过滤召回）；结构上通常并行执行，结果合并；判断召回结果：离线评估指标（召回率、准确率、F1）、在线A/B测试、多样性指标；融合策略（加权、动态融合）

Q46: Agent项目有没有尝试部署到云？

【核心解析】 云部署的架构设计（客户端与服务端分离，服务端调用API）；部署流程与工具（如Docker、Kubernetes）；云环境下的性能优化与监控；成本与扩展性考量

Q47: 如何判断一个 LLM 业务问题该用 RAG、微调还是规则系统解决？

【核心解析】 知识更新频繁、需引用依据时优先RAG；强确定性约束（如金额、权限、合规）用规则系统兜底；领域风格或格式不稳定时考虑微调；三者非互斥，稳定系统通常是规则兜底、RAG提供证据、LLM做理解和生成；避免所有问题都交给微调或RAG。

Q48: 在业务场景中，如何快速将问题拆解为模型问题和工程问题？

【核心解析】 能定位问题（如知识库脏、召回不准、prompt约束弱、模型不会拒答、指标设计不对）；具备端到端思维（数据采集、清洗、标注、训练、评测、部署、监控）；关注业务指标、线上延迟、badcase闭环、GPU成本下降；推动上线能力。

Q49: 在 LLM 应用落地中，有哪些推理侧优化技巧？

【核心解析】 KV Cache；continuous batching；量化；prefix cache；路由小模型；不要盲目微调整个模型；优先通过RAG、结构化输出、后校验和数据清洗解决知识更新、格式、证据引用问题；仅当模型能力缺口（复杂分类边界、领域表达习惯、拒答策略）时才考虑微调。

Q50: AI Coding题（冷启商品推荐&线上指标异常排查）你是怎么思考的？

【核心解析】 冷启动问题解决方案（内容特征、探索策略）；指标异常排查流程（数据校验、模型性能、特征分布）；A/B测试；监控与告警；根因分析

Q51: 平时是否使用AI Coding/AI数据分析？

【核心解析】 AI辅助编程工具（如Copilot）；自动化数据分析；效率提升；代码质量；实际应用场景

Q52: 大模型qwen以及后端开发复杂程度会导致消息延迟，怎么解决

【核心解析】 模型推理优化（量化、批处理）；异步处理与消息队列；缓存常用响应；负载均衡；流式输出减少等待

Q53: 你的agent还可以用到哪些场景

【核心解析】 智能客服；自动化办公；教育辅导；内容生成；数据分析助手

Q54: 端到端生成式推荐、生成式召回、生成式排序这几个方向各自的代表成果以及侧重是什么？你认为目前哪一块融合得最好或价值最高？

【核心解析】 生成式推荐（如P5、RecLLM）将推荐任务统一为文本生成；生成式召回（如TIGER、SEATER）用生成模型直接生成候选集；生成式排序（如PRP、RankT5）用生成模型进行列表排序；融合最好或价值最高需结合业务场景，通常召回与排序的端到端联合优化潜力较大；评估指标包括Recall、NDCG等，模态对齐可通过对比学习或语义ID实现

Q55: 平时用过哪些 Code Agent？

【核心解析】 熟悉主流 Code Agent 工具（如 Copilot、Codex、Cursor、Devin 等）；理解 Code Agent 的核心能力（代码生成、调试、重构、解释）；了解 Code Agent 的底层模型与工作流（如 RAG、工具调用）；能结合实际场景说明使用体验与局限性

Q56: Redis 缓存穿透、击穿和雪崩分别是什么？如何解决？

【核心解析】 缓存穿透：查询不存在的数据，解决方案有空值缓存、布隆过滤器、加锁或非法请求校验；缓存击穿：热点key过期，解决方案有互斥锁（如singleflight）；缓存雪崩：大量key同时过期，解决方案有随机TTL抖动。

Q57: WebSocket 和 SSE 的区别是什么？在项目中如何选择？

【核心解析】 WebSocket是全双工通信，适合双向实时交互；SSE是单向流式传输，适合服务端推送场景；在Agent应用中可用SSE推送分析进度。

Q58: FFmpeg 的性能瓶颈通常在哪里？如何优化？

【核心解析】 瓶颈主要在IO，可利用Redis的IO多路复用优化并发；CPU瓶颈可通过top/htop分析，降低分辨率；磁盘瓶颈通过iostat分析，采用分片上传。

Q59: Java工程和Agent工程的对比，你觉得有哪些区别，有哪些要注意的点

【核心解析】 确定性逻辑 vs 概率性推理：Java工程基于明确规则，Agent工程依赖模型推理，输出不确定；开发范式：Java面向对象、强类型、编译期检查，Agent工程以提示工程、链式调用为主，调试困难；状态管理：Java工程状态通常持久化在数据库，Agent工程需管理对话上下文、记忆和工具调用状态；错误处理：Java通过异常机制，Agent需处理幻觉、工具调用失败、输出格式错误等；部署与监控：Java工程有成熟监控体系，Agent工程需关注模型延迟、Token消耗、安全护栏等

Q60: Agent项目里用的框架是什么

【核心解析】 主流Agent框架：LangChain、LlamaIndex、AutoGPT、MetaGPT、Dify、Coze等；框架选型依据：任务复杂度、工具集成、多Agent协作需求、生态成熟度；框架核心组件：模型调用、工具定义与调用、记忆管理、规划模块；实际项目中的定制化开发与框架局限；框架对开发效率和可维护性的影响

Q61: 系统推理延迟（首 Token 延迟）大概多少？

【核心解析】 首 Token 延迟是衡量 LLM 推理性能的关键指标；受模型大小、硬件、输入长度、网络等因素影响；典型值在几百毫秒到几秒之间；优化方法包括模型量化、KV 缓存、流式输出等；在 Agent 应用中需考虑整体延迟对用户体验的影响。

Q62: 在 Prompt 自动推荐模块中，有哪些优化策略可以提高效果？

【核心解析】 Prompt 推荐需根据任务意图、历史表现和模型反馈动态选择，而非简单模板匹配；优化策略包括：结构化拆分 prompt、高频成功模板的 embedding 检索、低质量提示的压缩和去冗余、不同任务阶段的 prompt 分层；工程上需将 prompt 版本、命中率和失败样本挂钩，持续灰度和回放；系统应能随场景变化自动迭代，而非依赖人工堆文案。

Q63: 设计一个全自动 AI 漫剧创作 Agent，你会怎么搭建？

【核心解析】 拆分为世界观设定 Agent、剧情规划 Agent、角色一致性 Agent、分镜生成 Agent、对白润色 Agent 和评审 Agent；输入需包含题材、时长、角色设定、禁用内容、风格参考和目标受众；维护显式 story state（角色关系、时间线、关键伏笔、已用设定、未回收线索）；保证人物前后一致和长剧情闭环，将角色卡和剧情状态外置，避免仅靠 prompt 临时记忆

Q64: 在创作型 Agent 中，如何保证人物前后一致性？

【核心解析】 不能仅靠 prompt 指令；将角色属性拆分为不可变属性（年龄区间、世界观身份、说话风格底色）、弱可变属性和动态状态；通过外置角色卡和剧情状态实现持久化，避免模型越写越飘

Q65: 如果只发第一版 Agent 系统，你会保留哪些最重要的功能？

【核心解析】 保留能形成闭环的核心能力：任务入口、状态管理、一个高价值主流程、少量稳定工具、审计日志和人工接管；延后多角色风格细化、自反思、多轮自动重写、复杂记忆检索等增强功能；主链路需可控、可追踪、可回滚

Q66: 设计一个AI漫剧创作Agent，你会怎么搭？

【核心解析】 可拆分为世界观设定Agent、剧情规划Agent、角色一致性Agent、分镜生成Agent、对白润色Agent和评审Agent；输入需结构化，包括题材、时长、角色设定、禁用内容、风格参考和目标受众；需维护显式story state，包含角色关系、时间线、伏笔、已用设定和未回收线索；最大难点是人物前后一致和长剧情闭环，不能仅靠每轮prompt临时记忆，必须外置角色卡和剧情状态，防止内容偏离

Q67: Coze 新旧两种编排方式的差异是什么，你在设计节点时怎么取舍？

【核心解析】 拖拽式编排适合流程稳定、路径清晰、节点边界明确的场景，如固定审批、FAQ 问答；Agent 化编排适合目标不稳定、路径动态变化、需要中间决策的场景，如多轮任务执行、复杂信息搜集；节点设计应按状态边界和失败恢复边界拆分，而非功能菜单式；节点需输入清晰、输出结构化、失败可恢复；避免一个节点承担过多职责导致难定位难重试。

Q68: 在Agent业务中，如何清晰阐述业务逻辑？请结合实习经历说明。

【核心解析】 能够结构化描述Agent在业务中的角色与流程；理解业务需求到技术方案的映射；强调Agent决策的可解释性；举例说明如何优化业务逻辑

Q69: 为什么在agent方面实践不多

【核心解析】 Agent实践中的常见挑战，如工具调用可靠性、规划能力不足；Agent开发成本与收益权衡；实际业务场景与Agent能力的匹配度；Agent评估与监控的复杂性

Q70: 通过与大模型交互，设计算法解决广告商品预算分配问题，在限定预算下最大化投放 GMV。

【核心解析】 理解电商广告投放基础知识，如 ROI、CTR、CVR 等指标；将问题建模为带约束优化，如线性规划或强化学习；利用大模型生成分配策略或辅助特征工程；设计奖励函数（GMV）和约束（预算）；可能需要多轮交互获取市场反馈并调整。

Q71: 简单介绍 LangChain 和 LangGraph，以及它们与 Harness 的区别，为什么 Harness 现在这么火？

【核心解析】 LangChain 是构建 LLM 应用的框架，提供链式调用、工具集成等抽象；LangGraph 是 LangChain 的扩展，支持有状态、多步骤的 Agent 工作流，基于图结构；Harness 可能指特定 Agent 评估或部署平台，强调生产级可靠性、监控和可扩展性；Harness 火的原因可能是简化了 Agent 从开发到部署的全流程，提供企业级特性。

Q72: 如果 RocketMQ 出现消息积压，你会怎样定位？

【核心解析】 区分生产过快、消费变慢或分区热点；分析堆积是持续增长还是短时尖峰；检查消费线程是否阻塞在数据库、RPC、锁竞争、反序列化或重试逻辑；拆解到 Topic、Queue、Consumer Group 和业务键定位热点；结合重试次数、死信比例和消费耗时分布综合排查

Q73: RocketMQ 在业务里最容易被忽略的问题是什么？为什么很多系统用了 MQ 还是会把故障放大？

【核心解析】 消费端副作用没有隔离；消费逻辑同步调用多个下游且失败无限重试；缺乏退避和幂等机制；MQ 只转移压力不自动稳定系统；消费动作需可重试、可中断、可收敛

Q74: 在实际工作中怎么用 AI 工具解决问题？如果跟 AI 工具协作时上下文变长、记忆丢失了怎么办？

【核心解析】 AI工具在开发流程中的应用场景（代码生成、调试、文档等）；上下文管理策略：分步记录、摘要生成、关键信息提取；使用外部记忆或持久化存储保存中间状态；设计结构化的交互协议，减少上下文依赖；定期重置或压缩上下文，避免记忆丢失影响任务

Q75: 在AI Infra中，TensorFlow MUSA Extension 是框架层的改动还是 runtime 层的支持？

【核心解析】 MUSA Extension 定位：在 runtime 和插件层做适配，而非修改 TensorFlow 框架本身；主要工作：算子支持、图优化、算子融合；与底层硬件交互：通过 MUSA 驱动和 runtime 实现 GPU 计算；插件机制：利用 TensorFlow 的插件接口注册自定义算子和设备

Q76: 在业务场景中，如何进行Prompt Engineering（PE）？做到什么程度可以停止优化？

【核心解析】 PE的迭代流程：设计、测试、评估、优化；停止标准：达到业务指标阈值、边际收益递减；PE技巧：少样本示例、角色设定、思维链；结合业务场景的特定约束

Q77: 如果模型输出不符合预期，你会怎么办？

【核心解析】 错误分析：定位是数据、模型还是评估问题；调整策略：修改Prompt、增加约束、后处理；模型层面：微调、RLHF；引入安全兜底机制；建立反馈闭环

Q78: 设计一个智能客服Agent，需要根据用户提问进行准确回答，你会如何设计？

【核心解析】 意图识别与任务规划；知识库构建与检索增强生成（RAG）；对话状态管理与多轮交互；安全与兜底策略；可观测性与持续优化

Q79: Redis为什么在高并发情况下表现得比较好

【核心解析】 基于内存操作，读写速度极快；单线程模型避免上下文切换和锁竞争；使用IO多路复用技术处理大量并发连接；高效的数据结构如哈希表、跳表等；支持数据持久化和主从复制，保证高可用性

Q80: 请分享一个你在技术实践中遇到的失败经历，并说明你从中学到了什么

【核心解析】 描述具体失败案例，如性能优化导致吞吐量下降；分析失败原因，如未充分评估改动影响；总结教训，如避免盲目统一设计，需理解原有设计意图；强调从失败中学习并改进后续决策；体现复盘和持续改进的意识

Q81: 你平时是如何开展技术研究的？请描述你的研究方法论

【核心解析】 将大任务拆解为小任务，分步推进；通过查阅论文、开源项目等资料快速建立理解；先实践再深入，遇到问题回头补知识；利用AI工具辅助代码理解和问题排查；注重从实践中总结和迭代

Q82: 你接触过哪些新技术或新流程，它们对你的工程协作有什么启发？

【核心解析】 列举具体技术如Docker、CI/CD、Git等；说明它们如何提升协作效率，如环境一致性、自动化测试；强调从个人开发到规范化团队协作的转变；理解工具背后的流程思想，如持续集成与交付；体现对新技术的敏感度和应用能力

Q83: 我们来做一道 AI coding 相关的题目。

【核心解析】 考察代码生成与理解能力；可能涉及 agent 工具调用或规划逻辑；评估 prompt 工程与结构化输出；对 AI 辅助编程的实践认知。

Q84: 介绍你的 agent 实习经历。

【核心解析】 实习中 agent 项目的具体职责与成果；使用的框架与技术栈；遇到的挑战与解决方案；对 agent 实际落地的理解。

Q85: 做过 AI Coding 吗？我们来做一道题。

【核心解析】 AI 辅助编程的实践经验（如使用 Copilot、Codex）；编程题考察点（算法、数据结构、代码质量）；如何利用 AI 工具提高开发效率；对 AI 生成代码的审查与调试能力。

Q86: 在图优化中，如何识别高频热点算子并进行针对性优化？请举一个具体的例子说明优化手段和效果。

【核心解析】 通过 profiling 或日志分析找出出现次数多且 shape 高频的算子；针对高频 shape 实现 fast path，例如逻辑运算中利用广播避免显式扩展矩阵，减少内存申请和拷贝；优化热点算子虽只占一部分，但整体吞吐可明显提升；需要从具体案例中抽象出优化思路，而非仅依赖自动化脚本。

Q87: 大模型推理中常见的资源瓶颈有哪些？PagedAttention 是如何优化 KV Cache 管理的？

【核心解析】 资源瓶颈包括计算能力（算力）、内存带宽、显存容量（尤其 KV Cache 占用）；PagedAttention 通过分页管理 KV Cache，避免固定大块分配造成的显存浪费，提高显存利用率；允许非连续存储，减少碎片，支持更大 batch size 或更长序列；本质是提高资源使用效率。

Q88: Agent框架有哪些？应用场景是什么？

【核心解析】 LangChain、AutoGPT、MetaGPT等框架；应用场景包括自动化办公、代码生成、数据分析、客户服务；框架提供规划、记忆、工具调用等抽象；选择框架需考虑任务复杂度、集成难度和社区生态

Q89: 如何设计一个SQL查询Agent？可能存在的问题及解决方案是什么？

【核心解析】 设计：NL2SQL解析、数据库连接、查询执行与结果解释；问题：SQL注入风险、复杂查询的歧义性、性能优化；解决方案：参数化查询、用户确认机制、查询优化与缓存、错误处理与重试

Q90: 你对市面上主流的agent产品有了解吗？

【核心解析】 了解主流agent产品如AutoGPT、MetaGPT、ChatDev等的功能与架构；能对比不同产品的设计理念与适用场景；理解agent产品在任务自动化、多智能体协作等方面的实际应用；关注产品背后的技术栈与实现难点；具备评估agent产品成熟度与局限性的能力

Q91: 如果不用 Agent，只用规则、检索、模板 SQL，能做到几成效果？为什么还要上 Agent？

【核心解析】 评估非 Agent 方案（规则、检索、模板）在灵活性、复杂推理、动态环境适应上的局限性；量化 Agent 带来的增益（如处理长尾问题、多步推理、工具使用）；说明引入 Agent 的成本与收益权衡，包括开发维护成本、延迟、可靠性等。

Q92: Redis 缓存在 Agent 或后端系统中通常放在哪几层？为什么不能只理解成“缓存数据库查询”？

【核心解析】 热点对象缓存层（用户画像、配置快照、知识片段）；调度层（延迟任务、限流计数、分布式锁）；高性能状态中间层（分离慢数据、热数据、临时状态和协调信息）

Q93: 如果没有热点缓存，系统里的数据通常会从哪里取？代价差异体现在哪？

【核心解析】 数据回源到 MySQL、ES、对象存储、向量检索库或下游 RPC 服务；代价模型不同：数据库擅长精确查但扛不住高频重复访问；缓存降低延迟、减少下游抖动放大、避免雪崩风险

Q94: 如果业务方认为数据库 10ms 和缓存 1ms 的延迟差异不大，为什么还要坚持做缓存？

【核心解析】 热点请求下数据库访问导致连接池争抢、锁竞争和 QPS 放大；缓存减少下游抖动放大，避免数据库变慢沿线程池和连接池扩散；高并发系统关注 P99 和雪崩风险，缓存改变链路脆弱性

Q95: 假如缓存失效后仍然大量回源，且数据库已经变慢，你会优先采取哪些止血措施？

【核心解析】 先做限流和热点隔离；使用 singleflight 或请求合并减少回源；本地缓存兜底、过期时间错峰、热点 key 永不过期加主动刷新；最后考虑数据库索引优化、只读副本、结果裁剪和旁路降级

Q96: 在缓存回源场景中，如何用 singleflight 实现请求合并？请给出示例代码并解释。

【核心解析】 使用 synchronized 对 key 加锁实现单线程查库；双重检查 Redis 避免重复加载；查库后回写缓存并设置过期时间；减少数据库压力，防止缓存击穿

Q97: 如果主表按订单 ID 或用户 ID 分片，但后台需要支持按创建时间、状态、店铺 ID 组合筛选，你会怎么设计？

【核心解析】 引入查询友好的旁路索引层（ES、宽表索引库、查询中间表）；将事务主存储与检索友好存储分离；主表负责正确性和写入，索引层负责复杂读查询；通过重放、补偿和定时对账保证最终一致性

Q98: 在Agent项目中，语义意图识别是怎么做的？

【核心解析】 意图识别的常用方法（规则、分类模型、LLM）；基于嵌入的语义相似度匹配；少样本或零样本学习；多轮对话中的上下文意图理解；意图识别的评估与迭代优化

Q99: 请选一个你参与的项目，介绍其中的 React 机制是如何设计的，以及在实际应用场景中的表现如何？

【核心解析】 React 机制的核心设计思想（如响应式、组件化、状态管理）；实际项目中的架构设计与技术选型；性能优化与可维护性考量；具体业务场景下的表现与局限性

Q100: 在使用AI Coding工具的过程中，你觉得有什么问题或体验不够好的地方

【核心解析】 生成代码的准确性和可靠性不足，可能需要多次修正；对复杂业务逻辑的理解能力有限，容易产生不符合需求的代码；上下文窗口限制导致长代码或跨文件协作困难；缺乏对项目整体架构的理解，生成代码风格不一致；调试和错误处理能力较弱

Agent_Application 面试专题手册 ​

Q1: 深挖实习中的AI Agent架构与Java后端落地细节。 ​

Q2: 提问第一个项目：MinerU相对于传统OCR有什么优势 ​

Q3: 在跨境汇款业务场景下，Agent超时或失败时如何应对，并保证资金安全？ ​

Q4: langgraph 和 langchain 的区别？为什么选 langgraph？ ​

Q5: 在Agent系统中如何设计人工审批断点？ ​

Q6: 平时用哪些大语言模型？ ​

Q7: Redis持久化机制有哪些？各自优缺点是什么？ ​

Q8: 请描述你开发的 Agent 的具体职责、输入和输出。 ​

Q9: 如果让你用 Agent 的方式重新设计这个项目，你会如何考虑？ ​

Q10: 请设计一个用户购物 Agent，并说明其工作方式。 ​

Q11: 问GUI-Agent项目：背景是什么 ​

Q12: 介绍一下agent实习的项目架构 ​

Q13: 请介绍你的GUI-Agent项目，包括技术实现、异步训练方法和任务完成评判方式。 ​

Q14: 如果让你设计智能体与大模型相关的分布式系统，会从哪些方面进行综合考量？ ​

Q15: 智能体在高并发场景下可能遇到哪些问题？如何解决？ ​

Q16: 对业务agent的理解，业务背景等 ​

Q17: 为什么选择用 LangChain？有没有了解或对比过 LangGraph？LangChain 和 LangGraph 的区别是什么？ ​

Q18: 如果入职后让你做一些纯 Agent 链路开发，或者纯 Prompt 调优的工作，你能接受吗？ ​

Q19: 说明项目推进过程中，针对AI相关功能的设计思路以及功能迭代的思考逻辑。 ​

Q20: 说明项目推进过程中，针对AI相关功能的设计思路以及功能迭代的思考逻辑 ​

Q21: 这个 Agent 的作用是什么？ ​

Q22: 你在B公司做的Agent核心是做什么的？这个Agent实际是在部署什么？Agent是中心化部署还是每台机器一个？Agent和Jenkins的关系是什么？ ​

Q23: 这个过程是基于全量扫描，还是事件驱动？ ​

Q24: 项目的需求从哪里来？如何将模糊需求拆解为可落地的 Agent 能力？ ​

Q25: 对于项目中具体一个例子拷打：可能出现什么回答，这种回答的原因，调用什么工具，会反馈什么信息，信息代表了什么，以及 agent 如何自我判断出现了这个问题？ ​

Q26: AI coding，开发一个符合具体要求的代码自动审核和修复的Agent，限时半小时评论 ​

Q27: 既然 Jenkins 本身就能做自动化，为什么还要引入 Agent？引入 Agent/AI 的价值在哪里？ ​

Q28: 在完全没有规范流程、系统很混乱的情况下，你怎么落地这个 Agent？ ​

Q29: SSE 和 WebSocket 有什么区别？在模型推流场景中为什么更倾向于选择 SSE？ ​

Q30: RocketMQ 如何保证消息不丢失？如何处理重复消费和幂等性问题？ ​

Q31: 如何将中文需求映射到代码检索？通常需要经过哪些阶段？ ​

Q32: 开发 Agent 时采用什么流程？是否借鉴了现有产品的思路？ ​

Q33: 谈谈你对AI的看法以及AI在编程中的应用。 ​

Q34: 在 Redis 项目中，如何利用 Redis + Token 实现会话管理，并保证多节点部署下的一致性？ ​

Q35: 如何利用 Redis 保证高并发场景下的系统稳定性？引入本地缓存后，如何设计多级缓存及读写更新策略？ ​

Q36: 如何设计分布式锁？在同时存在本地缓存和分布式缓存的情况下，如何保证数据一致性？ ​

Q37: 大流量冲击下 Redis 被打满，如何设计系统降级方案以防止雪崩？ ​

Q38: 当数据量和QPS增大时，Agent架构应如何改进？所需的硬件资源大概如何规划？ ​

Q39: 请介绍AI商家运营助手Agent的架构设计。 ​

Q40: 如果重新设计Agent项目，哪些地方可以改进？ ​

Q41: 有没有用过市面上一些Agent产品，印象最深刻的设计有哪些？Agent项目，有没有调研过市面上其他的Agent搭建框架？如果Agent项目用OpenClaw搭建会怎么样？ ​

Q42: Agent项目是否有上线部署？ ​

Q43: 在大型项目中添加新功能时，典型的工作流程是怎样的？ ​

Q44: 如何提升模型回答的性能？ ​

Q45: 双路召回是怎样的结构？如何判断召回的结果？ ​

Q46: Agent项目有没有尝试部署到云？ ​

Q47: 如何判断一个 LLM 业务问题该用 RAG、微调还是规则系统解决？ ​

Q48: 在业务场景中，如何快速将问题拆解为模型问题和工程问题？ ​

Q49: 在 LLM 应用落地中，有哪些推理侧优化技巧？ ​

Q50: AI Coding题（冷启商品推荐&线上指标异常排查）你是怎么思考的？ ​

Q51: 平时是否使用AI Coding/AI数据分析？ ​

Q52: 大模型qwen以及后端开发复杂程度会导致消息延迟，怎么解决 ​

Q53: 你的agent还可以用到哪些场景 ​

Q54: 端到端生成式推荐、生成式召回、生成式排序这几个方向各自的代表成果以及侧重是什么？你认为目前哪一块融合得最好或价值最高？ ​

Q55: 平时用过哪些 Code Agent？ ​

Q56: Redis 缓存穿透、击穿和雪崩分别是什么？如何解决？ ​

Q57: WebSocket 和 SSE 的区别是什么？在项目中如何选择？ ​

Q58: FFmpeg 的性能瓶颈通常在哪里？如何优化？ ​

Q59: Java工程和Agent工程的对比，你觉得有哪些区别，有哪些要注意的点 ​

Q60: Agent项目里用的框架是什么 ​

Q61: 系统推理延迟（首 Token 延迟）大概多少？ ​

Q62: 在 Prompt 自动推荐模块中，有哪些优化策略可以提高效果？ ​

Q63: 设计一个全自动 AI 漫剧创作 Agent，你会怎么搭建？ ​

Q64: 在创作型 Agent 中，如何保证人物前后一致性？ ​

Q65: 如果只发第一版 Agent 系统，你会保留哪些最重要的功能？ ​

Q66: 设计一个AI漫剧创作Agent，你会怎么搭？ ​

Q67: Coze 新旧两种编排方式的差异是什么，你在设计节点时怎么取舍？ ​

Q68: 在Agent业务中，如何清晰阐述业务逻辑？请结合实习经历说明。 ​

Q69: 为什么在agent方面实践不多 ​

Q70: 通过与大模型交互，设计算法解决广告商品预算分配问题，在限定预算下最大化投放 GMV。 ​

Q71: 简单介绍 LangChain 和 LangGraph，以及它们与 Harness 的区别，为什么 Harness 现在这么火？ ​

Q72: 如果 RocketMQ 出现消息积压，你会怎样定位？ ​

Q73: RocketMQ 在业务里最容易被忽略的问题是什么？为什么很多系统用了 MQ 还是会把故障放大？ ​

Q74: 在实际工作中怎么用 AI 工具解决问题？如果跟 AI 工具协作时上下文变长、记忆丢失了怎么办？ ​

Q75: 在AI Infra中，TensorFlow MUSA Extension 是框架层的改动还是 runtime 层的支持？ ​

Q76: 在业务场景中，如何进行Prompt Engineering（PE）？做到什么程度可以停止优化？ ​

Q77: 如果模型输出不符合预期，你会怎么办？ ​

Q78: 设计一个智能客服Agent，需要根据用户提问进行准确回答，你会如何设计？ ​

Q79: Redis为什么在高并发情况下表现得比较好 ​