2026年面经
2026年面经
面试结果:
投递简历300+,约面20场,面试12场,通过4场,最终拿到1个offer。
| 序号 | 面试时间 | 面试公司 | 面试岗位 | 是否通过 |
|---|---|---|---|---|
| 1 | 3.9 | 快手 | Java开发(KPI面) | 未通过 |
| 2 | 3.11 | B站 | 客户端开发一面 | 通过 |
| 3 | 3.12 | 美团 | Java开发 | 未通过 |
| 4 | 3.12 | B站 | 客户端开发(二面) | 未通过 |
| 5 | 3.13 | 高德 | Java开发 | 未通过 |
| 6 | 3.20 | 美团 | 大模型应用开发 | 未通过 |
| 7 | 3.23 | 快手 | 后端AI开发 | 未通过 |
| 8 | 4.20 | 汇川技术 | Agent应用开发 | 通过 |
| 9 | 4.23 | 汇川技术 | Agent应用开发(二面) | 未通过 |
| 10 | 4.24 | B站 | 开发实习生一面 | 通过 |
| 11 | 4.25 | 南芯半导体 | Agent开发实习生 | 未通过 |
| 12 | 4.27 | B站 | 开发实习生(二面) | 通过 |
以下基于豆包分析录音生成
1 快手JAVA一面 KPI面(30分钟/3.9)
- 问个人情况?
- 问论文,介绍一下论文?
- 讲一下你的项目流程?
- 线程池的参数有哪些,你都是怎么设置的?
- 写一个动态规划算法,一般要注意什么?
- 介绍一下IOC和AOP?
- 介绍一下redis持久化的机制?
- 介绍一下你的项目中是如何构建一个ES搜索服务的?
- 介绍一下JVM内存结构?
算法:反转链表
2 B站客户端一面 (30分钟/3.11)
(一)背景与岗位匹配类
- 你做过客户端开发的工作吗?
- 你是只用过Java,Kotlin这门语言你听过吗?
(二)Java基础 - JVM与垃圾回收类
- 讲一下Java对象的生命周期?
- 谈一下你对垃圾回收的理解?
- 垃圾的定义有两种方法,除了可达性分析还有一种是什么?分别详细讲解这两个方法。
- 垃圾回收算法的种类(新生代、老年代相关GC)有哪些,分别讲讲?
- 详细说说标记清除、标记整理、复制这三种垃圾回收算法?
- Minor GC、Full GC一般分别用哪种垃圾回收算法,结合存活对象/垃圾对象的数量分析?
- 对于Java的内存优化有什么理解和想法?有没有用过内存友好的数据结构?如何避免内存泄漏的经验?
(三)Java基础 - 集合与哈希类
- 用过HashMap吗?讲一下HashMap中哈希的原理?
- equals和==的区别是什么?
- 哈希冲突的解决办法有哪些?HashMap是如何解决哈希冲突的?
- HashMap的初始容量、负载因子分别是什么?为什么初始容量是2的幂次方?为什么负载因子是0.75?
- HashMap是线程安全的吗?
- Hashtable相较于ConcurrentHashMap解决线程安全问题有什么不好的地方?
(四)Java基础 - 并发编程类
- 讲一下你对synchronized的了解?
- 你理解的线程安全是什么?线程安全的三要素是什么?
- synchronized保证了线程安全的哪些特性?它是怎么保证可见性的?
- synchronized可以修饰什么东西?修饰静态方法时锁的是什么?修饰非静态方法时锁的是什么?
- synchronized有哪些特点(可重入、公平性等)?
- synchronized的锁膨胀优化过程是什么?
- 什么是CAS操作?
(五)AI应用与认知类
- 你用过OpenAI、ChatGPT等AI工具吗?你是怎么看这些AI工具的?
- 你具体是怎么用AI工具做项目、写代码的?AI生成的代码占比大概有多少?
- 你觉得使用AI工具存在哪些风险和不顺手的地方?
3 美团JAVA一面(45分钟/3.12)
(一)高并发秒杀系统项目深挖
- 展开讲秒杀系统中多种高并发策略的实现、区别、优缺点,以及不同场景的选型依据;
- 仅判断库存大于零能否解决CAS的ABA问题?不用原子类仅用Integer能否解决ABA问题?分布式场景下如何解决ABA问题?
- 用线程池削峰填谷的好处、坏处分别是什么?线程池队列满了会发生什么?
- 服务器扩容后,单机线程池在分布式场景下会导致什么问题?
- 单机场景下对比synchronized锁、数据库乐观锁、Redis+MQ异步落库三种秒杀方案的优劣;
- 秒杀场景中选择MongoDB而非MySQL的原因?二者核心区别是什么?
- MongoDB的集群部署机制有哪些?数据分片的策略有哪些,该策略的专业名称是什么?
(二)设计模式相关
- 基于责任链模式做的预处理器机制有什么好处?没有该模式会有什么问题?
- 除了责任链模式,还有哪些更好的设计模式解决if-else嵌套问题?为什么选择责任链而非状态机模式?
- 除了责任链、状态机模式,还了解哪些设计模式?
(三)Spring相关
- 选择Spring StateMachine做状态机管理的原因?调研过其他状态机框架吗?该框架的优势是什么?
(四)AI医疗微服务平台项目深挖
- RAG检索增强的好处是什么?没有RAG直接调用大模型会存在什么问题?
- 除了RAG,还有哪些方式能为大模型提供领域上下文?
- 微调有哪些技术手段?
- Nacos作为注册中心的作用是什么?为什么需要注册中心?
- 服务调用时是否需要实时从Nacos拉取服务信息?有什么机制减少对Nacos的请求?
- 注册中心存在什么坏处?如果注册中心挂了,所有服务会不可用吗?
- 注册中心的注册表该如何设计?用什么存储类型/数据结构实现?
- Redis挂了该如何处理?能否用Caffeine做本地注册表?
- Caffeine作为本地注册表的好处、坏处分别是什么?
- 注册中心和本地注册表之间的更新机制是什么?
(五)缓存相关
- 二级缓存(Caffeine+Redis)中,如何解决Redis更新后多节点Caffeine数据不一致的问题?
(六)算法编程题
- 实现二叉树的层序遍历,分析算法时间复杂度;
- 手写线程安全的单例模式(后续因不会换题)。
4 B站客户端二面(20分钟/3.12)
(一)岗位匹配与客户端基础类
- 你有过端上应用级开发/DEMO编写的经验吗?
- 对端上的标准技术栈有了解吗?
- 了解端上的消息通信方案是怎样的吗?
- 安卓中比较常用的本地数据存储方式有哪些?
- 了解端上的一些UI组件吗?
- 对标准的视频播放协议流程有了解吗?
(二)AI核心技术类
- 说说RAG、MCP的技术流程和技术交互栈分别是怎样的?
- 什么是向量化?
- 做向量化匹配时的主要标准是什么?
- MCP协议的本质构成是什么?
- 尝试过在本地部署AI服务吗?
- 部署本地大模型服务时需要注意哪些问题?
(三)服务端高并发与缓存类
高并发业务场景下,设计服务端缓存架构需要注意哪些东西?
(四)方案设计类
如果要做本地数据库的升级方案,过程中需要注意哪些问题?
(五)项目与技术分享类
有没有做过有趣/有技术深度的东西,可以做基础分享?
5 高德JAVA一面(55分钟/3.13)
(一)AI医疗微服务平台项目深挖
- 如何对大模型的回答和行为进行约束?
- 使用提示词(Prompt)时需要注意哪些要点?
- 若大模型给出错误医疗建议,如何从系统层面发现/拦截?
- 如何解决大模型对话的上下文超限(无法回话)问题?
- 图片上传时若出现图片过大、超时问题,该如何解决?
- 设计C端多张大图同时上传的方案,该如何设计?
- 数据量特别大时,分页查询该如何优化(深度分页问题)?
- 该医疗系统能承受的QPS是多少,如何测试?
(二)数据库核心知识
- MySQL中binlog的作用是什么?有几种模式,分别是什么?
- MongoDB和MySQL的核心区别是什么?
- MySQL的索引有哪些类型,分别有什么特点?
- 聚簇索引和非聚簇索引的区别是什么?
- B+树作为索引结构的核心特点是什么,与哈希表、B树的区别?
(三)并发编程与锁
- synchronized锁和Redis分布式锁的区别及各自原理?
- 使用线程池的注意事项有哪些,核心参数该如何设置?
- Java为何会出现并发问题,需要用锁来处理?
- JVM中工作内存和主内存的区别是什么?
- 若在Controller中定义int字段,每次请求对其+1会出现什么问题?
- Java对象头的作用是什么,与锁有什么关联?
(四)MQ核心知识
如何保证MQ中的消息不丢失?
(五)高并发秒杀系统项目深挖
- 高并发秒杀系统的整体设计流程是什么?
- 秒杀系统中状态机的具体状态有哪些,依靠什么事件流转?
- 为什么采用状态机模式处理秒杀业务,与传统写法相比的好处是什么?
(六)JVM核心知识
- 哪些对象会进入JVM的老年代?
- 若新生代内存不足,会如何处理?
(七)算法编程题
将一个从小到大、一个从大到小的两个数组,合并成一个整体从小到大的新数组。
6 美团大模型应用开发一面(一个小时/3.20)
(一)Java后端核心基础
- 讲解Redis跳表的底层数据结构,以及Redis为何选用跳表而非B+树、红黑树等数据结构?
- 简述红黑树的核心规则和特性?
- 介绍Java的类加载机制,核心步骤有哪些?
- 讲解Java的双亲委派机制,包含哪些类加载器、核心原理及设计好处?
(二)AI医疗微服务平台项目深挖
- 详细介绍AI医疗微服务平台的核心功能,重点讲RAG的落地实现?
- 项目中图像识别功能的识别对象、核心目的是什么?
- 自定义Memory组件的作用是什么,为何选用MongoDB存储对话上下文而非MySQL?
- 医疗问诊场景下的提示词工程体系是如何构建的?
- 除了角色定义、结构化输出约束,提示词工程还有哪些优化方法?
- RAG知识库的数据源来自哪里?
- 各类医疗文档(PDF/Word/TXT)如何转化为RAG的知识库,核心步骤是什么?
- 你认为当前这个医疗平台存在哪些优化点、做得不好的地方?
- 什么是大模型幻觉问题,你的项目中是如何尝试解决的?
- 该医疗平台在医疗问诊场景下对用户的核心价值是什么?
(三)高并发秒杀系统项目
秒杀系统是否和AI做了结合,具体是如何结合的?
(四)AI工具使用与认知
- 了解RAG、Agent吗?是否实际做过Agent相关开发?
- 日常使用AI编程工具(如Coding)的频率和方式是什么?
- AI生成代码的质量如何,使用过程中遇到了哪些问题,如何解决?
(五)算法编程题
- 根据指定字符串构建多叉树;
- 手写算法题:给定整数数组,找出最大子数组和;
- 要求阐述算法思路并完成代码实现。
7 快手 后端AI开发(一个小时/3.23)
(一)实习与个人基础信息
- 目前是否在校,多久能到岗实习、实习时长?
- 学校是否有其他事务(如论文)影响实习?
(二)AI医疗微服务平台项目深挖
- 挑一个核心项目详细介绍,重点讲核心功能和技术落地;
- 项目中提示词工程的编写、调优有哪些心得?
- 详细说说RAG的具体工作流程?
- 对Milvus向量数据库做过性能压测吗?单次请求耗时、读写QPS有关注吗?是否看过官方性能评测?
- 如何评测RAG返回回答的质量,有哪些具体方法?
- 为提升回答精准度做了哪些优化?
(三)大模型基础原理
- 了解大模型的Transformer架构吗?简单说说核心组成;
- Transformer架构的出现解决了传统模型(RNN/CNN)的什么问题?为什么传统模型会出现该问题?
- CNN中是否有注意力机制?
(四)Java核心基础与新特性
- 开发主要用Java,使用的版本是什么?Java 8/11/17/21有哪些新特性,在编码中实际用过哪些?
- Lambda表达式的底层实现原理是什么?
- 了解Java 21的虚拟线程吗?和守护线程有什么关联?
(五)JVM/并发/集合核心原理
- ThreadLocal在线程池使用中为什么会出现内存泄漏,如何避免?
- 介绍AQS的核心设计思路,以及它在ReentrantLock中的应用?
- HashMap在Java 8中的扩容机制,如何保证扩容效率?
- 了解Java 21的垃圾收集器吗?对比G1和CMS的适用场景?
- 线上监控发现JVM堆内存有问题,该如何排查?用到哪些工具?
(六)数据库/Redis核心原理
- MySQL的MVCC是如何实现的?
- MySQL的读已提交和可重复读隔离级别有什么区别?分别如何实现?
- Redis在项目中主要用做什么?用到了哪些数据结构?
- Redis的ZSet底层数据结构是什么?详细讲讲跳表的原理和优势?
(七)AI技术认知与算法编程
- 平时如何学习AI相关技术?现阶段你认为比较前沿的AI技术/产品有哪些?是否实际实践过?
- 如何理解大模型的Skills?
- 若来快手实习,能否接受主要做提示词工程、模型调优/训练相关的AI开发工作?
- 算法编程题:实现大数相加功能(字符串形式的两个大数字相加,避免溢出),并阐述大数相乘的实现思路。
8 汇川技术 Agent应用开发一面(20分钟/4.20)
1. 爬虫与数据采集模块
- 介绍一下自动爬取新闻的整体流程?
- 网页改版导致DOM结构变化、解析失败,你有什么监控机制?如何快速定位、修复?
- 新闻时效性要求高,你如何保证数据最新?
- 定时任务4小时跑一次,任务挂掉/异常如何保证高可用?靠人工盯着吗?
2. RAG 评估与指标
- 你项目里说的 相关性、准确性 这两个指标,计算公式是什么?
- 用RAGAS评估时,具体是怎么计算的?
3. Agent 工具扩展与热更新
- 新增一个“获取最新论文”的工具,需要改哪些代码?服务要不要重启?
- 你提到用MCP做可扩展工具系统,MCP支持工具热加载吗?
- MCP 模块和你内部 LangGraph 节点是什么关系?
- 把MCP去掉,系统还能跑吗?
- 既然能跑,为什么还要做MCP?对你这个Agent系统本身的业务价值是什么?
4. Agent 异常与容错机制
- 工具调用失败怎么处理?
- 工具循环调用(死循环)怎么解决?
9 汇川技术 Agent应用开发二面(20分钟/4.23)
1. RAG 评估与指标
- 你是如何对新闻问答系统做评估的?
- 你提到的准确率 90%+ 是怎么计算的?指标具体是什么?
- 大模型评估指标(忠实度、相关性等)为什么能达到这么高?
2. 大模型幻觉治理(核心追问)
- 你主要靠什么方法降低模型幻觉?
- 召回文档不准确、包含无效信息时,怎么避免模型据此产生幻觉?
- Query 改写和降低幻觉有什么直接关系?
- 微调为什么能降低幻觉?原理是什么?
- 新闻问答必须严格依据召回内容,不能用模型固有知识,你怎么强约束?
3. 提示词工程与方法论
- 提示词不能只笼统说“写得更好”,你用过哪些具体方法论?(如 CoT、引用原文、标注来源等)
- RAG 上下文、召回结果在提示词里怎么组织更有效?
4. MCP 协议与工具调度
- MCP 和提示词是什么关系?
- 当工具数量极多(上千个)时,如何让模型精准选对工具?
- 工具描述过长占满上下文,怎么解决?
10 B站 开发实习生一面(35分钟/4.24)
1. 基础信息与求职意向
- 做个简短自我介绍。
- 课程多吗?能否到上海实习?
- 有无实习经历?
- 目标岗位是什么?(Agent / Java后端)
- 平时编码用什么工具、AI辅助工具?
- 手写代码多吗?
2. 算法题考察
- 算法题:和为n的完全平方数最少数量(类似279.完全平方数)
3. AI新闻问答Agent项目深挖
- 项目思路来源、是否网上教程或自己设计?
- 技术选型:为什么选 LangGraph,不选 LangChain?
- 最终实现效果、部署情况?
- 爬虫逻辑:离线还是实时?数据源?
- 检索召回怎么做?(向量、ES、混合检索)
- 多实体、多主题查询如何分别召回?(如 GPT vs DeepSeek)
- RAG 准确率 90%+ 如何评测?用了什么指标?
- 项目代码量大概多少?自己手写占多少?
- MCP 服务用什么语言实现?作用是什么?
11 南芯半导体 Agent开发实习生(45分钟/4.25)
1. 学习经历与入门过程
- 从什么时候开始接触 AI?学习路径与方式是什么?
- Agent 项目从0到1是如何开始、如何学习、如何落地的?
2. 医疗服务平台项目深挖
- 做医疗平台的初衷是什么?为什么选医疗方向?
- 整体架构思路与设计原因是什么?技术栈为什么这么选?
- 患者问答哪些走大模型、哪些走后台流程,如何区分?
- 关键词路由医疗问答的缺陷是什么?如何解决动态知识库更新?
- 平台除了对话和 RAG,还实现了哪些后端功能?
3. AI 新闻问答 Agent 项目深挖
- 从0到1的完整流程、框架构思、选型原因?
- 混合检索(向量+ES+BM25+Rerank)具体如何实现?
- 评估指标与评测过程是什么?数据是否可信?
- 三层记忆系统(短期/中期/长期)如何实现?和上下文管理的关系?
- LangChain、LangGraph 分别在项目里承担什么作用?
- 调试流程如何保证每一步符合预期?
- MCP 工具注册、作用、调用逻辑是什么?
- 项目代码量、手写占比、开发周期?
- 你在项目里最大价值是什么?
- 项目是否上线?数据存储、用户管理、权限如何做?
4. 技术广度与工程化
- 了解过哪些开源 RAG/Agent 组件?低代码平台?
- 除了 RAG,还有哪些技术解决幻觉?
12 B站 开发实习生二面(25分钟/4.27)
1. AI 新闻问答项目深挖
- 介绍一下你的 AI 新闻问答系统。
- 数据来源是什么?爬虫是自己写的还是 AI 写的?是否用到 RSS?
- 为什么不直接用 Tavily 这类联网搜索 API,而要自己做爬虫 + RAG?
- 项目来源是什么?是作业、教程,还是兴趣驱动?
- 项目初期你是怎么定目标、定需求的?
- 接入微信用的是 OpenCopilot 吗?用的什么模型?
- 开发代码主要用什么工具?是否使用 AI 辅助编码?
2. 场景题:入职第一天排查线上问题(核心重点)
- 给你:代码库 + 文档 + MCP 工具(日志/DB查询),第一天入职怎么排查线上问题?
- 为什么要用 grep 搜代码,而不是用 MCP 工具?
- 你不懂业务,AI 给了你4个原因和方案,你如何判断 AI 结论可信?
- 如果项目是 Go 语言,你完全看不懂,怎么保证 AI 结论正确?
- 如果是前后端协作项目,你也不懂前端,怎么处理?