
字节跳动
抖音搜索算法工程师-大模型应用
抖音搜索算法工程师-大模型应用
发布于 大约 7 小时前普通员工/个人贡献者
北京市
中级经验
全职员工
仅现场办公
学历未注明
机器学习
深度学习
NLP
强化学习
RAG
搜索引擎
多模态
SFT
数据合成
大语言模型
AI 估算 · 30k–50k
涉及大模型前沿技术,岗位竞争力强,薪资在互联网行业属于头部水平。
职位详情
关于这个职位
该职位负责将大模型与搜索引擎深度融合,推动AI搜索全链路创新,包括AI问答、语义相关性、多模态理解等
你将参与大规模数据构建、LLM后训练(SFT/RL/RAG)以及智能Agent等前沿探索
适合对大语言模型和搜索技术有强烈兴趣的算法工程师,能够接触最前沿的技术挑战
最低要求
熟悉机器学习/深度学习算法并有应用模型解决实际问题的经验
对大语言模型、新兴技术有好奇心,学习能力强有创新能力
良好的沟通协作能力,能和团队一起探索新技术,推进技术进步
具备敏锐的业务和数据问题发现能力,以及优秀的分析和解决问题的能力
工作职责
探索搜索引擎与大模型、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包括不限于AI问答/AI搜、语义相关性、视频内容理解、生成创作、智能评测等
构建大规模高质量数据(数据建设、数据合成等),训练和优化AI搜索模型,包括LLM post-train(SFT、RL、LongCoT、个性化对齐),回答富媒体化(图片、视频、自由画布),多模态问答(视频理解、VQA、VLM)等
探索推进AI搜索前沿进展,包括智能Agent、Deep Research、Planning、工具建设和调用等
优先资格
熟悉LLM、NLP相关的算法和技术,熟悉SFT、RL、RAG等大模型相关算法者优先
研究能力优秀、具备前沿探索能力,有对应领域顶会论文优先
优秀的代码能力、数据结构和基础算法功底,ACM/ICPC、Top Coder、Kaggle等比赛获奖者优先
AI 洞察
优缺点分析
优点
- 站在AI搜索和大模型技术最前沿,参与行业变革,技术积累价值高
- 字节跳动平台资源丰富,数据量大,能够快速验证和迭代想法
- 团队技术氛围浓厚,鼓励创新,有较多机会接触最新研究并落地
- 技术迭代迅速,需要持续学习,保持对前沿技术的敏感度
- 竞争激烈,需要较强的抗压能力和自我驱动力
缺点 / 挑战
- 涉及系统全链路优化,工程复杂度高,对综合能力要求较高
- 适合对AI搜索和大模型充满热情、喜欢挑战技术难题、具备较强算法和工程能力的求职者
角色解读
- 技术纵深发展:从算法工程师逐步成长为AI搜索领域的专家,深入掌握大模型训推优化、多模态融合等核心技术
- 横向拓展:可向AI产品经理、技术负责人等角色转型,结合业务需求推动AI创新
- 学术与工程结合:有机会产出顶会论文,或参与开源社区,提升行业影响力
- 将大模型技术(如LLM、多模态)应用到搜索引擎中,提升AI搜索的智能化水平,如AI问答、语义相关性、视频内容理解等
- 负责构建大规模高质量训练数据,并通过SFT、RL、RAG等方法训练和优化AI搜索模型,包括回答富媒体化、多模态问答等
- 探索AI搜索的前沿方向,如智能Agent、Deep Research、Planning等,推动技术迭代和产品落地
- 扎实的机器学习/深度学习算法基础,能够应用模型解决实际问题,熟悉大语言模型相关技术(如SFT、RL、RAG)
- 较强的工程实现能力,包括数据处理、模型训练、系统优化,以及优秀的代码能力(Python/C++等)
- 良好的沟通协作能力,能够与团队共同探索新技术,推动技术方案落地
申请策略
- 面试前深入了解字节跳动AI搜索产品(如头条搜索、抖音搜索)的功能和技术特点,思考可改进方向
- 准备一个完整的项目案例,从问题定义、数据准备、模型训练到效果评估,展示你的系统性思维
- 突出大模型相关项目经验,如LLM微调、RAG、多模态模型训练等,并具体说明你的贡献和效果
- 强调算法竞赛获奖、顶会论文或开源贡献,体现研究能力和工程实力
- 展示对搜索场景的理解,例如如何优化相关性、提升回答质量等
- 系统学习LLM后训练技术(SFT、RLHF、DPO等)和RAG框架,动手实践小规模项目
- 熟悉信息检索基础(如BM25、向量检索)和常见深度学习框架(PyTorch、TensorFlow)
- 补充多模态模型(如CLIP、LLaVA)和Agent相关知识
面试指南
- STAR原则:描述背景、任务、行动和结果,突出技术难点和自己的贡献
- 对比分析:对于开放性问题,先列举多种方案,比较优劣,再给出你的选择理由
- 工程思维:注重系统设计和数据流,考虑实际部署的效率和可扩展性
- 请详细讲讲你在大模型微调(SFT/RL)方面的经验,包括数据构建、训练技巧和效果评估
- 如何将大模型应用到搜索引擎中?可以举例说明语义相关性或AI问答的优化方案
- 请解释RAG的工作原理,以及在实际应用中面临的挑战和解决方案
- 如果让你设计一个端到端的AI搜索系统,你会考虑哪些关键模块?
- 你如何看待多模态(图像、视频)在搜索中的作用?请描述一个你实现过的多模态项目
匹配度报告
69
综合匹配度
字节跳动AI搜索算法岗,前沿大模型技术,薪资有竞争力,但工作强度大、WLB一般。
适合人群
该职位最适合重视技术成长和前沿探索、愿意为技术突破付出努力的求职者,对工作生活平衡要求较高的求职者需谨慎考虑。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70
薪资福利匹配
75中等
薪资在互联网头部水平,但未在JD中明确列出具体数字或福利;字节跳动整体福利齐全,但岗位压力较大,稳定性一般。
薪资信号未披露(AI估算:30K-50K/月)
成长发展匹配
90较高
该岗位位于AI搜索和大模型的最前沿,技术含量高,涉及大量前沿技术(大模型、多模态、强化学习等),成长空间巨大。JD中虽未明确提及培训或晋升,但字节跳动内部技术分享和晋升体系较完善。
技术前沿前沿/新兴技术
技术栈大语言模型、多模态、机器学习、强化学习、SFT、RL、RAG、LLM、VQA、VLM
业务类型profit_center
工作生活匹配
40较低
仅现场办公,且字节跳动通常工作强度较大,JD未提及弹性工作或WLB信息,加班文化可能存在。
工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
使命价值匹配
70中等
AI搜索具有较高社会影响力,推动信息获取效率提升,但岗位未明确提及使命感;行业处于高速增长期。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs