
腾讯
广告推荐模型算法工程师
广告推荐模型算法工程师
发布于 大约 2 个月前普通员工/个人贡献者
深圳市
高级经验
全职员工
仅现场办公
本科
软件工程
GPU
PyTorch
TensorFlow
推荐系统
CUDA
NCCL
分布式训练
DeepSpeed
广告推荐
AI 估算 · 35k–65k
腾讯高级算法岗,技术难度高,深圳互联网大厂薪资竞争力强,中位数约5万/月。
职位详情
关于这个职位
加入腾讯,你将主导广告推荐模型的Scaling Up,设计超大参数、超长序列的统一建模范式
深度参与新一代AI Infra架构演进,全面拥抱原生PyTorch生态和全GPU训推链路
通过极致的算法与工程协同优化,直接驱动公司营销核心GMV增长
这是一个兼具前沿算法探索与底层系统能力的高阶技术岗位
最低要求
计算机、软件工程或相关专业本科及以上学历,具备扎实的计算机体系结构、操作系统、网络和数据结构基础
极佳的 C++ 和 Python 编程能力,具备复杂系统架构设计能力,代码风格良好,追求极致的系统性能
深入理解 PyTorch/TensorFlow 等主流深度学习框架的底层运行机制(有向无环图优化、内存管理、算子分发等),有定制修改框架底层源码经验者优先
熟悉 GPU 体系结构,熟练使用 CUDA / C++ 编写高性能算子
熟悉 TensorRT、Triton 等推理加速工具链
具备丰富的性能 Profiling 及瓶颈分析经验
熟悉分布式系统的核心理论,深入理解 NCCL、MPI 等通信协议
有 Megatron-LM、DeepSpeed、HugeCTR 等大规模分布式训练框架实战经验者尤佳
了解互联网广告/推荐系统的基本业务链路,熟悉常见的搜广推模型结构(如 DCN、DIN、Transformer 等)
工作职责
模型 Scaling Up:针对推荐大模型(超大参数量、超长序列特征等),设计并实现序列和非序列特征统一建模新范式
新一代架构演进:深度参与广告推荐系统核心 AI 基础设施(AI Infra)的设计与研发,推动从传统架构向基于原生 PyTorch 的新一代推荐训练/推理框架平滑升级
算法与工程 Co-Design:与底层 AI Infra 团队深度协同,深刻理解底层全 GPU 分布式训练的特性,通过“算法适配算力”与“算力支撑算法”的双向优化,最大化模型迭代效率
业务赋能:深入理解广告推荐算法业务线(CTR/CVR预估等),通过底层工程架构和模型算法优化,提升模型实验效率,助力业务指标(收入、GMV等)达成
AI 洞察
优缺点分析
优点
- 腾讯平台拥有海量数据和业务场景,模型迭代影响力大
- 接触推荐系统最前沿的Scaling Up技术和AI Infra架构,技术成长快
- 薪资竞争力强,职业发展空间广阔,可向专家或管理方向深耕
- 算法与工程深度结合,培养全栈技术能力
- 技术难度极高,需同时精通算法与底层工程,学习曲线陡峭
- 竞争激烈,需要持续跟踪最新论文和技术动态
缺点 / 挑战
- 互联网大厂工作节奏快,可能面临较大的项目压力
- 适合有扎实算法和工程背景、热爱挑战、希望在推荐系统领域成为技术专家的资深工程师
角色解读
- 成为推荐系统算法专家,主导大规模模型架构设计与优化
- 向AI Infra方向深入,成为分布式训练与推理系统架构师
- 积累业务理解后转型技术管理者,带领算法团队
- 主导广告推荐模型的Scaling Up,设计超大参数量和超长用户序列的统一建模新范式
- 深度参与AI Infra架构演进,推动从传统框架向原生PyTorch的平滑升级
- 与底层工程团队协同,通过算法与工程的Co-Design优化全GPU分布式训练效率
- 深入业务,通过模型优化直接提升CTR/CVR等核心指标,驱动GMV增长
- 精通C++和Python,具备复杂系统架构设计能力,追求极致性能
- 深入理解PyTorch/TensorFlow底层机制,有修改框架源码经验
- 熟悉GPU体系结构与CUDA编程,能编写高性能算子,掌握TensorRT、Triton等工具链
- 掌握分布式训练核心理论,熟悉NCCL/MPI,有Megatron-LM、DeepSpeed等实战经验
申请策略
- 准备1-2个端到端的推荐系统项目,展示从数据处理到模型部署的完整能力
- 关注腾讯广告技术博客和会议分享,了解团队文化和技术方向
- 突出深度学习框架源码修改或优化经验,如自定义算子、内存管理等
- 详细描述大规模分布式训练项目,包括使用的框架、模型规模、性能提升数据
- 强调GPU编程和性能优化成果,如CUDA算子加速比、Profiling瓶颈分析案例
- 展示推荐系统业务理解,如CTR/CVR模型优化带来的实际指标提升
- 学习Megatron-LM、DeepSpeed等分布式训练框架的架构和使用
- 深入CUDA编程,练习编写高性能算子,熟悉NVIDIA性能分析工具
面试指南
- 从问题定义出发,分析当前瓶颈,提出多种候选方案并对比优劣
- 结合理论基础和实际项目经验,给出具体实现步骤和关键参数选择
- 考虑业务场景,权衡模型效果与计算效率,强调工程落地的可行性
- 请解释PyTorch的Autograd机制,并说明如何对其进行自定义扩展?
- 设计一个千亿参数推荐模型的分布式训练方案,考虑数据并行、模型并行和流水线并行
- 如何优化推荐模型中的长序列特征?请从内存和计算角度分析
- 描述一次你通过性能Profiling发现并解决训练瓶颈的经历
- 介绍一种你熟悉的推荐模型结构(如DCN),并说明其优缺点
职位点评
75
综合评分
腾讯高级算法岗,前沿推荐模型与AI Infra,高成长高回报,WLB不确定。
更适合这类人
该职位最适合以技术成长和业务影响力为核心驱动力的求职者,愿意接受较高的工作强度。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展95
工作生活50
使命价值75
薪资福利
80较高
腾讯薪资在互联网行业具有竞争力,但职位描述未明确薪资和福利,存在一定不确定性。
薪资信号未披露(AI估算:35K-65K/月)
成长发展
95较高
职位聚焦Scaling Up和AI Infra前沿技术,深度参与业务核心,成长空间极大。
技术前沿前沿/新兴技术
技术栈PyTorch、TensorFlow、CUDA、分布式训练、推荐系统、模型缩放、DeepSpeed
业务类型profit_center
工作生活
50较低
仅现场办公,未提及WLB相关信号,互联网大厂通常工作强度较高,但无法从JD明确判断。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值
75中等
互联网广告行业高速增长,技术领先,但社会意义中性,未提及使命驱动。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
腾讯 的其他在招职位
相似职位推荐
Watch Jobs