Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
广告架构高级工程师-Search Ads Infra
立即应聘

广告架构高级工程师-Search Ads Infra

发布于 大约 10 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
PyTorch
TensorFlow
JAX
GPU编程
量化
模型推理
模型压缩
分布式训练

AI 估算 · 35k–65k

字节跳动高级工程师,AI基础架构方向,北京一线大厂,薪资水平较高,综合考虑取中位数5万/月。

职位详情

关于这个职位

该职位负责字节跳动搜索广告系统的大规模分布式训练和推理优化,涉及百亿参数模型和长序列处理

与算法团队紧密合作,推动算法与系统的联合优化,并探索模型压缩、量化等效率提升技术
适合有深度学习框架和系统优化经验的资深工程师

最低要求

获得本科及以上学历,计算机、软件工程等相关专业优先

熟练掌握Linux环境下的C/C++与Python语言,有良好的编程习惯及Coding能力
接触过至少一种机器学习框架(TensorFlow/PyTorch/Jax或其他自研框架)优先
有以下至少一项的背景知识与经验的优先:GPU编程、编译器、大模型训练推理框架
具有独立解决问题的能力,良好的团队合作精神
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

负责100+B参数模型,1M序列长度的大规模分布式训练(DDP/F SDP/TP/SP/PP)和推理支持(RPC框架/vLLM/TRT)

与算法部门深度合作,进行算法与系统的联合优化
负责机器学习效率优化,包括但不限于:量化、剪枝、压缩、蒸馏、特征选择、NAS、编译优化
负责特殊机器学习范式的支持,例如强化学习、联邦学习、图学习、优化器等

AI 洞察

优缺点分析

优点

  • 接触前沿大模型技术,参与百亿参数级别的系统优化,技术成长迅速
  • 字节跳动广告业务核心团队,资源充足,项目影响力大
  • 团队技术氛围浓厚,与顶级算法工程师深度合作
  • 技术栈复杂,需要同时掌握分布式系统、深度学习框架和GPU编程,学习曲线陡峭

缺点 / 挑战

  • 业务压力大,广告系统对性能和稳定性要求极高,可能涉及高强度工作
  • 竞争激烈,对候选人综合能力要求较高
  • 适合有3年以上系统开发经验,对AI基础设施有浓厚兴趣,乐于接受技术挑战的资深工程师

角色解读

  • 技术纵深发展:成为大模型训练推理系统专家,主导核心基础设施架构
  • 横向扩展:覆盖更多AI系统领域,如编译器优化、AI芯片适配等
  • 管理路线:技术能力成熟后可转型技术Leader,带领系统优化团队
  • 负责百亿参数大模型的分布式训练和推理支持,优化训练框架如DDP/TP/PP等
  • 与算法团队合作,进行算法与系统的联合调优,提升模型性能和效率
  • 探索模型压缩、量化、蒸馏等效率优化技术,降低模型部署成本
  • 支持强化学习、联邦学习等新型机器学习范式的系统实现
  • 精通C/C++和Python,具备扎实的编程能力和良好的编码习惯
  • 深入理解至少一种深度学习框架(TensorFlow/PyTorch/Jax),有大规模分布式训练经验
  • 熟悉GPU编程(CUDA)或编译器技术,了解模型推理框架(如vLLM/TRT)
  • 具备独立解决复杂问题的能力和团队协作精神

申请策略

  • 在简历中量化项目成果,例如训练吞吐提升X倍,推理延迟降低Y%
  • 面试前了解字节跳动广告系统的技术架构,准备系统设计类题目
  • 突出分布式训练或推理优化项目经验,尤其是处理过大规模模型(如百亿参数)的实际案例
  • 强调GPU编程或编译器优化相关经历,如CUDA kernel优化、TVM等
  • 展示对深度学习框架(PyTorch/TensorFlow)源码的理解或贡献
  • 补充阅读PyTorch分布式组件(DDP/FSDP)源码,加深对分布式并行策略的理解
  • 学习模型压缩技术(量化、剪枝)并动手实践,如使用NVIDIA TensorRT部署模型

面试指南

  • 对于系统设计类问题,采用STAR法则(情境-任务-行动-结果)并结合具体技术细节
  • 对于技术原理问题,先定义概念,再对比不同方案的优劣,最后结合实际场景给出选择依据
  • 对于优化类问题,采用分析瓶颈→提出方案→实验验证→迭代优化的思路
  • 请解释DDP和FSDP的区别及其适用场景
  • 如何优化一个百亿参数模型的训练效率?请从数据并行、模型并行、流水线并行等角度分析
  • 描述一次你优化模型推理性能的经历,使用了哪些技术?
  • 大模型训练中常见的性能瓶颈有哪些?如何定位和解决?
  • 你对模型量化了解多少?量化对精度的影响如何控制?

匹配度报告

70
综合匹配度

前沿大模型系统岗,薪资和成长性极高,但工作强度大,适合技术驱动型人才。

适合人群
更看重技术成长和薪资回报,对工作强度和节奏适应能力强的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活30
使命价值70

薪资福利匹配

85较高

字节跳动薪酬极具竞争力,但未明确薪资和具体福利,考虑到公司规模和岗位级别,预估薪资偏高。

薪资信号偏高 (35K-65K/月)

成长发展匹配

95较高

该职位聚焦前沿大模型系统优化,技术栈新且深入,个人成长空间极大,但JD未明确培训或晋升通道。

技术前沿前沿/新兴技术
技术栈分布式训练、模型压缩、GPU编程、TensorFlow、PyTorch、Jax、vLLM、TRT
业务类型profit_center

工作生活匹配

30较低

字节跳动工作强度较高,JD无WLB相关信息,且要求高责任心和自驱力,暗示弹性工作时间但可能加班。

工作模式仅现场办公
办公地点科技园/产业园
加班情况明确要求弹性/高强度

使命价值匹配

70中等

广告技术商业价值清晰,属于利润中心,但社会影响力中性,属于技术驱动型岗位。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 直播高级产品经理(激励增长方向)-抖音直播

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 资深架构师(机审方向)-国际化内容安全平台

    字节跳动 · 上海市
    AI 估算 · 50k-70k
  • 豆包AI大模型数据分析-火山方舟MaaS

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 商业产品经理(线索闭环化方向)-抖音生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • AI应用开发工程师-Cross Platform

    字节跳动 · 上海市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 直播高级产品经理(激励增长方向)-抖音直播

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 资深架构师(机审方向)-国际化内容安全平台

    字节跳动 · 上海市
    AI 估算 · 50k-70k
  • 豆包AI大模型数据分析-火山方舟MaaS

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 商业产品经理(线索闭环化方向)-抖音生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • AI应用开发工程师-Cross Platform

    字节跳动 · 上海市
    AI 估算 · 30k-50k