Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
机器学习研发工程师-搜索架构
立即应聘

机器学习研发工程师-搜索架构

发布于 大约 7 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
学历未注明
软件工程
PyTorch
TensorFlow
LLM
CUDA
GPU编程
DeepSpeed
vLLM
TRT-LLM
Megatron

AI 估算 · 25k–45k

该职位为字节跳动搜索架构核心岗位,技术难度高,GPU编程和LLM经验稀缺,上海一线城市薪资水平较高,综合市场行情估算。

职位详情

关于这个职位

该职位负责抖音及国际化短视频搜索场景中机器学习与深度学习架构的设计与实现,涉及模型性能优化、GPU计算加速和算子库开发

你将接触文本相关性、多模态、Wide&Deep、LLM等前沿模型,并参与推理框架和分布式训练框架的优化工作
适合有扎实计算机基础、热爱深度学习工程化的候选人

最低要求

掌握扎实的计算机基础知识,深入理解数据结构、算法和操作系统知识

有强烈的求知欲,快速学习和沟通能力
编程能力扎实,有良好的编程习惯

工作职责

参与抖音&国际化短视频搜索场景下机器学习和深度学习架构的设计与实现

关注文本相关性模型、多模态、Wide&Deep模型、LLM模型等深度学习模型在搜索场景中的性能和成本优化
提高模型训练效率,加速推理性能,优化GPU吞吐
设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,充分利用GPU并行计算能力,支持各种模型在不同硬件上的构建和部署

优先资格

熟悉主流的深度学习框架(Pytorch、Tensorflow)

熟悉主流高性能并行编程技术,有GPU编程经验(CUDA或Triton)
熟悉vLLM,TRT-LLM等大模型推理框架,熟悉大模型并发推理原理
熟悉FSDP、DeepSpeed、Megatron等业界主流分布框架的使用和原理

AI 洞察

优缺点分析

优点

  • 参与核心业务(抖音搜索),技术影响力大
  • 接触前沿技术(LLM、多模态、高性能计算),技能积累快
  • 公司平台大,资源充足,薪资福利有竞争力
  • 技术栈深度要求高,需要持续学习和跟进最新技术
  • 团队内卷程度高,需要较强的抗压能力
  • 适合技术功底扎实、对深度学习工程化有热情、渴望在大型互联网公司核心业务中成长的工程师

缺点 / 挑战

  • 搜索场景对性能和延迟有极高要求,工作压力可能较大

角色解读

  • 技术方向:从模型优化工程师逐步成长为系统架构师或AI基础设施专家
  • 管理方向:可向技术Leader或团队负责人发展
  • 业务方向:深入理解搜索业务,成为搜索算法与工程结合的专家
  • 设计并实现抖音/短视频搜索场景下的机器学习与深度学习架构
  • 优化文本相关性、多模态、Wide&Deep、LLM等模型的性能与成本
  • 通过GPU并行计算、算子开发提升训练和推理效率
  • 扎实的计算机基础,精通数据结构、算法和操作系统
  • 熟练使用Python,良好的编程习惯
  • 熟悉深度学习框架(Pytorch/Tensorflow)以及GPU编程(CUDA/Triton)

申请策略

  • 了解字节跳动搜索团队的技术博客和开源项目,展示技术热情
  • 准备一个关于模型性能优化或算子开发的案例,清晰描述问题和方案
  • 突出在深度学习模型部署、性能优化方面的项目经验
  • 展示GPU编程(CUDA)或分布式训练框架(DeepSpeed等)的实际使用经历
  • 强调对搜索或推荐系统的理解,以及优化效果的数据
  • 深入学习vLLM、TRT-LLM等大模型推理框架的使用和原理
  • 补充LLM相关的基础知识,如Transformer架构、显存优化等
  • 练习系统设计,尤其是高并发、低延迟的在线服务架构

面试指南

  • 对于性能优化问题,采用“问题分析→瓶颈定位→方案设计→效果评估”的框架
  • 涉及分布式训练时,从通信开销、显存管理、并行策略三个角度展开
  • 系统设计类问题,先明确需求,再给出架构,最后讨论权衡和备选
  • 如何优化一个Transformer模型的推理速度?
  • 解释CUDA编程中的grid, block, thread概念,并给出一个矩阵乘法的kernel示例
  • 大规模分布式训练中,如何解决显存不足问题?
  • 描述FSDP和DeepSpeed ZeRO-3的区别和适用场景
  • 在搜索场景下,如何处理长尾查询的延迟优化?

匹配度报告

73
综合匹配度

字节搜索核心岗,前沿技术栈,薪资优厚,但WLB一般

适合人群
该职位最适合重视技术成长和薪资回报的求职者,但需要接受一定的工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活45
使命价值70

薪资福利匹配

85较高

字节跳动提供有竞争力的薪资和福利,IPO后公司稳定,薪资处于市场偏高水平。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

92较高

技术栈前沿(LLM、GPU、分布式训练),团队技术氛围浓厚,个人成长空间大。

技术前沿前沿/新兴技术
技术栈LLM、GPU编程、CUDA、vLLM、TRT-LLM、DeepSpeed、Megatron
业务类型profit_center

工作生活匹配

45较低

上海核心地段办公,但互联网公司通常加班较多,JD未明确提WLB。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

搜索是互联网核心业务,影响亿级用户,技术价值和社会价值较高。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家素材策略运营(自助中心)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 女装行业运营-抖音电商(苏皖)

    字节跳动 · 上海市
    AI 估算 · 12k-20k
  • 广告算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(AI Agent)-国际化广告质量效能(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 品牌营销专家(活动方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • 上海-高级/资深JAVA工程师(商家)

    希音 · 上海市
    AI 估算 · 30k-50k
  • agent开发工程师

    中国平安 · 上海市
    AI 估算 · 25k-45k
  • Display Customer Engineer

    高通 · 北京市
    AI 估算 · 25k-40k
  • Intern_Automotive Cockpit Edge AI

    奔驰 · 上海市
    AI 估算 · 4k-6k
  • 后端开发工程师

    京东 · 上海市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 商家素材策略运营(自助中心)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 女装行业运营-抖音电商(苏皖)

    字节跳动 · 上海市
    AI 估算 · 12k-20k
  • 广告算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(AI Agent)-国际化广告质量效能(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 品牌营销专家(活动方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • 上海-高级/资深JAVA工程师(商家)

    希音 · 上海市
    AI 估算 · 30k-50k
  • agent开发工程师

    中国平安 · 上海市
    AI 估算 · 25k-45k
  • Display Customer Engineer

    高通 · 北京市
    AI 估算 · 25k-40k
  • Intern_Automotive Cockpit Edge AI

    奔驰 · 上海市
    AI 估算 · 4k-6k
  • 后端开发工程师

    京东 · 上海市
    AI 估算 · 25k-45k