Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
机器学习研发工程师-搜索架构
立即应聘

机器学习研发工程师-搜索架构

发布于 大约 9 小时前

普通员工/个人贡献者

北京市
其它
全职员工
仅现场办公
学历未注明
GPU
深度学习
PyTorch
TensorFlow
LLM
CUDA
分布式训练
vLLM
搜索架构

AI 估算 · 25k–55k

北京一线大厂机器学习岗,技术难度高,市场竞争力强,薪资处于行业前列

职位详情

关于这个职位

该职位负责抖音及国际化短视频搜索场景下机器学习/深度学习架构的设计与实现,重点优化模型性能和GPU计算效率

你将参与核心搜索算法的工程落地,涉及文本相关性、多模态、LLM等前沿模型,并需要扎实的编程和系统设计能力
适合对AI基础设施和高性能计算有热情的技术人才

最低要求

掌握扎实的计算机基础知识,深入理解数据结构、算法和操作系统知识

有强烈的求知欲,快速学习和沟通能力
编程能力扎实,有良好的编程习惯

工作职责

参与抖音&国际化短视频搜索场景下机器学习和深度学习架构的设计与实现

关注文本相关性模型、多模态、Wide&Deep模型、LLM模型等深度学习模型在搜索场景中的性能和成本优化
提高模型训练效率,加速推理性能,优化GPU吞吐
设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,充分利用GPU并行计算能力,支持各种模型在不同硬件上的构建和部署

优先资格

加分项:

熟悉主流的深度学习框架(Pytorch、Tensorflow)
熟悉主流高性能并行编程技术,有GPU编程经验(CUDA或Triton)
熟悉vLLM,TRT-LLM等大模型推理框架,熟悉大模型并发推理原理
熟悉FSDP、DeepSpeed、Megatron等业界主流分布框架的使用和原理

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,接触前沿AI技术(LLM、GPU优化等)
  • 团队技术氛围浓厚,个人成长快,薪资福利有竞争力
  • 技术更新迅速,需要持续学习保持竞争力
  • 算法工程结合度高,对系统能力要求高,非纯算法岗位
  • 适合对底层性能优化充满热情、喜欢钻研GPU计算和分布式系统、且能接受高强度工作的技术极客

缺点 / 挑战

  • 核心业务搜索场景,技术挑战大,能深度参与大规模系统优化
  • 工作强度较大,可能需要应对紧急优化任务或项目周期压力

角色解读

  • 技术专家路线:深耕AI基础设施、高性能计算或搜索架构,成为领域权威
  • 管理路线:积累项目经验后转向技术Leader或团队Manager
  • 跨领域发展:可向推荐系统、广告系统等核心方向延伸
  • 设计并实现搜索场景下的机器学习与深度学习架构,涵盖文本相关性、多模态及LLM模型
  • 优化模型训练和推理性能,通过GPU编程和算子库开发提升计算效率
  • 研究前沿GPU计算技术,支持模型在不同硬件上的高效部署
  • 扎实的数据结构、算法和操作系统知识,具备优秀的编程能力
  • 熟悉深度学习框架(Pytorch/Tensorflow),有GPU编程经验(CUDA/Triton)
  • 了解大模型推理框架(vLLM、TRT-LLM)或分布式训练框架(FSDP、DeepSpeed等)

申请策略

  • 准备一个完整的性能优化项目案例,用STAR法则描述背景、方案和量化成果
  • 了解抖音搜索业务的基本逻辑,思考如何应用LLM提升搜索体验
  • 突出GPU编程项目经验,如自定义CUDA算子性能提升的具体数据
  • 展示参与过的深度学习模型优化案例,包括训练加速或推理延迟降低
  • 强调系统设计能力,如大规模分布式训练架构或服务化部署经验
  • 深入学习vLLM、TRT-LLM等推理框架的原理与实践
  • 掌握FSDP、DeepSpeed等分布式训练工具的使用和调优
  • 熟悉搜索场景的常见模型(如双塔、多模态)的工业实现

面试指南

  • 对于优化问题,先明确瓶颈(计算/IO/显存),再给出针对性方案(算子融合、量化、KV cache等),最后评估收益
  • 对于设计问题,结合搜索场景特点(高并发、低延迟),从模型选型、特征工程、系统架构展开
  • 对于项目经验,使用STAR法则:Situation-Task-Action-Result,突出量化成果(如延迟降低X%、吞吐提升Y倍)
  • 解释Transformer中Self-Attention的GPU优化方式(如FlashAttention)
  • 如何优化一个大规模模型的推理延迟?请给出具体方案
  • 设计一个搜索相关性模型,如何处理特征和模型结构?
  • 在多GPU环境下如何进行模型并行?请比较数据并行、张量并行、流水线并行的优劣
  • 描述你解决过的一个性能瓶颈案例,如何分析、解决、效果如何?

匹配度报告

71
综合匹配度

一线大厂核心搜索技术岗,前沿AI技术栈,薪资优厚但工作压力大。

适合人群
适合追求技术快速成长和较高薪酬,但对工作生活平衡要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活30
使命价值80

薪资福利匹配

85较高

字节跳动作为一线大厂,薪资待遇处于行业领先水平,福利完善,但未在JD中明确列出具体福利。

薪资信号市场水准 (25K-55K/月)

成长发展匹配

90较高

该职位涉及最前沿的AI技术(LLM、GPU优化)和核心业务场景,能快速积累技术深度和广度,成长空间大。

技术前沿前沿/新兴技术
技术栈CUDA、vLLM、LLM、Pytorch、DeepSpeed
业务类型profit_center

工作生活匹配

30较低

仅现场办公且北京工作强度普遍较高,JD未提及弹性工作或远程,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

搜索是AI核心应用,技术影响力大,行业处于高速增长期,但JD未强调社会使命感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 产品设计专家(主架构)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 高级/资深后端开发工程师-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 算法工程师(搜索)-今日头条

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 客户端安全工程师

    字节跳动 · 广州市
    AI 估算 · 15k-25k
  • 前端开发工程师-计算

    字节跳动 · 北京市
    AI 估算 · 25k-50k

相似职位推荐

  • Java开发实习生-【主站用增方向】

    快手 · 北京市
    AI 估算 · 4k-6k

字节跳动 的其他在招职位

  • 产品设计专家(主架构)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 高级/资深后端开发工程师-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 算法工程师(搜索)-今日头条

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 客户端安全工程师

    字节跳动 · 广州市
    AI 估算 · 15k-25k
  • 前端开发工程师-计算

    字节跳动 · 北京市
    AI 估算 · 25k-50k

相似职位推荐

  • Java开发实习生-【主站用增方向】

    快手 · 北京市
    AI 估算 · 4k-6k