Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
算法工程专家(模型推理平台-国际支付)-Global Payment
立即应聘

算法工程专家(模型推理平台-国际支付)-Global Payment

发布于 1 天前

普通员工/个人贡献者

杭州市
初级经验
全职员工
仅现场办公
本科
PyTorch
TensorFlow
GPU优化
模型部署
TensorRT
ONNX
高并发
vLLM
分布式推理

AI 估算 · 30k–50k

字节跳动一线大厂,算法工程岗位薪资竞争力强,杭州稍低于北京但整体处于行业高位。职位要求1年起但技术覆盖广,综合定薪30-50k/月。

职位详情

关于这个职位

该职位负责国际支付场景下统一模型推理平台的架构设计与核心开发,需要构建高可用、低延迟的推理服务系统,支撑大模型/小模型的多框架部署与优化

你将与算法、业务和运维团队协作,推动模型上线效率与运维可靠性,并跟踪前沿推理技术进行创新落地
适合对模型部署、推理加速和系统性能优化有热情的技术人才

最低要求

本科及以上学历,计算机、软件工程、电子信息、自动化等相关专业,1年及以上算法工程、模型部署或推理平台相关工作经验

熟练掌握至少一种后端开发语言(Golang/Python/C++),具备良好的工程架构思维与代码质量意识,能独立完成核心模块开发
熟悉主流深度学习框架(PyTorch/TensorFlow/JAX),深刻理解模型训练与推理全流程,能适配多框架模型的统一部署需求
熟悉至少一种推理加速引擎/工具链(TensorRT、ONNX Runtime、vLLM等),有实际项目应用经验
具备推理平台或模型服务化落地经验,涉及API服务、流式推理、批处理、动态批处理、多模型编排等核心场景
具备较强的性能调优与问题排查能力,能解决GPU利用率提升、显存优化、延迟/吞吐调优、服务稳定性治理等问题,具备良好的系统设计能力、跨团队沟通协作能力,能独立负责复杂模块或平台级项目,推动技术方案落地

工作职责

负责国际支付场景专属统一模型推理平台的架构设计、核心模块开发与性能优化,支撑大模型/小模型、多框架(PyTorch/TensorFlow/ONNX/TensorRT)的统一部署与服务化,保障支付场景的高可用与低延迟

设计并实现适配支付流量特性的推理调度机制,包括负载均衡、弹性扩缩容、多副本管理、灰度发布、流量管控,满足稳定性要求
聚焦支付场景模型推理优化,开展模型转换、量化、剪枝、算子融合、显存/内存优化、多卡/分布式推理优化,平衡推理性能与成本效率
构建支付级模型服务标准化体系:统一API网关、鉴权(符合跨境合规要求)、限流、全链路监控告警、日志追溯、压测与SLA保障体系,支撑风控、合规等业务的高并发调用
支撑国际支付业务各类模型快速上线与技术创新:
)解决高并发、低延迟、高吞吐场景下的推理性能瓶颈与稳定性问题,保障支付交易链路的实时响应
)与算法、支付业务、运维团队协同,制定模型部署规范、镜像构建流程、CI/CD与运维自动化体系,提升模型上线效率与运维可靠性
)跟踪业界前沿推理技术(vLLM/TGI/TensorRT-LLM/DeepSpeed/ONNX Runtime等),结合国际支付业务特性落地技术创新,持续迭代平台性能与成本优势

优先资格

有大模型推理平台(LLM Inference Platform)实际建设经验,或支付、金融等高并发场景模型部署经验者优先

熟悉分布式推理技术(张量并行、流水线并行、P2P通信、NCCL等),有大规模模型分布式部署优化经验
有开源项目贡献(推理、部署、性能优化方向)或技术博客输出,具备技术沉淀与分享能力
熟悉微服务架构、gRPC/HTTP API设计、高可用架构设计,能适配支付场景的高可靠要求
了解机器学习、多目标学习、深度学习、在线学习算法

AI 洞察

优缺点分析

优点

  • 处于AI大模型与金融支付交叉领域,技术前沿且业务关键,个人成长空间大
  • 大厂平台(字节跳动),基础设施完善,有充足的GPU资源和业界顶尖的工程师协作
  • 工作内容兼具深度和广度,从底层优化到上层平台架构都能涉猎
  • 技术栈更新快,需要持续学习前沿推理框架和优化方法,保持技术敏感度

缺点 / 挑战

  • 支付场景对高可用、低延迟、高并发的苛刻要求,技术挑战大,需要极强的工程能力和抗压能力
  • 作为平台团队,需要与算法、业务、运维等多方协同,沟通成本较高
  • 适合对模型部署和推理优化有浓厚兴趣,具备扎实的工程基础,喜欢挑战高性能系统问题的技术同学

角色解读

  • 技术纵深发展:成为模型推理平台领域的技术专家,深入GPU底层优化、分布式推理等方向
  • 架构师路径:逐步承担更大的系统架构设计与技术决策,主导平台级基础设施建设
  • 管理方向:可带领小型技术团队,负责推理平台团队管理与项目交付
  • 负责国际支付场景下统一模型推理平台的架构设计与核心模块开发,支撑大模型/小模型的多框架统一部署与服务化
  • 设计与实现适配支付流量特性的推理调度机制,包括负载均衡、弹性扩缩容、灰度发布和流量管控,保障系统稳定性
  • 深入开展模型推理优化工作,包括模型转换、量化、剪枝、算子融合以及显存/内存优化、多卡/分布式推理,平衡性能与成本
  • 构建支付级模型服务标准化体系,统一API网关、鉴权、限流、全链路监控与SLA保障,支撑高并发业务调用
  • 熟练掌握至少一种后端开发语言(Golang/Python/C++),具备良好的工程架构思维与代码质量意识
  • 熟悉主流深度学习框架(PyTorch/TensorFlow/JAX)及推理加速引擎(TensorRT/ONNX Runtime/vLLM)
  • 具备丰富的推理平台或模型服务化落地经验,熟悉API服务、流式推理、动态批处理等核心场景
  • 强大的性能调优与问题排查能力,能解决GPU利用率、显存、延迟/吞吐等优化问题

申请策略

  • 申请时可以准备一两个自己在推理优化上遇到的具体问题和解决过程,体现解决问题的能力
  • 了解字节国际支付业务的发展方向,面试时结合业务痛点展示思考
  • 突出推理平台或模型服务化相关的项目经验,量化性能优化成果(如延迟降低、吞吐提升)
  • 强调对多框架(PyTorch/TensorFlow/ONNX/TensorRT)的熟悉程度和实际使用经验
  • 展示分布式推理、GPU优化等方面的实践经验,以及优秀的系统设计能力
  • 深入研究vLLM、TensorRT-LLM等最新推理引擎,了解其原理和最佳实践
  • 补充支付或金融场景的高并发架构知识,如服务网格、全链路压测等

面试指南

  • STAR法则:场景(Situation)、任务(Task)、行动(Action)、结果(Result),量化成果
  • 对比法:在解释技术选型时,结合不同方案的优劣,体现思考深度
  • 分层法:从系统整体架构到局部优化细节,层层递进展示系统性思维
  • 请介绍一个你参与过的推理平台项目,包括架构设计和性能优化方案
  • 如何提升GPU利用率?请从显存管理、算子融合、计算调度等方面说明
  • 在处理高并发推理请求时,你是如何保证低延迟和高吞吐的?
  • 你了解vLLM的原理吗?对比TensorRT-LLM,它们各有什么优缺点?
  • 在模型部署过程中,如何保证服务的高可用和可观测性?

匹配度报告

66
综合匹配度

大厂前沿技术岗,顶尖薪酬,深度技术挑战,但加班可能较多。

适合人群
该职位最适合追求技术成长和薪酬回报的求职者,对工作生活平衡要求不高者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值60

薪资福利匹配

75中等

字节跳动提供行业领先的薪酬福利,但JD未明确薪资和具体福利项,不过大厂通常配套完善。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

职位涉及前沿推理技术(vLLM/TensorRT-LLM等),技术栈现代,有大量成长机会,但JD未明确晋升路径。

技术前沿前沿/新兴技术
技术栈PyTorch、TensorFlow、ONNX、TensorRT、vLLM、TGI、DeepSpeed、ONNX Runtime、NCCL
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工时或双休,大厂通常工作强度较大,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

支付业务具有较高社会价值(促进跨境交易),但JD未强调使命感或社会影响力。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k