Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
算法工程专家(模型推理平台-国际支付)-Global Payment
立即应聘

算法工程专家(模型推理平台-国际支付)-Global Payment

发布于 1 天前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
PyTorch
TensorFlow
GPU优化
TensorRT
ONNX
高并发
vLLM

AI 估算 · 30k–60k

大厂高级技术岗,涉及前沿推理技术,薪资竞争力强,技术难度高

职位详情

关于这个职位

该职位负责国际支付场景下统一模型推理平台的架构设计与性能优化,支撑大/小模型的高可用、低延迟部署

你将聚焦推理加速、调度机制、服务标准化等核心技术,与算法、运维团队协同,推动技术创新与业务落地
适合有扎实工程能力和模型部署经验的算法工程师

最低要求

本科及以上学历,计算机、软件工程、电子信息、自动化等相关专业,1年及以上算法工程、模型部署或推理平台相关工作经验

熟练掌握至少一种后端开发语言(Golang/Python/C++),具备良好的工程架构思维与代码质量意识,能独立完成核心模块开发
熟悉主流深度学习框架(PyTorch/TensorFlow/JAX),深刻理解模型训练与推理全流程,能适配多框架模型的统一部署需求
熟悉至少一种推理加速引擎/工具链(TensorRT、ONNX Runtime、vLLM等),有实际项目应用经验
具备推理平台或模型服务化落地经验,涉及API服务、流式推理、批处理、动态批处理、多模型编排等核心场景
具备较强的性能调优与问题排查能力,能解决GPU利用率提升、显存优化、延迟/吞吐调优、服务稳定性治理等问题,具备良好的系统设计能力、跨团队沟通协作能力,能独立负责复杂模块或平台级项目,推动技术方案落地

工作职责

负责国际支付场景专属统一模型推理平台的架构设计、核心模块开发与性能优化,支撑大模型/小模型、多框架(PyTorch/TensorFlow/ONNX/TensorRT)的统一部署与服务化,保障支付场景的高可用与低延迟

设计并实现适配支付流量特性的推理调度机制,包括负载均衡、弹性扩缩容、多副本管理、灰度发布、流量管控,满足稳定性要求
聚焦支付场景模型推理优化,开展模型转换、量化、剪枝、算子融合、显存/内存优化、多卡/分布式推理优化,平衡推理性能与成本效率
构建支付级模型服务标准化体系:统一API网关、鉴权(符合跨境合规要求)、限流、全链路监控告警、日志追溯、压测与SLA保障体系,支撑风控、合规等业务的高并发调用
支撑国际支付业务各类模型快速上线与技术创新:
)解决高并发、低延迟、高吞吐场景下的推理性能瓶颈与稳定性问题,保障支付交易链路的实时响应
)与算法、支付业务、运维团队协同,制定模型部署规范、镜像构建流程、CI/CD与运维自动化体系,提升模型上线效率与运维可靠性
)跟踪业界推理技术(vLLM/TGI/TensorRT-LLM/DeepSpeed/ONNX Runtime等),结合国际支付业务特性落地技术创新,持续迭代平台性能与成本优势

优先资格

有大模型推理平台(LLM Inference Platform)实际建设经验,或支付、金融等高并发场景模型部署经验者优先

熟悉分布式推理技术(张量并行、流水线并行、P2P通信、NCCL等),有大规模模型分布式部署优化经验
有开源项目贡献(推理、部署、性能优化方向)或技术博客输出,具备技术沉淀与分享能力
熟悉微服务架构、gRPC/HTTP API设计、高可用架构设计,能适配支付场景的高可靠要求
了解机器学习、多目标学习、深度学习、在线学习算法

AI 洞察

优缺点分析

优点

  • 使用前沿的大模型推理技术栈(vLLM、TensorRT-LLM等),紧跟行业趋势
  • 字节跳动大厂平台,薪资福利有竞争力,技术氛围浓厚
  • 技术迭代快速,需持续学习新工具和新框架

缺点 / 挑战

  • 参与国际支付核心业务的AI基础设施建设,技术挑战高,成长空间大
  • 支付场景对高可用、低延迟要求极高,技术难度和压力较大
  • 需要跨团队协作(算法、支付、运维),沟通协调成本较高
  • 适合有模型部署和推理优化经验,喜欢挑战高并发、低延迟系统,并希望在AI工程化方向深入发展的技术人才

角色解读

  • 技术深度方向:成为推理平台架构专家,深入GPU优化、分布式推理等前沿领域
  • 业务影响力方向:在支付场景中沉淀模型部署最佳实践,推动AI在金融领域的创新应用
  • 管理方向:带领团队负责平台级项目,逐步转向技术管理或架构师角色
  • 负责构建和优化国际支付场景的统一模型推理平台,涵盖架构设计、核心模块开发与性能调优
  • 设计推理调度机制,如负载均衡、弹性扩缩容、灰度发布,保障支付链路的高可用和低延迟
  • 开展模型推理优化,包括量化、剪枝、算子融合、分布式推理,平衡性能与成本
  • 建立模型服务标准化体系,包括API网关、鉴权、监控告警、SLA保障,支撑风控等高并发调用
  • 熟练掌握Golang/Python/C++之一,具备扎实的工程架构和代码质量能力
  • 熟悉PyTorch、TensorFlow等深度学习框架,理解训练与推理全流程
  • 有TensorRT、ONNX Runtime、vLLM等推理加速引擎的实际应用经验
  • 具备推理平台或模型服务化落地经验,能独立负责复杂模块和跨团队协作

申请策略

  • 在简历中突出与支付高并发场景相关的性能优化经验,即使不是支付行业
  • 面试前准备一个完整的推理平台架构设计案例,包括调度、监控、扩缩容等
  • 突出推理平台或模型服务化项目的实际成果,如延迟优化、吞吐提升等量化指标
  • 强调在PyTorch/TensorRT/vLLM等工具上的实践经验,尤其是性能调优案例
  • 展示分布式系统设计、高可用架构、微服务等相关经验
  • 如有开源贡献或技术博客,务必提及以体现技术影响力
  • 深入学习vLLM、TensorRT-LLM等最新推理框架的源码和优化技巧
  • 补充GPU编程(CUDA)和分布式推理(张量并行、流水线并行)知识

面试指南

  • 对于架构设计问题,采用STAR法则:背景、任务、行动、结果,突出量化成果
  • 对于优化问题,从问题定位、方案选型、实施步骤、效果评估四个维度回答
  • 对于稳定性问题,强调监控、告警、熔断、降级、灰度发布等系统性方案
  • 请描述你设计过一个推理平台的架构,如何实现高可用和低延迟?
  • 在模型推理优化中,你使用过哪些技术(量化、剪枝等)?如何平衡性能和精度?
  • 如何设计一个弹性扩缩容的推理服务?考虑哪些关键指标?
  • 在支付场景下,如何保证模型服务的稳定性和SLA?
  • 谈谈你对vLLM或TensorRT-LLM的理解,它们如何优化大模型推理?

匹配度报告

69
综合匹配度

大厂核心支付业务,前沿推理技术栈,薪资高但工作强度可能较大。

适合人群
最看重技术成长和薪酬回报,能接受较强工作压力的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活50
使命价值60

薪资福利匹配

75中等

大厂高级岗位,薪资有竞争力,但JD未明确具体薪酬和福利,需面试确认。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

技术栈前沿(大模型推理、分布式优化),成长空间大,但JD未明确晋升路径。

技术前沿前沿/新兴技术
技术栈PyTorch、TensorRT、vLLM、GPU、分布式推理
业务类型profit_center

工作生活匹配

50较低

仅现场办公,且未提及弹性或WLB,大厂技术岗通常工作强度较高。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

支付行业稳定,但技术岗位对社会影响力贡献不明显,偏中性。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k