Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

HSBC logo
汇丰
Senior Consultant Specialist (Model Hosting/Inference Optimization)
立即应聘

Senior Consultant Specialist (Model Hosting/Inference Optimization)

发布于 大约 1 个月前

普通员工/个人贡献者

广州市 / 西安市
高级经验
全职员工
混合式弹性办公
本科
信息技术与基础设施
LLM
CUDA
模型微调
推理优化
SGLang
vLLM
TensorRT-LLM

AI 估算 · 25k–40k

外资金融科技公司Senior岗,AI工程技能稀缺,行业薪资有竞争力,结合广州/西安水平估算。

职位详情

关于这个职位

该职位是汇丰银行AI平台团队的高级顾问专家,主要负责模型托管与推理优化,以及端到端微调管道的设计与实现

你将与AI研究员、数据科学家紧密合作,构建生产级的AI模型服务系统,涵盖LLM、嵌入模型等,确保高性能、低成本部署
适合具备深厚AI工程和推理优化经验的技术人才

最低要求

本科/硕士/博士学历,专业为机器学习/自然语言处理/计算机科学/数据科学/统计学(或相关领域)

年以上AI平台经验,涵盖模型托管/推理优化和微调管道
强烈偏好有LLM经验
扎实的Python和CUDA工程能力,深刻理解GPU/CPU架构和HPC基础
深入的推理优化知识:KV-cache、批处理、量化(INT4/FP8/GPTQ/AWQ)、算子优化和框架集成(vLLM, TensorRT-LLM, SGLang)
具备Docker/Kubernetes和AWS/GCP/Azure的托管经验
端到端微调专业知识:数据准备、分布式训练、超参数调优、HF/Accelerate/LoRA/QLoRA
以及基准测试/监控/问题排查能力,具备AI原生思维,并能有效使用编码辅助工具

工作职责

设计、构建并运营适用于LLM、嵌入和STT/TTS的可扩展、可靠的模型托管平台,覆盖异构硬件

推动推理优化以降低延迟、提高吞吐量和成本(量化、KV-cache优化、动态/连续批处理)
评估、集成和定制推理框架(如vLLM, TensorRT-LLM, SGLang),在目标硬件上最大化性能
负责推理健康与性能监控:延迟、吞吐量、TTFT、内存、可用性
解决瓶颈和部署问题
与硬件团队合作应用特定硬件优化,提高资源利用率
确保托管系统满足可靠性、可扩展性、安全性和高可用性等生产标准
构建端到端、可扩展的微调管道,利用领域数据集适配基础模型
与数据科学家/领域专家合作定义目标和指标,验证结果,并将微调模型集成到托管/推理栈中

AI 洞察

优缺点分析

优点

  • 技术栈前沿,聚焦LLM推理优化和微调,积累高价值AI工程经验
  • 外资金融大平台,稳定性高,混合办公模式提升工作灵活性
  • 团队与AI研究员紧密合作,能深入理解模型从研究到生产的全流程
  • 涉及多种硬件和云平台,跨团队协作复杂
  • 适合3年以上AI工程经验、热爱底层优化、希望在LLM领域持续深耕的技术专家

缺点 / 挑战

  • 要求同时掌握推理优化和微调管道,技术门槛较高,需要持续学习
  • 金融行业对系统可靠性要求极高,故障排查压力较大

角色解读

  • 在AI平台工程领域深耕,成为推理优化或模型部署专家
  • 向技术主管或架构师方向发展,带领团队构建更复杂的AI基础设施
  • 横向拓展至AI研究或数据科学方向,积累算法与工程双重能力
  • 设计并维护可扩展的模型托管平台,支持LLM、嵌入等多种AI模型的生产部署
  • 优化推理性能,通过量化、批处理等技术降低延迟和成本
  • 构建端到端微调管道,对预训练模型进行领域适配,并集成到推理栈
  • 与AI研究员、数据科学家协作,监控系统健康并解决部署问题
  • 精通Python和CUDA,深刻理解GPU/CPU架构和HPC基础
  • 深入掌握推理优化技术,包括KV-cache、量化、算子优化以及vLLM/TensorRT-LLM等框架
  • 熟悉Docker/Kubernetes和至少一种云平台(AWS/GCP/Azure)
  • 具备端到端微调经验,熟悉HF/Accelerate/LoRA/QLoRA等工具

申请策略

  • 了解汇丰AI平台的技术栈和业务方向,在面试中展示对金融领域模型部署的理解
  • 准备一个完整的端到端项目案例,从模型选择到优化部署,说明挑战与解决方案
  • 突出LLM推理优化或模型托管项目经验,量化性能提升指标(如延迟降低XX%)
  • 强调CUDA、算子优化等底层技能,展示HPC或硬件相关背景
  • 列出使用过的推理框架(vLLM等)和云平台,体现工程广度
  • 深入学习vLLM、TensorRT-LLM等框架源码,提升框架定制能力
  • 补充分布式训练和微调经验,熟悉LoRA/QLoRA等高效微调方法
  • 强化Kubernetes容器编排和云原生部署技能

面试指南

  • 技术问题采用STAR法则:情境、任务、行动、结果,强调量化成果
  • 系统设计类问题先明确需求边界,再分层讨论组件和权衡
  • 展示对性能指标(TTFT、吞吐量)的敏感度,并说明优化思路
  • 请描述一次你优化LLM推理延迟的经历,使用了哪些技术?
  • 解释KV-cache的工作原理及如何减少显存占用
  • 你如何选择量化方案(如INT4 vs FP8)?优缺点是什么?
  • 设计一个微调管道:从数据准备到部署的流程和考虑因素
  • 如何在Kubernetes上保证模型托管的高可用性?

职位点评

70
综合评分

外资金融大厂、前沿AI技术栈、混合办公,技术驱动型岗位,适合深度技术爱好者。

更适合这类人
最适合理求技术成长、追求前沿AI工程挑战的求职者。
表现最好
成长发展
相对薄弱
使命价值
薪资福利70
成长发展85
工作生活70
使命价值55

薪资福利

70中等

外资金融大厂,薪资处于市场水准,福利未在JD中明确,但通常较为完善,混合办公模式提升性价比。

薪资信号未披露(AI估算:25K-40K/月)

成长发展

85较高

技术栈前沿(LLM、推理优化),岗位涉及多个AI热门方向,公司提供持续发展机会,成长空间大。

技术前沿前沿/新兴技术
技术栈LLM、推理优化、vLLM、TensorRT-LLM、量化、KV-cache、CUDA
成长机会continuous professional development、flexible working、opportunities to grow
业务类型ambiguous

工作生活

70中等

混合办公模式提供一定灵活性,但未明确说明WLB,需结合团队实际;地点广州/西安生活成本较低。

工作模式混合式弹性办公
办公地点未明确
加班情况未提及(无法判断)
工作生活平衡flexible working

使命价值

55较低

金融行业AI平台,社会影响力中性,技术创新性强但使命导向不突出。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

汇丰 的其他在招职位

  • Consultant Specialist

    汇丰 · 广州市
    AI 估算 · 15k-25k
  • RB&W CDD Assistant Manager - Hang Seng Bank (HK)

    汇丰 · Mongkok, Kowloon, Hong Kong
    AI 估算 · 32k-50k
  • Premier Relationship Clerk/Officer 卓越理財客戶服務專員/副理 (古亭分行)

    汇丰 · Taipei, Taipei City, Taiwan
    AI 估算 · 45k-55k
  • Digital Branch Service Executive - Hang Seng Bank (HK)

    汇丰 · Mongkok, Kowloon, Hong Kong
    AI 估算 · 20k-30k
  • Full Stack Engineering

    汇丰 · Central, Hong Kong Island, Hong Kong
    AI 估算 · 80k-120k

相似职位推荐

  • Senior Field Service Engineer

    伊顿中国 · 常州市
    AI 估算 · 15k-25k
  • AI projects in IE

    德科斯米尔 · 沈阳市
    AI 估算 · 3k-4k
  • 科研助理(应用安全工程师(安全测评师))

    中国融通集团 · 北京市
    AI 估算 · 12k-20k
  • 运维工程师(oracle)

    欢聚集团 · 广州市
    AI 估算 · 15k-25k
  • helpdesk工程师

    欢聚集团 · 广州市
    AI 估算 · 8k-15k

汇丰 的其他在招职位

  • Consultant Specialist

    汇丰 · 广州市
    AI 估算 · 15k-25k
  • RB&W CDD Assistant Manager - Hang Seng Bank (HK)

    汇丰 · Mongkok, Kowloon, Hong Kong
    AI 估算 · 32k-50k
  • Premier Relationship Clerk/Officer 卓越理財客戶服務專員/副理 (古亭分行)

    汇丰 · Taipei, Taipei City, Taiwan
    AI 估算 · 45k-55k
  • Digital Branch Service Executive - Hang Seng Bank (HK)

    汇丰 · Mongkok, Kowloon, Hong Kong
    AI 估算 · 20k-30k
  • Full Stack Engineering

    汇丰 · Central, Hong Kong Island, Hong Kong
    AI 估算 · 80k-120k

相似职位推荐

  • Senior Field Service Engineer

    伊顿中国 · 常州市
    AI 估算 · 15k-25k
  • AI projects in IE

    德科斯米尔 · 沈阳市
    AI 估算 · 3k-4k
  • 科研助理(应用安全工程师(安全测评师))

    中国融通集团 · 北京市
    AI 估算 · 12k-20k
  • 运维工程师(oracle)

    欢聚集团 · 广州市
    AI 估算 · 15k-25k
  • helpdesk工程师

    欢聚集团 · 广州市
    AI 估算 · 8k-15k