Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/大模型后端工程师-【可灵AI】
Kwai logo
K
快手 (Kwai)

职位信息

北京市 / 广东省-深圳市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorchCUDA模型压缩推理优化大模型diffusion
💡

核心评价

前沿大模型技术岗,技能成长空间巨大,薪资竞争力强,但需在一线城市现场办公。

大模型后端工程师-【可灵AI】

🤖 AI 估测:¥35K-65K

发布时间:15 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型后端工程的高级技术岗位
你将负责可灵数字人团队生成端系统的技术方案设计、算法服务部署与业务对接,并致力于优化文本及多模态大模型的推理部署效率
该职位要求深入理解大模型原理,并具备模型压缩、推理优化等前沿技术的实践经验

✓工作职责

负责可灵数字人团队生成端系统,包括技术方案设计、算法对接服务部署、业务方对接工作
负责可灵数据团队内部文本及多模态大模型的推理部署效率优化需求

⭐最低要求

熟练掌握diffusion原理,熟悉transformer结构及其变种,掌握大模型模型特性,有过大模型训练经历
熟练掌握传统模型压缩技术,包括:模型量化,模型稀疏化(如剪枝,token-merge,token-eviction),模型蒸馏,有其中一个相关的研究经历或实践经验
熟练掌握投机推理,KV-cache稀疏化,有过相关研究经历或实践经验者优化
框架要求:精通pytorch,熟练大模型并行框架的应用,包括 huggingface的accelerator,vLLM,SGLang,deepspeed,Megatron-LM
代码要求:精通python,了解CUDA或有实践经验者优先

👍优先资格

有过大模型SFT经历者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公