Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/大模型-推理框架研发工程师
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

性能优化LLMCUDA芯片架构MLSysMLLM推理框架Agentic
💡

核心评价

大厂核心AI团队的前沿技术岗,技术成长性极佳,薪资预期高,但需面对一线城市现场办公。

大模型-推理框架研发工程师

🤖 AI 估测:¥40K-70K

发布时间:28 天前

立即应聘

ℹ️关于这个职位

该职位是小红书核心AI技术团队中的大模型推理框架研发工程师
你将负责参与或主导面向大语言模型和多模态大模型的推理服务研发与优化工作,核心目标是提升推理效率并降低成本,以支撑社区、搜索、商业化等核心业务
这是一个专注于底层系统性能、需要深厚GPU CUDA编程功底和追求技术极致的岗位

✓工作职责

参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)的推理服务的研发和优化
在PD分离、EP部署的基础上,优化Agentic 服务的推理效率,降低推理成本

⭐最低要求

熟练掌握GPU CUDA编程
追求技术极致,务实,渴望有自己的作品和代表作

👍优先资格

对芯片体系结构和指令执行pipeline有深刻认知者
MLSys方向的知名开源项目贡献者
ACM等编程竞赛获奖者
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公