Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/大模型资源运营研发工程师
Kwai logo
K
快手 (Kwai)

职位信息

北京市 / 浙江省-杭州市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

数据分析成本优化大模型SGLangClickHousevLLMOpenAI APIRoutellm
💡

核心评价

大厂核心部门,前沿技术栈,薪资竞争力强,但WLB一般。

大模型资源运营研发工程师

🤖 AI 估测:¥30K-50K

发布时间:大约 17 小时前

立即应聘

ℹ️关于这个职位

该职位负责大模型推理场景的计量与成本监控系统开发,需要构建高可靠的计费数据链路和百亿级成本看板,同时建设推理指标数据中心以支持弹性扩缩
你将接触到高并发、大数据处理以及前沿的大模型API协议,适合对技术深度和业务影响力有追求的工程师

✓工作职责

负责大模型推理场景下多维度、高精度的计量能力开发,支持 Token 级、请求级及任务级的用量采集与聚合,构建高可靠、低延迟的计费数据链路
海量成本看板与数据分析:设计并实现面向百亿级成本明细数据的多维分析看板,支持按租户、模型、时间、地域等维度灵活下钻与聚合
优化数据组织与查询引擎(ClickHouse 等),在保障扩展性的前提下大幅提升查询性能,为业务方提供实时、准确的成本洞察与资源优化建议
指标数据中心与弹性扩缩系统:建设统一的推理指标数据中心,采集并聚合实例级、请求级及 Token 级的性能与资源指标

⭐最低要求

本科及以上学历,计算机相关专业优先,2-5 年相关工作经验
熟练掌握 GoLang、Python 等语言,有良好的编程习惯,对代码质量有追求,做事认真负责
熟悉主流中间件及数据系统,包括 MySQL、Kafka、ClickHouse、Redis,有大规模数据处理与性能调优经验者优先
对 OpenAI、Anthropic、Gemini 等大模型 API 协议有深入了解,具备协议兼容、请求转发或用量标准化采集经验者优先
有 Docker、Kubernetes、vLLM、SGLang、RouteLLM 等技术的学习或实践经历,了解 Serverless 架构与 GPU 资源调度
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【留用实习】社区生态治理运营

    快手

    北京市 · 仅现场办公

  • 平台产品经理(磁力金牛)-【电商】

    快手

    北京市 · 仅现场办公

  • 支付AI应用开发工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】UI设计师

    快手

    北京市 · 仅现场办公

  • 游戏音频实习生

    快手

    杭州市 · 仅现场办公

相似职位推荐

  • java开发工程师

    中国平安

    上海市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 知识工程架构师

    中国平安

    深圳市 · 仅现场办公

  • 支付AI应用开发工程师

    快手

    北京市 · 仅现场办公

  • CDN流量调度策略研发工程师

    快手

    北京市 · 仅现场办公