Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/评测工具开发工程师(大模型方向)
Kwai logo
K
快手 (Kwai)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

数据分析数据可视化CI/CD测试开发numpy大模型评测Gitlab-Ci
💡

核心评价

快手大厂平台,深耕前沿大模型评测工具开发,技术成长性突出,薪资竞争力强,需现场办公。

评测工具开发工程师(大模型方向)

🤖 AI 估测:¥30K-50K

发布时间:23 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型评测工具开发的工程师岗位
你将负责评测数据的统计、可视化分析,并开发提效工具来优化评测流程
核心工作是利用Python数据分析栈处理数据,搭建可视化Dashboard,并通过自动化脚本或Web服务来缩短模型评测与优化的闭环周期

✓工作职责

评测数据统计与可视化 :负责评测得分数据的清洗、统计与可视化、计算整体及分维度平均分、胜率、p-value、置信区间等指标,并按阈值自动筛选 Bad/Good case,支撑效果分析
搭建可视化Dashboard,支持可视化洞察驱动模型迭代,如模型分数成长趋势
提效 / 测试工具开发:根据评测流程痛点,敏捷交付脚本或小型web服务,如:prompt管理工具(生成、筛选、版本管理)、失分样本检索、模型指标统计平台化&自动生成简要报表
持续优化评测CI/CD,缩短“提测 → 评测 → 反馈 →优化”闭环

⭐最低要求

本科及以上学历
具备3年及以上,测试开发经验,有相关数据分析&数据平台开发经验也欢迎投递
具备优秀数据分析能力,能用 NumPy/Pandas 对大量csv数据做清洗、聚合、统计
熟练Matplotlib,可快速出可视化、为业务决策提供洞察
具备 GitLab-CI 等经验
能将脚本封装为可复用流水线或轻量服务
自驱&结果导向
善于跨团队沟通,乐于分享工具与最佳实践

👍优先资格

加分项:
有大厂/头部互联网公司工作经验
具备图像、视频或多模态处理相关项目经验
对大模型感兴趣
了解大模型评测流程、相关效果指标、如文生图、文生文、文生视频
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公