Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/米哈游/AI模型评测工程师 (企业效能支持)
miHoYo logo
m
米哈游 (miHoYo)

职位信息

上海市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

NLP模型评估RAG自动化测试LLMCI/CD质量保障Prompt工程
💡

核心评价

技术前沿的大厂AI评测岗,成长空间巨大,薪资竞争力强,但WLB可能需平衡。

AI模型评测工程师 (企业效能支持)

🤖 AI 估测:¥30K-50K

发布时间:13 天前

立即应聘

ℹ️关于这个职位

该职位是米哈游的AI模型评测工程师,专注于企业级AI知识库问答系统和智能Agent的质量保障
你将负责建立评测体系、制定标准流程,并通过自动化工具验证AI模型在理解、检索和应答方面的准确性,识别各类问题,输出评测报告以推动模型和产品迭代

✓工作职责

负责企业级AI知识库问答系统及智能Agent的评测体系建设,制定评测标准与流程,验证AI对知识库内容的理解、检索、应答准确性,识别问答偏差、信息遗漏、语义误解等问题,输出详细评测报告
基于业务需求与AI产品迭代规划,搭建并持续优化知识库问答、Agent评测的指标体系、评测基准库与自动化/半自动化评测方案,提升评测效率与覆盖度
深度分析评测结果,定位系统短板(如知识盲区、推理错误、交互不畅等),与算法、工程、产品团队协作推动模型迭代与产品优化
跟踪业界前沿评测方法(如Agent评估框架、复杂任务评测基准),引入适合业务场景的评测工具与方法论

⭐最低要求

本科及以上学历,计算机科学、人工智能、大数据等相关专业
具备3年以上AI/NLP领域相关经验
掌握至少一门脚本开发语言(python、go),具备接口及UI自动化测试经验,熟悉主流的测试框架及自动化工具, 深刻理解自动化平台和CI/CD持续集成体系建设
具备良好地团队合作精神,善于协调沟通,具备较高的问题推动解决能力
具有较强的逻辑分析、故障排查、抗压能力,富有激情,责任心强,做事客观公正

👍优先资格

有AI产品评测、模型评估、质量保障或算法优化经验者优先
熟悉LLM算法研发流程,熟悉大模型中prompt工程、RAG、SFT、Agent构造等方向、熟悉模型相关评测指标者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 业务助理

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划(社交)-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 版本运营-星布谷地

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 资深市场公关(媒体关系方向)-原神

    米哈游

    上海市 · 仅现场办公

相似职位推荐

  • 游戏测试-UE在研

    叠纸游戏

    上海市 · 仅现场办公

  • 品质管理组长-IP开发

    叠纸游戏

    上海市 · 仅现场办公

  • 软件测试工程师

    小马智行

    广州市 · 仅现场办公

  • 高级测试工程师 - 北京亦庄

    小马智行

    北京市 · 仅现场办公

  • 运营质量专员

    小马智行

    广州市 · 仅现场办公