Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Trip.com logo
携程
Senior QA EN SHACC ALL(MJ035074)
立即应聘

Senior QA EN SHACC ALL(MJ035074)

发布于 大约 13 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
LLM
跨部门协作
质量评估
回归测试
AIGC
根因分析
Prompt Engineering
Golden Dataset

AI 估算 · 25k–40k

资深AI质量岗位,携程大厂平台,技能稀缺,市场薪资竞争力强。

职位详情

关于这个职位

该职位负责AI模型质量评估与标准制定,涵盖LLM的准确性、安全性、合规性等维度,需设计自动化与人工结合的评估流程,并推动闭环改进

适合具备互联网产品运营经验、熟悉LLM/AIGC评估方法论的资深人士

最低要求

教育背景:全日制本科及以上学历

工作经验:3年以上互联网产品运营经验
专业技能:
掌握AI评估方法(如Golden Dataset构建、人类评估SOP)
具备从海量数据中挖掘潜在风险的“找bug”思维
熟悉Prompt Engineering(侧重验证而非日常维护)
软技能:强大的跨部门沟通能力,能通过数据影响和推动跨职能合作伙伴解决复杂问题
语言能力:良好的英语书面和口语能力

工作职责

AI质量评估框架与标准:建立并维护LLM的评估标准(准确性、安全性、合规性、指令遵循能力)

设计结合自动化与人工评估的流程,定期量化模型性能
端到端质量控制与风险管理:负责模型迭代的回归测试和验收测试,在发布前强制执行质量门
监控线上性能,挖掘不良案例(幻觉、逻辑错误、体验缺陷),及时发出风险预警
问题驱动改进与闭环管理:主导质量问题的根因分析,精确定位故障来源(数据、提示词或模型架构)
推动算法、产品、运营团队解决质量缺陷,跟踪修复率并重新验证,确保闭环
跨职能协作:弥合业务需求与技术实现之间的差距,确保AI为用户提供真实价值

优先资格

项目管理经验者优先

AI 洞察

优缺点分析

优点

  • 涉及前沿的LLM/AIGC技术,能深度参与AI产品质量控制,技能积累价值高
  • 携程作为上市大厂,平台稳定,内部资源丰富,有利于职业发展
  • 职位核心是质量,在AI产品中至关重要,工作成果直接影响用户体验
  • AI模型迭代快,工作节奏可能较快,需持续跟进新技术
  • 适合对AI质量有浓厚兴趣、具备互联网运营背景且追求技术深度的求职者

缺点 / 挑战

  • 需要同时掌握技术评估方法和业务运营视角,对综合能力要求较高

角色解读

  • 可向AI质量专家或AI产品管理方向发展,深入模型评估与优化
  • 随着LLM技术普及,该领域人才需求旺盛,有望成为团队负责人或技术架构师
  • 建立和维护大语言模型的质量评估标准,确保模型在准确性、安全性、合规性等方面符合要求
  • 设计自动化与人工结合的评估流程,对模型迭代进行回归测试和验收测试,防止性能下降
  • 监控线上模型表现,发现并分析误差案例,推动闭环改进
  • 掌握AI评估方法论,包括Golden Dataset构建和人类评估SOP
  • 具备从海量数据中挖掘潜在风险的敏锐洞察力
  • 熟悉Prompt Engineering,能够复现或验证问题

申请策略

  • 了解携程AI产品的业务场景,思考质量评估如何赋能业务
  • 突出LLM/AIGC产品运营或质量评估的实际经验,特别是Golden Dataset构建案例
  • 强调数据分析能力和跨部门协作成果,用数据量化影响力
  • 提供与Prompt Engineering相关的项目经历,展示问题排查能力
  • 深入学习LLM评估框架,如human evaluation和自动化评估指标
  • 练习Prompt Engineering,提升快速复现和验证问题的能力

面试指南

  • 对于方法论问题,从目标定义、数据采集、评估维度、迭代优化四个步骤展开
  • 对于问题排查,遵循PDCA循环:定义问题、根因分析、制定措施、验证闭环
  • 请描述你如何构建一个LLM质量评估数据集?
  • 当模型上线后出现大量不良案例时,你的排查和分析思路是什么?
  • 你如何推动跨部门团队解决质量缺陷?请举例
  • 准备一个完整的AI质量评估项目案例,包含背景、挑战、解决方案和成果
  • 复习LLM常见问题(如幻觉、偏见)及其检测方法

匹配度报告

71
综合匹配度

携程AI质量岗,前沿LLM技术,成长性好但工作弹性有限。

适合人群
适合看重技能成长和行业前沿性、对工作地点要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展85
工作生活50
使命价值80

薪资福利匹配

70中等

携程作为上市大厂,薪资福利有竞争力,但JD未披露具体数值,不确定性中等。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

85较高

从事LLM/AIGC前沿技术质量评估,技能成长快,但无明确晋升描述。

技术前沿前沿/新兴技术
技术栈LLM、AIGC、Prompt Engineering、Golden Dataset
业务类型ambiguous

工作生活匹配

50较低

工作地点在上海,但未提及弹性办公或WLB,可能需现场办公且高强度。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

AI行业高速增长,职位提升产品质量有社会价值,但JD未明确使命导向。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

携程 的其他在招职位

  • 行政前台实习生(MJ035031)

    携程 · 北京市
    AI 估算 · 3k-5k
  • Java高级开发工程师(AI辅助全栈开发)(MJ035018)

    携程 · 深圳市
    AI 估算 · 25k-45k
  • 商拓经理(MJ034612)

    携程 · 北京市
    AI 估算 · 15k-25k
  • (中文客服)机票售后客服专员(5月)(MJ035070)

    携程 · 南通市
    AI 估算 · 4k-6k
  • 酒店业务实习生(广州)(MJ035106)

    携程 · 广州市
    AI 估算 · 3k-4k

相似职位推荐

  • Supplier Quality Engineer (Interior & Metal & Exterior)

    大众汽车 · 北京市
    AI 估算 · 25k-40k
  • 质量管理科

    中国融通集团 · 徐州市
    AI 估算 · 8k-15k
  • 饮食质检员

    中国融通集团 · 长沙市
    AI 估算 · 8k-12k
  • Global Supplier Quality Engineer

    伟创力 · 深圳市
    AI 估算 · 30k-50k
  • SQE质量提升

    京东 · 北京市
    AI 估算 · 20k-35k

携程 的其他在招职位

  • 行政前台实习生(MJ035031)

    携程 · 北京市
    AI 估算 · 3k-5k
  • Java高级开发工程师(AI辅助全栈开发)(MJ035018)

    携程 · 深圳市
    AI 估算 · 25k-45k
  • 商拓经理(MJ034612)

    携程 · 北京市
    AI 估算 · 15k-25k
  • (中文客服)机票售后客服专员(5月)(MJ035070)

    携程 · 南通市
    AI 估算 · 4k-6k
  • 酒店业务实习生(广州)(MJ035106)

    携程 · 广州市
    AI 估算 · 3k-4k

相似职位推荐

  • Supplier Quality Engineer (Interior & Metal & Exterior)

    大众汽车 · 北京市
    AI 估算 · 25k-40k
  • 质量管理科

    中国融通集团 · 徐州市
    AI 估算 · 8k-15k
  • 饮食质检员

    中国融通集团 · 长沙市
    AI 估算 · 8k-12k
  • Global Supplier Quality Engineer

    伟创力 · 深圳市
    AI 估算 · 30k-50k
  • SQE质量提升

    京东 · 北京市
    AI 估算 · 20k-35k