Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
MaaS模型评测高级工程师
立即应聘

MaaS模型评测高级工程师

发布于 大约 16 小时前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
研究与开发 (研发)
大模型
推理框架
Maas
模型评测
提示工程(Pe)
Swe-Bench
Agentbench
Humaneval
Mmlu

AI 估算 · 30k–60k

腾讯高级工程师岗位,大模型方向薪资较高,深圳互联网薪资水平领先,综合评估月薪30-60K。

职位详情

关于这个职位

该职位是腾讯云MaaS产品的模型评测高级工程师,主要负责大模型的质量保障、评测体系建设以及评测工具的开发

你将深度参与前沿AI技术,跟踪业界评测基准和模型动态,推动评测工程化和自动化,与顶尖团队一起保障产品稳定性

最低要求

大学本科及以上学历,计算机科学与技术、软件工程、大数据技术、人工智能、智能科学与技术等专业

精通Python程序开发,有良好的编码风格及创新优化意识,具备较强的程序开发能力
有大模型训练或模型评估经验,熟悉大模型评测方法
有责任心和较强的团队意识,对人工智能有较强的兴趣
具备优秀的沟通协调能力和团队协作意识

工作职责

负责腾讯云MaaS产品质量保障工作,深度参与产品质量体系建设,识别全链路上的质量风险,建立稳定性保障体系,推动稳定性建设落地

腾讯云MaaS产品相关的模型评测工作,包含模型的评测体系建设、评测集构建、以及相关评测工程化建设等
跟踪业界评测基准动态(如 SWE-bench、HumanEval、MMLU、AgentBench 等)以及业界模型(如kimi,deepseek,minimax,glm等)发展动态
建设相关评测工具/平台,推动评测工程化和无人化

优先资格

有大模型Bench数据接入经验优先

对推理框架(如sglang、vllm等)有经验的优先
有项目管理或团队负责人经验优先
大模型产品深度用户,PE(提示工程)实践经验者优先

AI 洞察

优缺点分析

优点

  • 腾讯大平台,技术资源丰富,能接触最前沿的大模型技术和海量业务场景
  • 岗位技术含量高,涉及模型评测和工具开发,能积累深度AI经验
  • 薪资待遇优厚,大厂福利完善,职业发展空间大
  • 与顶尖的AI研发团队合作,学习氛围浓厚
  • 大模型技术迭代快,需要持续学习新模型和评测方法,保持技术敏感度
  • 对细节和严谨性要求高,模型评测的准确性直接影响产品质量
  • 适合对大模型和AI评测有浓厚兴趣,具备较强编程能力和问题分析能力,愿意在技术深度上持续投入的技术人员

缺点 / 挑战

  • 评测工作可能涉及大量重复性任务,需通过工程化手段提升效率

角色解读

  • 在AI质量保障领域深耕,成为大模型评测专家或质量架构师
  • 向模型开发或AI Infra方向转型,深度参与模型训练与优化
  • 随着经验积累,可晋升为技术负责人或团队管理者,带领评测团队
  • 负责腾讯云MaaS产品的质量保障和稳定性体系建设,识别全链路质量风险并推动解决
  • 进行大模型的评测工作,包括构建评测体系、设计评测集,以及开发评测工具和平台
  • 跟踪业界评测基准(如MMLU、AgentBench)和主流模型的发展动态,保持技术前沿
  • 推动评测流程的工程化和自动化,提升效率并减少人工干预
  • 精通Python编程,具备良好的编码风格和程序开发能力
  • 熟悉大模型训练或评估方法,了解主流评测基准和指标
  • 了解推理框架(如sglang、vllm)的部署和使用
  • 具备优秀的沟通协调能力和团队协作意识,有项目管理经验更佳

申请策略

  • 深入了解腾讯云MaaS产品线和AI战略,在面试中展现对业务的思考
  • 准备一段关于评测体系建设的想法或改进方案,体现主动性和深度
  • 突出大模型相关项目经验,包括模型训练、评估或评测工具开发
  • 展示Python编程能力,可附上GitHub代码仓库或技术博客
  • 如有参与过开源评测基准或框架的贡献,重点体现
  • 强调对业界模型(如GPT、Llama、kimi等)的了解和使用经验
  • 学习主流大模型评测方法(如MMLU、HumanEval)并动手实践
  • 熟悉推理框架(如vllm)的部署和使用,了解其性能特点

面试指南

  • 对于技术问题,采用“概念+方法+实践”的层次,先解释原理,再举例说明,最后结合自身经验
  • 对于项目经历问题,使用STAR法则(情境、任务、行动、结果)清晰阐述
  • 对于开放性问题,可从现状分析、挑战、解决方案、预期效果等方面展开
  • 请介绍一下大模型评测的主要方法和常用基准?
  • 如何设计一个高质量的评测集?需要注意哪些方面?
  • 你如何理解MaaS产品的质量保障?与传统软件质量保障有什么区别?
  • 谈谈你使用过的大模型,比较它们的优势和不足
  • 如果评测流程效率低下,你会如何优化?

匹配度报告

78
综合匹配度

大厂高薪,前沿AI技术,WLB一般,适合技术驱动型人才。

适合人群
适合追求技术成长和高薪资的求职者,愿意在快节奏的AI赛道中持续学习。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值85

薪资福利匹配

85较高

腾讯作为一线大厂,薪资和福利具有市场竞争力,但JD未明确说明具体福利,整体补偿性较好。

薪资信号偏高 (30K-60K/月)

成长发展匹配

90较高

岗位涉及大模型评测和工具开发,技术前沿,学习机会多,但JD未明确提及晋升或培训。

技术前沿前沿/新兴技术
技术栈Python、大模型、MaaS、推理框架、模型评测
业务类型profit_center

工作生活匹配

50较低

仅现场办公,工作地点为深圳科技园,JD未提及弹性工作或WLB,生活化动机满足一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

85较高

AI行业高速增长,岗位属于前沿技术领域,虽未明确社会使命,但技术贡献具有长期价值。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • AI智能体/大模型评测高级工程师

    腾讯 · 北京市
    AI 估算 · 30k-55k
  • 腾讯文档-AI自动化测试工程师

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 腾讯云-运维工程师(北京)(成都)

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • 混元多模态研发项目经理(北京/深圳)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • 《洛克王国:世界》-资深3D场景设计-资产制作方向

    腾讯 · 武汉市
    AI 估算 · 25k-40k

相似职位推荐

  • 大模型应用算法工程师-电商业务

    小红书 · 北京市
    AI 估算 · 25k-45k
  • SW Engineer (Campus)

    大众汽车 · 合肥市
    AI 估算 · 8k-12k
  • 工程技师,合规测试 Engineering Technician, Compliance Test

    特斯拉 · 上海市
    AI 估算 · 20k-35k
  • AI算法实习生

    三七互娱 · 广州市
    AI 估算 · 4k-8k
  • Mechanical Eng.

    舍弗勒 · 上海市
    AI 估算 · 15k-25k

腾讯 的其他在招职位

  • AI智能体/大模型评测高级工程师

    腾讯 · 北京市
    AI 估算 · 30k-55k
  • 腾讯文档-AI自动化测试工程师

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 腾讯云-运维工程师(北京)(成都)

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • 混元多模态研发项目经理(北京/深圳)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • 《洛克王国:世界》-资深3D场景设计-资产制作方向

    腾讯 · 武汉市
    AI 估算 · 25k-40k

相似职位推荐

  • 大模型应用算法工程师-电商业务

    小红书 · 北京市
    AI 估算 · 25k-45k
  • SW Engineer (Campus)

    大众汽车 · 合肥市
    AI 估算 · 8k-12k
  • 工程技师,合规测试 Engineering Technician, Compliance Test

    特斯拉 · 上海市
    AI 估算 · 20k-35k
  • AI算法实习生

    三七互娱 · 广州市
    AI 估算 · 4k-8k
  • Mechanical Eng.

    舍弗勒 · 上海市
    AI 估算 · 15k-25k