Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Tencent logo
腾讯
微信输入法-大模型评测数据科学分析师
立即应聘

微信输入法-大模型评测数据科学分析师

发布于 大约 11 小时前

普通员工/个人贡献者

广州市
初级经验
全职员工
仅现场办公
本科
数据分析与科学
NLP
数据分析
SQL
统计方法
numpy
大模型
评测
抽样设计
标注体系

AI 估算 · 15k–25k

腾讯大厂初级岗位,大模型方向热门,薪资竞争力强,1年经验预期15-25k/月,年终奖丰厚。

职位详情

关于这个职位

作为微信输入法团队的评测数据科学分析师,你将负责构建端到端的评测数据集与数据体系,涵盖数据采集、标注、质检及分析全流程

通过多维度数据分析助力大模型性能评估与算法迭代,与算法、产品团队紧密协作推动指标体系建设
该岗位适合对数据敏感、具备统计与编程能力,并对NLP/大模型领域有浓厚兴趣的初级人才

最低要求

数学/统计/计算机/数据科学相关专业本科及以上

年以上数据科学 / 数据分析 / 数据标注体系经验,有 NLP 或大模型相关背景优先
熟练使用 Python(pandas / numpy / sklearn)、SQL,能独立完成数据 pipeline
熟悉常见统计方法(假设检验、置信区间、Bootstrap、相关性分析)
对数据质量极其敏感,具备良好的抽样设计、偏差分析、异常检测能力
有大模型评测集 / 标注平台 / Bad Case 分析经验者优先

工作职责

数据体系设计:围绕评测业务,设计端到端的数据生产链路,包括 query 采集、分层抽样、标注体系、质检方案、版本管理

评测数据集构建:主导高质量评测集(含 SFT 评测集、安全评测集、业务评测集)的建设,确保覆盖度、区分度与稳定性
数据分析与洞察:基于评测结果做多维度数据分析(模型对比、版本对比、Bad Case 聚类、能力雷达图),为算法和业务决策提供量化依据
标注体系搭建:设计标注规范、培训外包/众包团队、构建一致性指标(Kappa、IAA),持续提升标注质量
指标体系建设:与算法、产品共建评测指标体系(自动指标 + 人工指标 + 业务指标),并推动指标上线与监控

优先资格

有 NLP 或大模型相关背景优先

有大模型评测集 / 标注平台 / Bad Case 分析经验者优先

AI 洞察

优缺点分析

优点

  • 身处腾讯大厂,接触前沿大模型业务,技术栈新、成长快
  • 工作内容与AI核心评测紧密相关,技能可迁移性强,积累数据科学全流程经验
  • 团队协作模式成熟,可与算法、产品多方配合,拓宽业务视野
  • 对沟通协调能力要求高,需频繁与外包团队、算法、产品对齐标准
  • 工作节奏可能较快,大模型迭代快,需快速响应评测需求
  • 适合热爱数据、关注细节、对NLP/大模型有好奇心,且愿意在数据驱动方向上积累的初级人才

缺点 / 挑战

  • 评测数据量大、质量要求极高,需要应对复杂的标注管理和质检压力

角色解读

  • 初级数据分析师 → 高级数据科学家 → 数据科学团队负责人
  • 横向拓展:可转向算法方向的模型评估、AI产品经理或标注平台产品经理
  • 深耕大模型评测领域,成为评测专家,推动行业标准建设
  • 设计并维护大模型评测数据集的生产链路,包括数据采集、标注、质检和版本管理
  • 主导高质量评测集的构建(如SFT、安全、业务评测集),确保数据覆盖度与区分度
  • 对评测结果进行多维度数据分析(模型对比、Bad Case聚类等),输出量化洞察供算法决策
  • 扎实的编程能力:熟练使用Python(pandas/numpy/sklearn)和SQL处理数据
  • 统计学基础:掌握假设检验、置信区间、Bootstrap等常见统计方法
  • 数据质量意识:精通抽样设计、偏差分析和异常检测,对数据质量高度敏感
  • NLP/大模型背景优先:了解评测方法论或标注体系更佳

申请策略

  • 关注微信输入法产品动态,面试时体现对产品评测的理解,可主动提出优化建议
  • 强调严谨的数据思维和主动性:如何提前发现数据问题、规避偏差
  • 突出数据科学项目经历,尤其是与NLP或大模型相关的评测、标注、数据分析经验
  • 展示熟练使用Python和SQL的数据处理能力,可附代码片段或项目链接
  • 强调统计学方法应用案例(如A/B测试、假设检验)和数据质量把控经验
  • 如有标注平台搭建或外包团队管理经验,务必重点描述
  • 补强大模型评测相关知识:了解SFT、RLHF评测指标,熟悉常用benchmark(MMLU、HumanEval等)
  • 提升数据分析可视化能力:学习matplotlib、seaborn或Tableau

面试指南

  • STAR法则:先说明背景(Situation/Task),再讲行动(Action),最后是结果(Result)
  • 数据驱动思维:每个回答都要体现数据量、分析方法、结论及业务影响
  • 结构化表达:先总后分,例如“从三个维度分析:覆盖度、区分度、稳定性”
  • 如何设计一个评测数据集?请举例说明抽样方法和质检流程
  • 你如何处理标注一致性低的问题?请阐述Kappa指标的计算和解读
  • 有Bad Case分析经验吗?如何通过聚类发现模型薄弱点?
  • 给定一个评测结果,请分析模型A与模型B的差异(使用假设检验等)
  • 描述一次你通过数据发现业务问题并推动改进的经历

职位点评

70
综合评分

腾讯大厂大模型评测岗,技术前沿、薪资中等偏上,WLB一般,适合发展导向型人才。

更适合这类人
最适合注重技术成长和前沿领域积累的求职者,愿意接受一定的工作强度以换取平台和技能提升。
表现最好
成长发展
相对薄弱
工作生活
薪资福利70
成长发展85
工作生活50
使命价值75

薪资福利

70中等

职位薪资在腾讯大厂中属于市场中等偏上水平,福利完善(五险一金、年终奖等),但JD未明确具体薪资,且初级岗位薪资天花板有限。

薪资信号未披露(AI估算:15K-25K/月)

成长发展

85较高

大模型评测是前沿领域,技术栈现代(Python/SQL/统计),有明确的数据科学成长路径,且JD提及与大模型相关,但未明确提及导师制或培训。

技术前沿前沿/新兴技术
技术栈大模型、NLP、Python、SQL、pandas、numpy、sklearn、统计方法
业务类型profit_center

工作生活

50较低

仅现场办公,地点在科技园,未提及弹性工作或远程,且大厂节奏可能较快,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

75中等

微信输入法属于成熟产品,大模型评测对产品迭代有直接价值,但JD未强调社会使命或创新。行业处于高速增长,但岗位偏向技术支撑。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 《王者荣耀》游戏AI Bot算法研究员

    腾讯 · 成都市
    AI 估算 · 25k-45k
  • Supercell游戏《皇室战争》-数值策划

    腾讯 · 深圳市
    AI 估算 · 20k-40k
  • 腾讯云汽车行业解决方案架构师

    腾讯 · 上海市
    AI 估算 · 30k-55k
  • 自研IP二次元项目-资深3D角色

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • 腾讯云汽车行业-AI交付方案工程师(FDE方向)

    腾讯 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 无人机 - 商业分析项目实习生

    美团 · 北京市
    AI 估算 · 4k-7k
  • Portfolio Planning Intern

    通用汽车 · 上海市
    AI 估算 · 3k-6k
  • 数据分析高级专员

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k
  • 数据挖掘与分析高级专员

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k
  • 数据分析(MJ035678)

    携程 · 上海市
    AI 估算 · 15k-25k

腾讯 的其他在招职位

  • 《王者荣耀》游戏AI Bot算法研究员

    腾讯 · 成都市
    AI 估算 · 25k-45k
  • Supercell游戏《皇室战争》-数值策划

    腾讯 · 深圳市
    AI 估算 · 20k-40k
  • 腾讯云汽车行业解决方案架构师

    腾讯 · 上海市
    AI 估算 · 30k-55k
  • 自研IP二次元项目-资深3D角色

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • 腾讯云汽车行业-AI交付方案工程师(FDE方向)

    腾讯 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 无人机 - 商业分析项目实习生

    美团 · 北京市
    AI 估算 · 4k-7k
  • Portfolio Planning Intern

    通用汽车 · 上海市
    AI 估算 · 3k-6k
  • 数据分析高级专员

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k
  • 数据挖掘与分析高级专员

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k
  • 数据分析(MJ035678)

    携程 · 上海市
    AI 估算 · 15k-25k