Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Baidu logo
百度
大模型评估PM实习生(J100379)
立即应聘

大模型评估PM实习生(J100379)

发布于 大约 13 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
硕士
实习与临时职位
LLM
跨部门协作
评估
VLM
大模型
GTM

AI 估算 · 5k–7k

百度实习生薪资在行业属中上水平,结合硕士学历要求和大模型热门方向,月薪约5000-7000元。

职位详情

关于这个职位

该职位是百度的大模型评估PM实习生,负责参与大模型评估体系的构建与优化,包括benchmark搭建、评估方法改进以及跨团队协作

适合对AI大模型评估有深入理解,具备一定开发能力的研究生同学

最低要求

良好的跨部门沟通与协作能力,具备自我驱动意识

具备计算机/机器学习/NLP/人工智能相关领域硕士及以上学历,或同等的科研/工程经验
对大模型(LLM/VLM等)的评估方法有深入理解,有benchmark构建或评测研究经验优先
具备一定开发能力(如评估脚本、自动化流程搭建),具备一定独立研究能力,能将策略方法落地到工程实践

工作职责

对大模型落地场景感兴趣,与GTM团队沟通、梳理客户场景的评估标准,做到可量化评估

参与自有benchmark的构建、优化评估方法的区分度、稳定性与公允性,涵盖通用能力、垂直领域和多模态等维度
对开源benchmark有一定了解,能够独立完成benchmark适配到评估结果分析全流程工作
与模型训练、产品、算法等多团队密切协作,推动评估体系与模型迭代紧密联动

AI 洞察

优缺点分析

优点

  • 深度参与前沿的大模型评估工作,积累稀缺的AI评估经验
  • 百度平台资源丰富,可接触业界顶尖技术和团队
  • 跨部门协作机会多,提升沟通和项目管理能力
  • 实习薪资和福利在行业内具有竞争力
  • 评估工作需要严谨的逻辑和细致的态度,对细节要求高
  • 大模型领域技术迭代快,需要持续学习跟进
  • 适合对AI大模型有浓厚兴趣,具备技术背景且希望从事评估或产品方向的研究生

缺点 / 挑战

  • 需同时掌握技术和沟通能力,对综合能力要求较高

角色解读

  • 在百度积累大模型评估经验后,可向AI算法工程师或AI产品经理方向发展
  • 深入了解大模型产业落地,未来可成为AI解决方案专家或评估架构师
  • 实习表现优异有机会转正,进入百度核心AI团队
  • 与GTM团队沟通客户场景,制定可量化的评估标准
  • 构建和优化自有benchmark,提升评估方法的区分度、稳定性和公允性
  • 独立完成开源benchmark的适配和评估结果分析
  • 与模型训练、产品、算法团队协作,推动评估体系与模型迭代联动
  • 扎实的机器学习和NLP知识,熟悉大模型评估方法
  • 具备一定的编程能力,如Python脚本编写和自动化流程搭建
  • 良好的沟通协作能力,能够跨部门推动工作
  • 独立研究和解决问题能力,能够将策略落地为工程实践

申请策略

  • 在面试中展现对大模型评估领域的热情和独到见解
  • 提前了解百度AI生态及大模型落地场景,思考评估的难点
  • 突出相关项目经验,如参与过NLP竞赛或大模型评测研究
  • 强调编程能力,特别是Python、数据处理和自动化脚本经验
  • 展示跨团队协作或产品思维的经验,例如与产品、算法团队的合作
  • 如有发表的论文或公开的benchmark贡献,务必提及
  • 深入学习主流大模型评估方法,如MMLU、GSM8K等benchmark的原理
  • 强化Python编程,练习编写评估脚本和数据分析

面试指南

  • STAR法则:描述情景、任务、行动和结果,突出技术细节和团队协作
  • 方法论+实践:先讲理论框架,再结合具体案例说明如何应用
  • 问题导向:分析评估中常见的偏差和挑战,提出解决方案
  • 请简述你对大模型评估的理解,以及你认为评估中最具挑战的部分是什么?
  • 你用过哪些benchmark?如何保证评估结果的公平性和有效性?
  • 描述一次你跨团队协作的经历,你是如何推动项目进展的?
  • 给定一个客户场景,你会如何设计评估标准和流程?
  • 介绍一个你参与过的AI项目,你扮演了什么角色,遇到了哪些问题?

匹配度报告

75
综合匹配度

百度大模型评估实习生,前沿技术栈,发展前景极好,但需要现场办公,WLB一般。

适合人群
最适合追求技术成长和行业前沿的学习型求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展95
工作生活50
使命价值85

薪资福利匹配

70中等

实习薪资在百度属于中上水平,福利包括餐补等,但稳定性不如正式员工,综合评分中等偏上。

薪资信号未披露(AI估算:5K-7K/月)

成长发展匹配

95较高

大模型评估是前沿方向,能接触核心技术栈,成长机会极大,而且有跨团队协作经验,发展动机得到高度满足。

技术前沿前沿/新兴技术
技术栈大模型、LLM、VLM、Benchmark、评估
业务类型profit_center

工作生活匹配

50较低

实习生通常要求现场办公,北京通勤压力大,且未提及弹性工作或WLB,因此满足程度一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

大模型评估推动AI落地,对社会有积极影响,行业增长迅速,意义感较强。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • 北京-C++/PHP/GO研发工程师(J100595)

    百度 · 北京市
    AI 估算 · 18k-25k
  • 海外经营分析与外包管理实习生(J100528)

    百度 · 深圳市
    AI 估算 · 4k-6k
  • 医疗行业产品经理(J100516)

    百度 · 北京市
    AI 估算 · 15k-25k
  • 产品经理(供应链方向)(J100458)

    百度 · 北京市
    AI 估算 · 4k-6k
  • 测试工程师(J100550)

    百度 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • Intern-Cgt Marketing

    沃特世 · 上海市
    AI 估算 · 4k-6k
  • 创作者运营实习生(舞蹈垂类方向)

    小红书 · 上海市
    AI 估算 · 3k-5k
  • 公关部内容运营实习生

    小红书 · 北京市
    AI 估算 · 4k-6k
  • 实习生-生态产品实习生

    阅文集团 · 上海市
    AI 估算 · 4k-6k
  • 景点玩乐运营实习生(郑州)(MJ035511)

    携程 · 郑州市
    AI 估算 · 2k-4k

百度 的其他在招职位

  • 北京-C++/PHP/GO研发工程师(J100595)

    百度 · 北京市
    AI 估算 · 18k-25k
  • 海外经营分析与外包管理实习生(J100528)

    百度 · 深圳市
    AI 估算 · 4k-6k
  • 医疗行业产品经理(J100516)

    百度 · 北京市
    AI 估算 · 15k-25k
  • 产品经理(供应链方向)(J100458)

    百度 · 北京市
    AI 估算 · 4k-6k
  • 测试工程师(J100550)

    百度 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • Intern-Cgt Marketing

    沃特世 · 上海市
    AI 估算 · 4k-6k
  • 创作者运营实习生(舞蹈垂类方向)

    小红书 · 上海市
    AI 估算 · 3k-5k
  • 公关部内容运营实习生

    小红书 · 北京市
    AI 估算 · 4k-6k
  • 实习生-生态产品实习生

    阅文集团 · 上海市
    AI 估算 · 4k-6k
  • 景点玩乐运营实习生(郑州)(MJ035511)

    携程 · 郑州市
    AI 估算 · 2k-4k