Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
LongCat - 数据策略与数据科学算法研究员
立即应聘

LongCat - 数据策略与数据科学算法研究员

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
深度学习
模型评估
PyTorch
预训练
数据清洗
大语言模型
合成数据
数据策略
Data Mixture

AI 估算 · 35k–60k

美团技术团队高级算法研究员,前沿AI方向,技术要求高,市场竞争力强,薪资处于行业高位。

职位详情

关于这个职位

加入美团核心本地商业基础研发平台,你将专注于大规模预训练数据的策略与科学,通过数据理解、筛选、配比、合成和系统化迭代,提升基础模型的scaling efficiency与智能上限

你将与业界一流工程师共同探索数据分布与模型能力之间的可解释映射,构建数据飞轮,推动AI技术的边界

最低要求

熟悉 Python 和 PyTorch 等深度学习框架,具备扎实的机器学习、深度学习、概率统计和算法基础

熟悉大语言模型或多模态基础模型训练流程,理解预训练数据、训练动态、模型能力和评估体系之间的关系
有大规模预训练、Data Mixture、合成数据或模型评估经验者优先
对预训练数据有系统性理解,熟悉数据清洗、去重、污染检测、质量评估、覆盖度建模、长序列组织、合成 / 蒸馏数据和数据配比等关键问题
具备优秀的实验设计和分析能力,能够围绕数据与模型能力提出 hypothesis,设计可复现实验,并基于训练动态、评测结果和模型行为分析实验结论

工作职责

研究数据来源、质量、多样性、难度、覆盖度与模型能力之间的关系,建立“数据分布—训练动态—模型效果”的分析与归因框架

探索面向预训练的数据价值建模方法,包括自动化质量评估、样本筛选、语义去重、污染检测、覆盖度建模、长序列数据组织与高价值 token 挖掘
研究 Data Mixture、动态配比、课程学习和多阶段训练策略,分析不同类型数据在不同模型规模、训练阶段和能力维度上的边际收益,提升 token efficiency 与 scaling efficiency
探索合成数据、蒸馏数据、模型自生成数据和反馈数据在预训练中的有效使用方式,研究合成数据的有效性、多样性保持、退化机制和训练配比策略
构建可复现、可扩展的大规模数据处理与实验闭环,将数据构建、训练验证、能力评测、数据诊断和策略更新结合起来,形成面向基础模型持续迭代的数据飞轮
研究并缓解预训练数据中的污染、偏差、重复、低质、隐私、安全和合规风险,提升数据策略的可靠性、可控性和可持续性

AI 洞察

优缺点分析

优点

  • 接触最前沿的AI数据策略研究,技术成长快
  • 美团海量数据和算力资源,实验环境优越
  • 团队技术氛围浓厚,有完善的内部学习生态
  • 职位直接影响基础模型能力,成就感强
  • 对数学、统计和算法功底要求极高,学习曲线陡峭
  • 涉及大规模数据处理和训练,工程复杂度高
  • 竞争激烈,需要持续输出创新性成果

缺点 / 挑战

  • 适合对数据驱动AI有强烈兴趣、具备扎实算法和编程基础、乐于挑战前沿技术难题的研究型工程师

角色解读

  • 从研究员成长为数据策略方向的技术专家或团队负责人
  • 向更前沿的AI领域延伸,如多模态、强化学习等
  • 在美团内部或行业内成为数据驱动模型优化的权威
  • 研究数据质量、多样性等与模型能力的关系,建立分析框架
  • 开发自动化数据价值评估、筛选、去重、污染检测等算法
  • 设计数据混合、动态配比、课程学习等训练策略,提升训练效率
  • 探索合成数据、蒸馏数据的使用方式,构建数据飞轮迭代闭环
  • 精通Python和PyTorch,扎实的机器学习与深度学习基础
  • 深入理解大语言模型预训练流程和数据策略
  • 强大的实验设计与数据分析能力,能从数据中提出假设并验证
  • 熟悉数据清洗、去重、质量评估等数据处理技术

申请策略

  • 深入了解美团在数据策略方面的业务场景和技术布局,面试中展现契合度
  • 准备1-2个数据策略相关的深度思考或改进方案,体现创新性
  • 突出预训练、Data Mixture或合成数据相关的项目经验
  • 强调Python/PyTorch的熟练度以及大规模数据处理能力
  • 展示实验设计能力,如提出并验证数据策略假设的案例
  • 如有论文或开源贡献,重点说明
  • 系统学习大语言模型训练原理和数据策略文献
  • 动手复现经典数据策略实验,积累实操经验

面试指南

  • 结构化回答:先阐述核心概念,再分解问题,最后给出具体方案或案例
  • 结合理论与实践,引用相关文献或经验,强调可复现性和可扩展性
  • 展示批判性思维:讨论假设、局限性和改进方向
  • 如何评估预训练数据的质量?请设计一个自动化评估方案
  • 解释Data Mixture和动态配比的原理,如何确定最优配比?
  • 描述一个你处理过的数据偏差或污染问题,你是如何解决的?
  • 如何设计实验验证数据策略对模型性能的影响?
  • 你对合成数据在预训练中的作用和局限性有何理解?

匹配度报告

66
综合匹配度

前沿AI数据策略研究,技术成长快,但工作强度可能较大。

适合人群
最适合追求技术成长和前沿挑战、对WLB要求不高的发展型求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值60

薪资福利匹配

75中等

美团作为上市公司,薪资福利具有竞争力,但JD中未明确具体薪资和福利,补偿性动机满足度中等偏上。

薪资信号未披露(AI估算:35K-60K/月)

成长发展匹配

90较高

职位涉及最前沿的AI数据策略,有超大规模数据和算力支持,团队技术氛围浓厚,学习生态圈完善,发展性动机高度满足。

技术前沿前沿/新兴技术
技术栈Python、PyTorch、大语言模型、预训练、Data Mixture、合成数据
成长机会学习生态圈、非线性成长
业务类型profit_center

工作生活匹配

40较低

JD未提及远程或弹性工作,且互联网公司核心研发岗位通常工作强度较大,生活化动机满足度较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

60中等

AI数据策略属于前沿技术领域,行业增长迅速,但JD未明确社会价值或使命感,意义感动机满足度一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 政府投诉调解(驻所A)

    美团 · 北京市
    AI 估算 · 8k-15k
  • 商家端产品运营

    美团 · 北京市
    AI 估算 · 18k-30k
  • 用户体验调研运营(NPS方向)

    美团 · 北京市
    AI 估算 · 18k-28k
  • 充电宝-下沉战区-销售BD(渤海区域-保定、廊坊、烟台、威海、张家口、吉林、邯郸、潍坊、东营、太原)

    美团 · 保定市
    AI 估算 · 6k-15k
  • 视频拍摄及制作项目实习(客户案例&产品方向)

    美团 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 智能系统评估研究科学家-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 视觉感知算法工程师-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-45k
  • 番茄模型运维(模型开发方向)运营-CQC

    字节跳动 · 北京市
    AI 估算 · 30k-50k

美团 的其他在招职位

  • 政府投诉调解(驻所A)

    美团 · 北京市
    AI 估算 · 8k-15k
  • 商家端产品运营

    美团 · 北京市
    AI 估算 · 18k-30k
  • 用户体验调研运营(NPS方向)

    美团 · 北京市
    AI 估算 · 18k-28k
  • 充电宝-下沉战区-销售BD(渤海区域-保定、廊坊、烟台、威海、张家口、吉林、邯郸、潍坊、东营、太原)

    美团 · 保定市
    AI 估算 · 6k-15k
  • 视频拍摄及制作项目实习(客户案例&产品方向)

    美团 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 智能系统评估研究科学家-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 视觉感知算法工程师-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-45k
  • 番茄模型运维(模型开发方向)运营-CQC

    字节跳动 · 北京市
    AI 估算 · 30k-50k