Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
多模态交互算法专家-PICO
立即应聘

多模态交互算法专家-PICO

发布于 1 天前

普通员工/个人贡献者

上海市
专家级经验
全职员工
仅现场办公
硕士
强化学习
LLM
数据合成
模型微调
VLM
CV
RL
多模态大模型
眼动追踪
XR

AI 估算 · 40k–80k

多模态算法专家属于AI核心岗位,技术门槛高,字节跳动薪资竞争力强,上海地区资深算法专家月薪40k-80k合理。

职位详情

关于这个职位

该职位负责探索多模态交互算法前沿,结合眼动等生理信号优化大模型,推动XR设备上的智能交互应用

你将参与多模态大模型、Agent、世界模型等核心技术研发,从数据构造到模型训练和评测,覆盖完整算法链路
适合在CV、NLP、强化学习领域有深度经验、追求技术突破的研究型工程师

最低要求

硕士学位及以上,计算机、电子、数学等相关专业

熟悉多模态大模型(VLM)、大语言模型(LLM)相关的算法技术,在相关领域有过良好的项目经验或研究经验,熟悉大模型相关的数据构造方法、预训练、Post-training算法
熟悉LLM、VLM或Agent架构,熟悉RL算法(GRPO、PPO、DPO、判别式及生成式RM)、Multi-Agent算法+工程技术,有多模态内容理解应用、AI Agent应用经验的优先

工作职责

探索大规模多模态理解与生成的基础模型,结合眼动等生理信号进行指令微调、偏好对齐、模型优化,提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测系统,提升大模型能力

探索前沿技术方向包括但不限于多模态RAG、Memory、Visual CoT与Agent等领域多模态模型、VLA模型、世界模型进阶能力,构建GUI/XR等虚拟世界的通用多模态Agent能力
利用预训练、合成仿真等技术对XR虚拟世界/现实世界的各类人机交互动作与环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以多模态大模型+XR设备为核心的新技术、新产品

优先资格

具有扎实的数学、算法和机器学习基础,熟悉CV、RL、VLM、VLA等领域的技术,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH等会议/期刊上发表论文者优先

具有优秀的代码能力,熟悉VeRL、Trl、EasyR1等训练框架,在ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先
从事过人机交互(眼动追踪、手势追踪)相关算法研究、在多模态、大模型、基础模型、强化学习、Agent等领域,主导过项目者优先

AI 洞察

优缺点分析

优点

  • 前沿技术栈:直接接触多模态大模型、世界模型等最热门AI方向,技术成长快,行业认可度高
  • 顶尖平台:字节跳动拥有海量数据和算力资源,项目影响力大,有机会参与从0到1的创新
  • 丰厚回报:薪资处于行业顶尖水平,股票期权价值高,职业发展空间广阔
  • 技术难度大:需要同时掌握多模态、强化学习、Agent等多领域知识,对数学和工程能力要求极高
  • 竞争激烈:团队内牛人云集,需要持续学习才能保持竞争力,试错成本高
  • 适合对多模态AI有强烈兴趣、技术功底扎实、能接受高强度研究节奏的算法工程师,尤其是有RL、Agent或XR交互经验的候选人

缺点 / 挑战

  • 工作强度较高:字节跳动节奏快,需持续跟进前沿论文并快速迭代模型,加班可能较多

角色解读

  • 技术路线:从算法专家进阶为技术Leader,主导多模态交互核心方向,晋升为高级研究员或首席科学家
  • 管理路线:转向技术管理岗位,带领团队负责XR交互算法模块,逐步成为部门负责人
  • 创业/创新:积累XR+AI前沿经验后,可内部孵化新产品或加入顶尖AI实验室
  • 研究并改进多模态大模型,结合眼动、手势等生理信号进行指令微调和偏好对齐,提升模型在XR场景下的交互能力
  • 探索多模态RAG、Visual CoT、Agent等前沿方向,构建通用多模态Agent,实现GUI/XR环境下的智能操作
  • 利用预训练和合成仿真技术对交互动作与环境建模,推动多模态大模型在XR设备上的落地应用
  • 扎实的深度学习基础,熟悉VLM、LLM架构及预训练/Post-training算法,具备多模态内容理解或生成经验
  • 精通强化学习算法(PPO、DPO、GRPO等),有RLHF或偏好对齐实际项目经验
  • 优秀的编程能力,熟悉PyTorch等框架,了解VeRL、Trl等训练框架,能独立实现和优化模型
  • 对Agent技术有深入理解,具备Multi-Agent系统或AI Agent应用开发经验

申请策略

  • 面试前了解字节PICO的产品方向(如XR头显、智能眼镜),思考多模态交互的实际应用场景,在面试中展现对业务的理解
  • 准备一个完整的项目复盘,从问题定义、方案设计、实验对比到最终效果,突出思考和决策过程
  • 突出多模态大模型相关项目,如VLM微调、RLHF、偏好对齐等,用具体指标(如准确率提升、推理效率)量化成果
  • 强调强化学习实战经验,包括PPO/DPO等算法实现,以及在大模型中的应用案例
  • 如有顶会论文或竞赛获奖,请单独列出,并说明创新点和贡献
  • 展示Agent系统或XR交互项目,体现从算法到落地的能力
  • 补充眼动追踪、手势识别等交互技术知识,阅读相关文献并做一个小Demo
  • 深入学习VeRL、EasyR1等训练框架,尝试复现一篇相关论文的模型训练流程

面试指南

  • 对于项目类问题,采用STAR原则:背景(Situation)、任务(Task)、行动(Action)、结果(Result),重点突出算法选择的原因和实验设计
  • 对于设计类问题,先明确目标,再分层拆解(数据、模型、训练、评测),每个环节给出可选方案并比较优劣
  • 对于对比类问题,列出核心差异(如PPO需要奖励模型,DPO直接偏好优化),结合具体场景说明适用条件
  • 请详细描述你做过的一个多模态大模型微调项目,包括数据构造、模型选择、训练策略和最终效果
  • 对比PPO和DPO的优缺点,在偏好对齐中如何选择?请举例说明
  • 设计一个基于多模态Agent的XR交互系统,包括感知、推理和动作生成模块
  • 如何处理多模态大模型在眼动追踪数据上的泛化问题?请提出一个方案
  • 你如何评估一个多模态模型的推理能力?请设计一个评测基准

匹配度报告

71
综合匹配度

前沿AI算法岗,技术成长极快,薪资顶尖,但WLB较差,适合有野心的技术专家。

适合人群
适合追求技术成长、愿意在高强度下快速突破、不在意WLB的算法人才。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活35
使命价值70

薪资福利匹配

85较高

字节跳动薪资福利在业内极具竞争力,提供高额现金和股票,但工作强度可能较高,稳定性一般。

薪资信号偏高 (40K-80K/月)

成长发展匹配

95较高

该职位处于多模态大模型、XR等前沿领域,技术含金量极高,字节跳动提供丰富的学习资源和内部晋升通道,成长空间巨大。

技术前沿前沿/新兴技术
技术栈多模态大模型、VLM、LLM、强化学习、Agent、眼动追踪、手势追踪、XR、World Model
业务类型profit_center

工作生活匹配

35较低

字节跳动(上海)办公地点位于市区,但互联网大厂普遍加班较多,WLB较差,职位未提弹性工作或远程。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

该方向推动人机交互进步和XR产业发展,具有一定社会价值,但更偏商业应用,使命感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k