字节跳动的多模态交互算法专家-PICO薪资是多少？

该职位薪资范围为 40k–80k（人民币/月）。

多模态交互算法专家-PICO的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

字节跳动的多模态交互算法专家-PICO有什么任职要求？

该职位要求硕士学历及专家级经验工作经验。

字节跳动

多模态交互算法专家-PICO

立即应聘

多模态交互算法专家-PICO

发布于大约 2 个月前

普通员工/个人贡献者

上海市

专家级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

Post-Training

World Model

多模态大模型

强化学习

数据合成

模型微调

眼动追踪

LLM

AI 估算 · 40k–80k

多模态算法专家属于AI核心岗位，技术门槛高，字节跳动薪资竞争力强，上海地区资深算法专家月薪40k-80k合理。

职位详情

关于这个职位

该职位负责探索多模态交互算法前沿，结合眼动等生理信号优化大模型，推动XR设备上的智能交互应用

你将参与多模态大模型、Agent、世界模型等核心技术研发，从数据构造到模型训练和评测，覆盖完整算法链路

适合在CV、NLP、强化学习领域有深度经验、追求技术突破的研究型工程师

最低要求

硕士学位及以上，计算机、电子、数学等相关专业

熟悉多模态大模型（VLM）、大语言模型（LLM）相关的算法技术，在相关领域有过良好的项目经验或研究经验，熟悉大模型相关的数据构造方法、预训练、Post-training算法

熟悉LLM、VLM或Agent架构，熟悉RL算法（GRPO、PPO、DPO、判别式及生成式RM）、Multi-Agent算法+工程技术，有多模态内容理解应用、AI Agent应用经验的优先

工作职责

探索大规模多模态理解与生成的基础模型，结合眼动等生理信号进行指令微调、偏好对齐、模型优化，提升数据合成、Scalable Oversight、模型推理、规划能力，构建全面客观准确的评测系统，提升大模型能力

探索前沿技术方向包括但不限于多模态RAG、Memory、Visual CoT与Agent等领域多模态模型、VLA模型、世界模型进阶能力，构建GUI/XR等虚拟世界的通用多模态Agent能力

利用预训练、合成仿真等技术对XR虚拟世界/现实世界的各类人机交互动作与环境进行建模，提供多模态交互探索的基本能力，推动应用落地，研发以多模态大模型+XR设备为核心的新技术、新产品

优先资格

具有扎实的数学、算法和机器学习基础，熟悉CV、RL、VLM、VLA等领域的技术，在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH等会议/期刊上发表论文者优先

具有优秀的代码能力，熟悉VeRL、Trl、EasyR1等训练框架，在ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先

从事过人机交互（眼动追踪、手势追踪）相关算法研究、在多模态、大模型、基础模型、强化学习、Agent等领域，主导过项目者优先

AI 洞察

优缺点分析

优点

前沿技术栈：直接接触多模态大模型、世界模型等最热门AI方向，技术成长快，行业认可度高
顶尖平台：字节跳动拥有海量数据和算力资源，项目影响力大，有机会参与从0到1的创新
丰厚回报：薪资处于行业顶尖水平，股票期权价值高，职业发展空间广阔
技术难度大：需要同时掌握多模态、强化学习、Agent等多领域知识，对数学和工程能力要求极高
竞争激烈：团队内牛人云集，需要持续学习才能保持竞争力，试错成本高
适合对多模态AI有强烈兴趣、技术功底扎实、能接受高强度研究节奏的算法工程师，尤其是有RL、Agent或XR交互经验的候选人

缺点 / 挑战

工作强度较高：字节跳动节奏快，需持续跟进前沿论文并快速迭代模型，加班可能较多

角色解读

技术路线：从算法专家进阶为技术Leader，主导多模态交互核心方向，晋升为高级研究员或首席科学家
管理路线：转向技术管理岗位，带领团队负责XR交互算法模块，逐步成为部门负责人
创业/创新：积累XR+AI前沿经验后，可内部孵化新产品或加入顶尖AI实验室
研究并改进多模态大模型，结合眼动、手势等生理信号进行指令微调和偏好对齐，提升模型在XR场景下的交互能力
探索多模态RAG、Visual CoT、Agent等前沿方向，构建通用多模态Agent，实现GUI/XR环境下的智能操作
利用预训练和合成仿真技术对交互动作与环境建模，推动多模态大模型在XR设备上的落地应用
扎实的深度学习基础，熟悉VLM、LLM架构及预训练/Post-training算法，具备多模态内容理解或生成经验
精通强化学习算法（PPO、DPO、GRPO等），有RLHF或偏好对齐实际项目经验
优秀的编程能力，熟悉PyTorch等框架，了解VeRL、Trl等训练框架，能独立实现和优化模型
对Agent技术有深入理解，具备Multi-Agent系统或AI Agent应用开发经验

申请策略

面试前了解字节PICO的产品方向（如XR头显、智能眼镜），思考多模态交互的实际应用场景，在面试中展现对业务的理解
准备一个完整的项目复盘，从问题定义、方案设计、实验对比到最终效果，突出思考和决策过程
突出多模态大模型相关项目，如VLM微调、RLHF、偏好对齐等，用具体指标（如准确率提升、推理效率）量化成果
强调强化学习实战经验，包括PPO/DPO等算法实现，以及在大模型中的应用案例
如有顶会论文或竞赛获奖，请单独列出，并说明创新点和贡献
展示Agent系统或XR交互项目，体现从算法到落地的能力
补充眼动追踪、手势识别等交互技术知识，阅读相关文献并做一个小Demo
深入学习VeRL、EasyR1等训练框架，尝试复现一篇相关论文的模型训练流程

面试指南

对于项目类问题，采用STAR原则：背景(Situation)、任务(Task)、行动(Action)、结果(Result)，重点突出算法选择的原因和实验设计
对于设计类问题，先明确目标，再分层拆解（数据、模型、训练、评测），每个环节给出可选方案并比较优劣
对于对比类问题，列出核心差异（如PPO需要奖励模型，DPO直接偏好优化），结合具体场景说明适用条件
请详细描述你做过的一个多模态大模型微调项目，包括数据构造、模型选择、训练策略和最终效果
对比PPO和DPO的优缺点，在偏好对齐中如何选择？请举例说明
设计一个基于多模态Agent的XR交互系统，包括感知、推理和动作生成模块
如何处理多模态大模型在眼动追踪数据上的泛化问题？请提出一个方案
你如何评估一个多模态模型的推理能力？请设计一个评测基准

职位点评

综合评分

前沿AI算法岗，技术成长极快，薪资顶尖，但WLB较差，适合有野心的技术专家。

更适合这类人

适合追求技术成长、愿意在高强度下快速突破、不在意WLB的算法人才。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展95

工作生活35

使命价值70

薪资福利

85较高

字节跳动薪资福利在业内极具竞争力，提供高额现金和股票，但工作强度可能较高，稳定性一般。

薪资信号偏高 (40K-80K/月)

成长发展

95较高

该职位处于多模态大模型、XR等前沿领域，技术含金量极高，字节跳动提供丰富的学习资源和内部晋升通道，成长空间巨大。

技术前沿前沿/新兴技术

技术栈多模态大模型、VLM、LLM、强化学习、Agent、眼动追踪、手势追踪、XR、World Model

业务类型profit_center

工作生活

35较低

字节跳动（上海）办公地点位于市区，但互联网大厂普遍加班较多，WLB较差，职位未提弹性工作或远程。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

该方向推动人机交互进步和XR产业发展，具有一定社会价值，但更偏商业应用，使命感中等。

行业发展高速增长赛道

社会影响中性/一般

创新程度开拓性创新（行业首创）

Watch Jobs

多模态交互算法专家-PICO

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动的其他在招职位

IDC电气技术设计专家-基础设施（深圳）

后端开发工程师（AI方向）-飞书IM

智能体安全能力专家-云安全

云网络运维工程师

AI芯片系统软件SDK/Tools工程师-系统软件

相似职位推荐

轩辕传奇-数值策划-新星引力计划

图像画质算法工程师

高性能计算专家

算法工程师

3D算法专家

字节跳动的其他在招职位

IDC电气技术设计专家-基础设施（深圳）

后端开发工程师（AI方向）-飞书IM

智能体安全能力专家-云安全

云网络运维工程师

AI芯片系统软件SDK/Tools工程师-系统软件

相似职位推荐

轩辕传奇-数值策划-新星引力计划

图像画质算法工程师

高性能计算专家

算法工程师

3D算法专家

多模态交互算法专家-PICO

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

IDC电气技术设计专家-基础设施（深圳）

后端开发工程师（AI方向）-飞书IM

智能体安全能力专家-云安全

云网络运维工程师

AI芯片系统软件SDK/Tools工程师-系统软件

相似职位推荐

轩辕传奇-数值策划-新星引力计划

图像画质算法工程师

高性能计算专家

算法工程师

3D算法专家

字节跳动 的其他在招职位

IDC电气技术设计专家-基础设施（深圳）

后端开发工程师（AI方向）-飞书IM

智能体安全能力专家-云安全

云网络运维工程师

AI芯片系统软件SDK/Tools工程师-系统软件

相似职位推荐

轩辕传奇-数值策划-新星引力计划

图像画质算法工程师

高性能计算专家

算法工程师

3D算法专家

字节跳动的其他在招职位

字节跳动的其他在招职位