美团的【基座大模型北斗实习】具身智能前沿技术研究薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

【基座大模型北斗实习】具身智能前沿技术研究的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及其它工作经验。

🤖 AI 估测：¥8K-15K

发布时间：22 天前

这是一个专注于具身智能前沿技术研究的实习岗位

你将参与构建统一的感知-决策-控制底层架构，探索将视觉、语言与动作指令深度耦合，赋予机器人理解物理世界、执行复杂任务的能力

研究方向包括具身大模型、物理世界建模、视觉导航、运动控制及人机交互等，旨在推动具身智能从实验室走向实际应用

具体地，我们关注如下研究方向：

具身大模型感知与决策：探索构建端到端（End-to-End）的Vision-Language-Action（VLA）大模型

研究如何将海量互联网多模态数据与机器人异构动作数据进行统一表征预训练，提升模型在开放场景下的零样本任务泛化能力，实现从高层逻辑推理到底层电机控制指令的平滑映射

物理世界模型与因果推理：研究基于生成式架构的物理世界模型，使机器人能够通过视频生成或状态预测“预判”行动后果

探索如何在大模型中建模物理定律（重力、摩擦、刚性/流体等），通过想象进行自监督学习和虚拟进化，解决物理实验数据稀缺与长尾场景模拟的难题

视觉语义导航与长程规划：针对大尺度、动态变化的未知环境，研究结合常识推理的视觉语言导航（VLN）技术

利用大语言模型的逻辑链（CoT）能力，将复杂的模糊指令分解为可执行的动作序列，解决具身智能在复杂物理空间中的定位、语义地图构建及长程任务中的意图保持问题

敏捷运动控制与精细操作：探索强化学习（RL）与大模型结合的全身协同控制方案

包括但不限于：人形机器人的复杂地形敏捷行走、基于触觉-视觉融合的多指灵巧手精细操作

研究如何通过Sim-to-Real技术将大规模仿真学习的策略高效迁移至真实硬件，实现丝滑的物理动作输出

具身人机交互与在线进化：构建自然的自然语言/手势交互界面，使机器人能理解人类的情境、反馈并进行修正

研究基于人类反馈的具身强化学习与示范学习，使智能体能够在与环境、人类互动的过程中实现技能的增量学习与自我迭代

硕士及以上学历，计算机科学、人工智能、机器人、软件工程、计算机视觉、自然语言处理等相关专业，博士优先

具备优秀的编程能力，熟悉PyTorch，有大规模分布式训练和物理仿真引擎（Isaac Gym, Sapien, MuJoCo）使用经验

在CV、NLP、Robotics、RL等领域顶级会议（CVPR, ICCV, ACL, NeurIPS, ICLR, ICRA, IROS等）有高质量论文发表

具有良好的沟通协作能力，对物理世界充满好奇心，有志于解决机器人领域的真实痛点问题

【基座大模型北斗实习】具身智能前沿技术研究

🤖 AI 估测：¥8K-15K

发布时间：22 天前