Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/顶尖应届-多模态端到端算法工程师-自动驾驶
Xiaomi logo
X
小米 (Xiaomi)

职位信息

上海市
无经验要求
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorch自动驾驶VLMVLA多模态大模型RLHFLatent Action Modeling
💡

核心评价

技术顶尖、前景广阔的大厂核心研发岗,成长空间巨大,适合追求技术挑战与行业影响力的顶尖人才。

顶尖应届-多模态端到端算法工程师-自动驾驶

🤖 AI 估测:¥30K-45K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个面向顶尖应届毕业生的多模态端到端算法工程师职位,专注于自动驾驶领域
你将负责研究视觉语言大模型(VLM/VLA)在驾驶场景下的应用,构建从感知到决策的端到端智能体
核心工作包括跨模态表示学习、联合预训练方法探索以及高质量多模态数据集的构建

✓工作职责

研究VLM/VLA大模型的跨模态表示机制,构建适用于驾驶语境的latent policy head
探索视觉语言到行为(VL2A)的联合预训练方法,设计引导式数据生成与指令微调机制
构建视觉语言行为多模态数据集,支持高质量对齐(如视觉意图对话、轨迹文字描述)
探索embedding space中的行为压缩、潜变量建模、语言驱动的轨迹解码与规划决策

⭐最低要求

人工智能、自然语言处理、机器学习、认知科学等相关专业硕士及以上学历
熟悉Transformer-based多模态模型结构,如BLIP-2、Flamingo、BEiT、ViT+LLaMA等
有VLM基础模型finetune经验,对latent policy / latent action建模有深入研究

👍优先资格

在顶会发表相关工作,尤其是VLA、latent policy、指令微调领域
有BEV-LLaVA、Drive-GPT、Latent Driver等相关系统研究或实践经验
有构建高质量V+L+A数据集经验(行为图文配对、语言行为对齐)
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公