奔驰的MVA Multi-Modality Interaction Developer薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

MVA Multi-Modality Interaction Developer的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：23 天前

这是一个专注于汽车智能座舱多模态交互开发的高级技术岗位

你将负责整合语音、视觉、传感器等多种数据，构建面向大语言模型（LLM）的智能交互系统，并实现与车辆功能的深度联动

核心工作涉及多模态数据融合、LLM推理层应用以及跨团队技术协作，旨在打造下一代智能汽车助手

基于当前主流语音系统（如SSPE、唤醒、VAD、ASR、NLU、DM、TTS、LLM等）进行开发

设计和实现融合语音、驾驶员监控系统（DMS）摄像头、乘员监控系统（OMS）摄像头、行车记录仪、麦克风、传感器、音频系统状态、声纹和车辆状态数据的多模态融合方案

将多模态输入归一化和结构化，形成适合LLM推理的系统上下文表示，以支持未来的LLM助手用例，例如：上下文感知对话、助手记忆收集与应用等

设计和维护一致的多模态数据管道，处理数据从车辆系统流向LLM就绪的上下文表示过程中的时间对齐、归一化和状态一致性

通过面向服务的API调用车辆系统能力，实现对车辆功能的意图驱动控制

集成和抽象来自多个车辆ECU（音频、摄像头、传感器、车身、ADAS等）的数据，并具备独立探索和接入新数据源的能力

与电子电气（EE）、平台、人工智能（AI）和用户体验（UX）团队紧密合作，充当跨团队的技术桥梁

具备语音或语音助手系统开发经验，包括唤醒词、语音活动检测（VAD）、自动语音识别（ASR）、自然语言理解（NLU）、对话管理、文本转语音（TTS）以及LLM集成

拥有多模态数据集成与融合的实践经验，能够结合音频、摄像头、传感器和车辆状态信息

深入理解多模态数据管道，包括为LLM准备上下文所需的归一化、时间对齐和状态一致性处理

具备将LLM作为推理层使用的实践经验，包括上下文准备和安全应用输出

能够通过面向服务的车辆API，实现基于意图的车辆功能控制

拥有嵌入式或汽车系统集成经验，能够跨多个电子控制单元（ECU，如音频、摄像头、传感器、车身、ADAS）工作

扎实理解Android系统架构，最好是Android Automotive OS

具备强大的跨团队技术沟通能力和独立解决问题的能力

MVA Multi-Modality Interaction Developer

🤖 AI 估测：¥35K-60K

发布时间：23 天前