核心模型优化* :主导语音识别、多模态融合等座舱核心模型后训练与精调,突破 Code-Switching(中英混杂)、方言 - 普通话混合识别难点,提升指令解析准确率
交互能力搭建* :设计座舱 Agent Function Calling 框架,优化自然语言意图到车控 API 的精准映射,解决多轮对话、上下文指代等复杂交互的参数填充与依赖推理
多模态融合* :研发视觉、语音、触控、车态信号四模态融合决策模型,处理跨模态冲突场景,优化多模态协同决策效率
落地与适配* :负责模型与座舱软硬件的协同适配,支撑产品研发、Demo 验证及车展展示需求,主导相关技术规范制定