小马智行的资深系统架构师 - 车载语音助手(AI Orchestration & Logic)-广州薪资是多少？

该职位薪资范围为 45k–65k（人民币/月）。

资深系统架构师 - 车载语音助手(AI Orchestration & Logic)-广州的工作地点在哪里？

该职位工作地点位于广州市。工作形式为仅现场办公。

该职位要求本科学历及专家级经验工作经验。

🤖 AI 估测：¥45K-65K

发布时间：大约 18 小时前

作为小马智行车载语音助手的系统架构师，你将负责设计高并发、低延迟的AI编排层，构建混合意图引擎，实现LLM与车控指令的极速响应

该职位深度集成大语言模型，面向数万台智能汽车，是AI在车载场景落地的核心角色

AI 编排与对话引擎设计 (AI Orchestration)

业务中枢构建：主导 ASR-LLM-TTS 全链路的流式业务编排，确保端云协同下的整体交互延迟（TTFT）处于行业领先水平

对话管理 (DM)：设计并维护支持高并发的多轮对话状态机，处理复杂的上下文记忆、意图切换、任务中断与恢复逻辑

Agent 架构：构建基于 Agent 的任务规划系统，将模糊的语义请求转化为严谨的结构化指令（JSON），实现对车控、导航、媒体等 API 的精准调度

混合意图引擎与“快慢路径”设计 (Hybrid Intent Engine)

分流机制：设计“分类小模型（快路径）”与“LLM（慢路径）”的并行路由策略

针对高频车控指令实现毫秒级极速响应，无需等待大模型推理

置信度仲裁：建立一套完善的指令仲裁与回滚策略，解决小模型误识别与 LLM 幻觉之间的冲突

槽位提取优化：针对操作性指令设计轻量级的 NER（实体识别）与槽位填充能力，提升系统整体能效比

多模型路由与网关适配 (Model Gateway & Routing)

模型路由：构建统一的模型网关适配层，支持在多个外部 LLM 供应商（如 OpenAI, 文心, 千问等）与私有化模型之间进行动态切换与负载均衡

降级与容灾：设计业务层的服务降级预案，确保在云端模型故障或弱网环境下，基础车控功能依然 100% 可用

工程卓越性与数据闭环 (Engineering Excellence)

协议定义：与 Infra 团队协作，定义高效的端云通信协议（基于 gRPC/Protobuf），优化中间文本与音频流的传输效率

成本控制：通过语义缓存（Semantic Cache）、模型量化建议等手段，在大规模交互场景下显著降低 Token 消耗成本

架构资历：8 年以上后端开发经验，3 年以上大型分布式系统架构经验

有处理过日均百万级交互或十万级并发连接业务逻辑的实战经验

技术栈：精通 Go 或 Python，具备极强的高性能异步编程能力

AI 背景：深度理解 LLM 能力边界，熟悉 RAG 架构、Function Calling 以及 Prompt Engineering 的工程化落地

协议理解：深刻理解 gRPC、HTTP/2 双向流通信，能够设计高性能的二进制传输契约

有智能音箱、语音机器人或车载 TSP 平台核心架构经验

在端侧（Android/高通平台）有模型部署与推理优化（ONNX/TFLite）的跨端协作经验

参与过知名 AI Agent 框架或分布式调度系统的开源贡献

资深系统架构师 - 车载语音助手(AI Orchestration & Logic)-广州

🤖 AI 估测：¥45K-65K

发布时间：大约 18 小时前