Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Pony AI logo
小马智行
资深系统架构师 - 车载语音助手(AI Orchestration & Logic)-广州
立即应聘

资深系统架构师 - 车载语音助手(AI Orchestration & Logic)-广州

发布于 大约 2 个月前

普通员工/个人贡献者

广州市
专家级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
RAG
GO
LLM
gRPC
语音助手
车载系统
Prompt Engineering

AI 估算 · 45k–65k

资深架构师+AI方向,广州一线大厂水平,薪资竞争力强。

职位详情

关于这个职位

作为小马智行车载语音助手的系统架构师,你将负责设计高并发、低延迟的AI编排层,构建混合意图引擎,实现LLM与车控指令的极速响应

该职位深度集成大语言模型,面向数万台智能汽车,是AI在车载场景落地的核心角色

最低要求

架构资历:8 年以上后端开发经验,3 年以上大型分布式系统架构经验

有处理过日均百万级交互或十万级并发连接业务逻辑的实战经验
技术栈:精通 Go 或 Python,具备极强的高性能异步编程能力
AI 背景:深度理解 LLM 能力边界,熟悉 RAG 架构、Function Calling 以及 Prompt Engineering 的工程化落地
协议理解:深刻理解 gRPC、HTTP/2 双向流通信,能够设计高性能的二进制传输契约

工作职责

AI 编排与对话引擎设计 (AI Orchestration)

业务中枢构建:主导 ASR-LLM-TTS 全链路的流式业务编排,确保端云协同下的整体交互延迟(TTFT)处于行业领先水平
对话管理 (DM):设计并维护支持高并发的多轮对话状态机,处理复杂的上下文记忆、意图切换、任务中断与恢复逻辑
Agent 架构:构建基于 Agent 的任务规划系统,将模糊的语义请求转化为严谨的结构化指令(JSON),实现对车控、导航、媒体等 API 的精准调度
混合意图引擎与“快慢路径”设计 (Hybrid Intent Engine)
分流机制:设计“分类小模型(快路径)”与“LLM(慢路径)”的并行路由策略
针对高频车控指令实现毫秒级极速响应,无需等待大模型推理
置信度仲裁:建立一套完善的指令仲裁与回滚策略,解决小模型误识别与 LLM 幻觉之间的冲突
槽位提取优化:针对操作性指令设计轻量级的 NER(实体识别)与槽位填充能力,提升系统整体能效比
多模型路由与网关适配 (Model Gateway & Routing)
模型路由:构建统一的模型网关适配层,支持在多个外部 LLM 供应商(如 OpenAI, 文心, 千问等)与私有化模型之间进行动态切换与负载均衡
降级与容灾:设计业务层的服务降级预案,确保在云端模型故障或弱网环境下,基础车控功能依然 100% 可用
工程卓越性与数据闭环 (Engineering Excellence)
协议定义:与 Infra 团队协作,定义高效的端云通信协议(基于 gRPC/Protobuf),优化中间文本与音频流的传输效率
成本控制:通过语义缓存(Semantic Cache)、模型量化建议等手段,在大规模交互场景下显著降低 Token 消耗成本

优先资格

有智能音箱、语音机器人或车载 TSP 平台核心架构经验

在端侧(Android/高通平台)有模型部署与推理优化(ONNX/TFLite)的跨端协作经验
参与过知名 AI Agent 框架或分布式调度系统的开源贡献

AI 洞察

优缺点分析

优点

  • 前沿技术栈:深度集成LLM、Agent架构,接触AI领域最前沿的技术实践
  • 高影响力:直接为数万台车辆提供AI能力,影响千万级用户的语音交互体验
  • 公司平台:小马智行是自动驾驶领域的头部公司,技术氛围浓厚,成长空间大
  • 技术难度高:需要同时掌握分布式系统、AI模型、嵌入式等多领域知识
  • 工作强度可能较大:作为核心架构师,可能面临高压的项目交付周期
  • 行业竞争激烈:自动驾驶和AI领域人才密集,需要持续学习保持竞争力

缺点 / 挑战

  • 挑战性工作:解决车机受限算力与云端强大算力之间的平衡问题,极具技术深度
  • 适合有8年以上后端开发经验、3年以上分布式系统架构经验,对AI和车载场景有浓厚兴趣,喜欢解决高并发、低延迟挑战的技术专家

角色解读

  • 技术纵深发展:成为AI系统架构领域的专家,主导更复杂的车载AI系统设计
  • 管理方向:晋升为技术负责人或架构团队Leader,带领团队攻克技术难题
  • 跨领域拓展:向自动驾驶、智能座舱等更广泛的AI应用场景延伸
  • 设计并实现车载语音助手的AI编排层,负责ASR-LLM-TTS全链路的流式业务编排,确保低延迟交互
  • 构建混合意图引擎,通过快慢路径分流机制实现高频车控指令的毫秒级响应
  • 设计多模型路由与网关适配层,支持多个LLM供应商的动态切换与负载均衡
  • 与Infra团队协作定义端云通信协议,优化传输效率并控制Token消耗成本
  • 精通Go或Python,具备高性能异步编程能力,有大型分布式系统架构经验
  • 深度理解LLM能力边界,熟悉RAG、Function Calling和Prompt Engineering的工程化落地
  • 深刻理解gRPC、HTTP/2双向流通信,能设计高性能二进制传输契约
  • 具备将复杂对话场景拆解为状态转移图与逻辑流水线的逻辑严谨性

申请策略

  • 了解小马智行的技术栈和产品方向,在面试中展示对车载AI场景的思考
  • 准备一个完整的架构设计案例,体现从需求分析到技术选型再到落地的能力
  • 突出大型分布式系统架构经验,尤其是高并发、低延迟系统的设计案例
  • 强调AI相关项目经历,如LLM应用、RAG、Function Calling等工程化落地经验
  • 展示对gRPC、Protobuf等通信协议的深入理解,以及性能优化成果
  • 如有车载、语音助手或Agent框架经验,务必重点描述
  • 深入学习LLM的工程化部署,如vLLM、TensorRT-LLM等推理优化框架
  • 补充车载系统知识,如车规级芯片、Android/高通平台模型部署

面试指南

  • 对于架构设计问题,采用自上而下的方法:先明确需求(延迟、并发、可靠性),再分层设计(接入层、编排层、模型层),最后讨论关键细节(协议、缓存、降级)
  • 对于冲突解决类问题,采用“规则+概率”的思路:定义明确的仲裁规则(如小模型置信度阈值),结合LLM的二次确认机制,并设计回滚策略
  • 请设计一个车载语音助手的AI编排架构,如何实现低延迟和高并发?
  • 如何解决小模型误识别与LLM幻觉之间的冲突?请描述你的置信度仲裁策略
  • 在多模型路由场景下,如何实现动态切换和负载均衡?请设计一个降级方案
  • 请解释RAG架构在车载场景下的应用,如何优化检索效率?
  • 如何通过语义缓存和模型量化降低Token消耗成本?
  • 复习分布式系统设计原则,如CAP理论、一致性哈希、熔断降级等

匹配度报告

74
综合匹配度

前沿AI架构岗,技术成长空间大,薪资有竞争力,但工作强度可能较高。

适合人群
适合追求技术成长、愿意接受挑战、对AI和自动驾驶有热情的求职者,不太适合追求工作生活平衡的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展95
工作生活40
使命价值85

薪资福利匹配

75中等

薪资水平较高,但JD未明确福利,补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:45K-65K/月)

成长发展匹配

95较高

前沿技术栈(LLM、Agent架构),成长空间大,发展性动机满足程度极高。

技术前沿前沿/新兴技术
技术栈LLM、RAG、Function Calling、Agent、gRPC、Go、Python
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及WLB,可能面临高强度工作,生活化动机满足程度较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

85较高

自动驾驶和AI行业高速增长,产品直接改善出行体验,意义感动机满足程度高。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小马智行 的其他在招职位

  • 大模型算法工程师-广州/北京

    小马智行 · 北京市
    AI 估算 · 30k-60k
  • C++实习生 - 仿真分析与问题复现 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 4k-8k
  • C++实习生 - 性能优化 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 5k-8k
  • C++实习生 - 仿真优化 - 深圳

    小马智行 · 深圳市
    AI 估算 · 4k-8k
  • 高级测试工程师 - 需海外高频出差

    小马智行 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k

小马智行 的其他在招职位

  • 大模型算法工程师-广州/北京

    小马智行 · 北京市
    AI 估算 · 30k-60k
  • C++实习生 - 仿真分析与问题复现 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 4k-8k
  • C++实习生 - 性能优化 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 5k-8k
  • C++实习生 - 仿真优化 - 深圳

    小马智行 · 深圳市
    AI 估算 · 4k-8k
  • 高级测试工程师 - 需海外高频出差

    小马智行 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k