Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

JD logo
京东
语音引擎工程师
立即应聘

语音引擎工程师

发布于 1 天前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
CUDA
量化
TensorRT
vLLM
ONNX Runtime
ASR

AI 估算 · 30k–50k

语音引擎工程师需精通ASR和大模型推理,技术难度高,京东平台薪资竞争力强。

职位详情

关于这个职位

京东正在招聘语音引擎工程师,负责基于云原生的语音识别模型推理服务开发与优化,包括从端侧小模型到百亿参数大模型的部署

你将深度参与推理加速技术(如量化、KV Cache优化)和高并发系统构建,技术挑战大

最低要求

计算机、通信、自动化等相关专业本科及以上学历

精通C++和Python,扎实的数据结构与算法功底,熟悉Linux多线程编程、网络编程(gRPC/HTTP/TCP/WebSocket)、Docker与K8s
熟练使用ONNX Runtime、TensorRT、vLLM、TensorRT-LLM等推理框架,掌握流式和非流式语音识别的工程化实现
具备CUDA/Triton C++算子开发及性能调优经验
精通KV Cache管理,具备FP8/INT8/INT4模型量化部署经验,了解GPTQ/AWQ等量化算法
符合京东价值观

工作职责

负责基于云原生架构的语音识别(ASR)模型推理服务开发,涵盖从端到端轻量级小模型到百亿参数级语音大模型的部署与落地

针对ASR推理链路进行深度优化,包括计算图优化、算子融合、显存管理与多线程并发,降低RTF提升QPS
跟踪并引入业界最新的大模型推理加速技术,如量化、投机采样、KV Cache优化,解决大模型云端部署的高成本与高延迟痛点
参与构建支持高并发、高可用、可动态弹性扩缩容的云端AI推理网关与资源调度系统

AI 洞察

优缺点分析

优点

  • 前沿技术栈:涉及ASR大模型、量化、KV Cache等热门方向,技术积累价值高
  • 大厂平台:京东科技提供丰富的业务场景和海量数据,项目经验含金量高
  • 薪资优厚:互联网大厂标准,16薪,福利完善
  • 技术难度大:需要同时掌握语音识别、推理优化、分布式系统等多领域知识,学习曲线陡峭

缺点 / 挑战

  • 工作强度可能较高:作为核心业务,项目节奏快,可能需要应对突发线上问题
  • 适合对AI推理优化有浓厚兴趣、喜欢解决性能瓶颈的技术型人才,尤其适合有C++和CUDA经验的工程师

角色解读

  • 技术深耕方向:成为语音引擎领域专家,精通端到端推理优化和大模型分布式部署
  • 架构方向发展:积累高并发分布式系统设计经验,向AI系统架构师或技术负责人晋升
  • 管理方向:带团队负责更大规模的AI平台建设,逐步转向技术管理岗位
  • 开发与优化语音识别模型推理服务,覆盖轻量级端模型到百亿参数大模型的部署落地
  • 对ASR推理链路进行深度优化,包括算子融合、显存管理、多线程并发,降低延迟提升吞吐
  • 引入并实现最新推理加速技术,如量化、投机采样、KV Cache优化,降低大模型部署成本
  • 参与构建高并发、高可用的云端AI推理网关与资源调度系统,保障业务稳定性
  • 精通C++和Python,熟悉Linux环境下的多线程、网络编程及容器化技术(Docker/K8s)
  • 熟练掌握ONNX Runtime、TensorRT、vLLM等推理框架,以及CUDA/Triton算子开发
  • 具备KV Cache管理和模型量化部署经验(FP8/INT8/INT4),了解GPTQ/AWQ等算法
  • 对语音识别(ASR)工程化实现有深入理解,包括流式和非流式架构

申请策略

  • 了解京东科技的业务方向,在面试中体现对产业数智化的兴趣
  • 准备好一个端到端的ASR推理优化项目案例,逻辑清晰阐述问题、方案和效果
  • 重点突出ASR相关项目经验,尤其是推理加速或模型部署方面的成果
  • 强调C++、CUDA性能优化案例,附带性能提升数据(如RTF、QPS改进)
  • 展示对框架(TensorRT、vLLM)或量化算法的实际应用经验
  • 补强CUDA和Triton算子开发能力,深入理解GPU架构
  • 学习主流大模型推理框架(vLLM、TensorRT-LLM),动手完成部署实践
  • 复习分布式系统和K8s相关知识,提升云原生部署技能

面试指南

  • 技术问题:先明确问题背景,然后分步骤说明优化思路(分析瓶颈→提出方案→评估效果),结合具体数字
  • 系统设计:采用分层架构(负载均衡→推理引擎→模型管理),重点强调可扩展性、容错性和监控
  • 项目经验:STAR法则(情境、任务、行动、结果),突出自己在其中的贡献和量化成果
  • 请解释ASR推理中的RTF和QPS指标,并说明如何优化
  • 你在TensorRT或vLLM框架中的使用经验?如何实现算子融合和量化?
  • 描述一次CUDA性能调优的经历,如何定位瓶颈并解决?
  • KV Cache管理在大模型推理中的作用?你如何优化显存占用?
  • 设计一个高并发、高可用的语音推理服务架构,需要考虑哪些方面?

匹配度报告

69
综合匹配度

京东语音引擎工程师,前沿技术栈、高成长性,但工作地点固定、可能加班。

适合人群
最适合重视技术成长和发展性动机的求职者,愿意在高压下快速成长。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活30
使命价值85

薪资福利匹配

70中等

京东是上市公司且规模庞大,薪资在行业中偏高,但JD未明确具体薪资和福利,保守评分。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

该职位涉及语音大模型推理加速等前沿技术,技能成长空间大,但JD未提及晋升机制。

技术前沿前沿/新兴技术
技术栈ASR、大模型推理、量化、KV Cache、TensorRT、CUDA、vLLM
业务类型profit_center

工作生活匹配

30较低

工作地点为仅现场办公,无远程灵活性,也未提及WLB相关信号,推测工作强度可能较大。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

85较高

京东科技以技术推动产业数智化,行业前景好,有正向社会影响力,但JD中使命感表述较少。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号以科技引领产业数智化升级、推动世界更加高效和美好
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 战略客户合作岗

    京东 · 北京市
    AI 估算 · 40k-60k
  • 采销经理(实验室设备)

    京东 · 上海市
    AI 估算 · 30k-50k
  • AMR负责人

    京东 · 北京市
    AI 估算 · 60k-90k
  • 客户经理

    京东 · 上海市
    AI 估算 · 20k-40k
  • 采销岗(团队负责人)

    京东 · 广东省
    AI 估算 · 30k-50k

相似职位推荐

  • Solution Architect Mechanics & Release Management

    大众汽车 · 合肥市
    AI 估算 · 20k-35k
  • JAVA后端开发工程师(语音)

    中国平安 · 深圳市
    AI 估算 · 20k-35k
  • GPU调度研发工程师/专家

    小红书 · 北京市
    AI 估算 · 30k-55k
  • 北京-数据中台研发工程师(J86157)

    百度 · 北京市
    AI 估算 · 20k-35k
  • 中级嵌入式软件开发工程师

    科大讯飞 · 合肥市
    AI 估算 · 15k-25k

京东 的其他在招职位

  • 战略客户合作岗

    京东 · 北京市
    AI 估算 · 40k-60k
  • 采销经理(实验室设备)

    京东 · 上海市
    AI 估算 · 30k-50k
  • AMR负责人

    京东 · 北京市
    AI 估算 · 60k-90k
  • 客户经理

    京东 · 上海市
    AI 估算 · 20k-40k
  • 采销岗(团队负责人)

    京东 · 广东省
    AI 估算 · 30k-50k

相似职位推荐

  • Solution Architect Mechanics & Release Management

    大众汽车 · 合肥市
    AI 估算 · 20k-35k
  • JAVA后端开发工程师(语音)

    中国平安 · 深圳市
    AI 估算 · 20k-35k
  • GPU调度研发工程师/专家

    小红书 · 北京市
    AI 估算 · 30k-55k
  • 北京-数据中台研发工程师(J86157)

    百度 · 北京市
    AI 估算 · 20k-35k
  • 中级嵌入式软件开发工程师

    科大讯飞 · 合肥市
    AI 估算 · 15k-25k