对语音方向有浓厚兴趣,扎实的语音信号处理和深度学习理论功底,对语音领域前沿技术有深入跟踪与实践,精通语音识别、语音理解、语音交互中至少两个领域
语音识别方向:精通语音识别全链路技术,包括 VAD、声学模型、语言模型、端到端建模(CTC / RNN-T / Conformer 等),熟悉解码与优化方法(Beam Search / WFST / LM 融合等),具备复杂声学环境下识别效果优化的实战经验
语音理解方向:对语音大模型与语音理解技术有深入理解,熟悉主流语音理解大模型方案(如 Whisper、Qwen-Audio 等),具备 LLM 理论基础和调优实践经验,能够将语音理解能力与业务场景深度结合
语音交互方向:熟悉语音交互系统架构,具备半双工 / 全双工语音交互系统开发经验,深入理解语义打断(barge-in)、轮次控制、端点检测等关键机制,有语音交互链路从设计到上线的完整研发经验
熟悉语音大模型的训练和调优技术,熟悉预训练、后训练、上下文学习、反馈强化学习等相关技术,具备独立设计训练方案和解决训练疑难问题的能力
具备良好的工程能力,熟练使用 Python / C++,熟悉模型部署与推理优化技术(如 ONNX / TensorRT / 量化加速等),能够推动算法从原型到高性能线上服务的全流程落地