硕士及以上学历,计算机、数学、通信等相关专业
具备良好的学习能力、逻辑思维能力、沟通协作能力
有三年及以上语音合成、语音识别算法经验,或三篇及以上顶会论文(各类CCF-A会、ICASSP/INTERSPEECH等)
熟练使用Python和Pytorch/Tensorflow深度学习框架
对以下至少一种熟悉并有相关经验:
1)语音大模型的框架&理论,包括但不限于Diffusion、Vall-E/SpearTTS/AudioLM、MusicLM
2)音频理解大模型/ASR大模型,包括但不限于qwen-audio、sensevoice、whisper等
3)熟悉omni多模态大模型,包括但不限于qwen-omni、mimo-omni、Step‑Audio、Covo‑Audio等