负责语音大模型团队的技术领导工作
涵盖:语音识别、语音翻译、语音合成、音色克隆、智能语音对话等通用模型或垂直领域模型的一线技术工作
负责带领团队落地和优化语音能力和现有b站的应用场景结合
涵盖:自动视频字幕、视频ai语音翻译、直播间字幕和语音生成、创作工具的相关语音识别和语音合成技术等
跟踪前沿技术动态,开展深入研究和分析,并撰写和发表相关领域高水平学术论文,建设行业有影响力的语音技术团队
深入研究端到端语音实时交互技术,解决跨语言理解、翻译与合成的关键问题,优化语音输入到多模态输出的全链路效果