Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Kunlun Tech logo
昆仑万维
AI 社交-TTS大模型算法实习生
立即应聘

AI 社交-TTS大模型算法实习生

发布于 大约 2 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
学历未注明
研究与开发 (研发)
深度学习
PyTorch
多模态
音频生成
语音合成
大模型
TTS
Vc

AI 估算 · 5k–8k

一线城市大厂算法实习生,技术门槛高但经验要求低,薪资处于市场中等偏上水平。

职位详情

关于这个职位

该职位负责音频生成大模型(TTS和VC)的前沿算法研究与实现,需要跟进最新进展并优化算法,同时参与大数据量下的多机多卡并行训练

适合对语音合成和大模型有浓厚兴趣、希望积累学术和工业经验的在校生

最低要求

有扎实的算法与数理基础以及工程实现能力,至少精通 Python,熟悉 C++

语音合成,大语言模型以及多模态学习方面有一定研究基础,熟悉主流模型和算法,关注领域内的最新进展,能够跟进和实现新的算法
熟练掌握 Pytorch 等深度学习框架,具有模型创建、训练、调优和测试的经验
具备阅读英文文献和技术资料的能力,具备较强的分析问题和解决问题的能力,具有良好的沟通表达能力和团队协作能力,具有责任心和使命感

工作职责

负责音频生成大模型的相关研究,包括但不限于TTS和VC

负责跟进音频生成大模型的最新研究进展,负责相关技术的研发实现,并提出和优化最前沿的算法,保持算法在工业界和学术界的领先
负责音频生成模型在大数据量,多机多卡并行训练

AI 洞察

优缺点分析

优点

  • 加入上市公司大厂,算法实习生可以接触真实的大规模数据和工业级训练环境
  • 研究方向前沿(TTS/VC大模型),技术积累含金量高,有利于未来职业发展
  • 团队氛围可能偏研究导向,有机会发表论文或参与开源项目
  • 上手难度较大,需要快速掌握音频生成和大模型的相关知识
  • 实习期间需要独立跟进最新论文并实现算法,对自驱力要求高
  • 适合对语音合成和大模型有浓厚兴趣、具备较强学习和工程能力、希望积累研究经验的在校生

缺点 / 挑战

  • 可能存在较高的强度,需要适应多机多卡并行训练等复杂工程任务

角色解读

  • 从实习到正式员工,逐步深入音频生成或大模型领域,成为算法专家
  • 积累工业级大规模训练经验,未来可向高级算法工程师或研究员发展
  • 接触前沿多模态技术,可拓展至语音、图像、文本等多领域交叉方向
  • 研究并优化TTS和VC等音频生成大模型,保持算法的先进性
  • 跟踪学术界和工业界的最新进展,实现并改进前沿算法
  • 参与大规模数据下的多机多卡并行训练,提升模型性能
  • 精通Python,熟悉C++,具备扎实的算法和数理基础
  • 掌握语音合成、大语言模型或多模态学习,熟悉主流模型和算法
  • 熟练使用PyTorch等深度学习框架,有模型训练和调优经验
  • 能够阅读英文文献,具备独立分析和解决问题的能力

申请策略

  • 建议在简历中附上相关项目代码链接或GitHub仓库,体现工程能力
  • 提前了解昆仑万维在AI社交和音频生成方面的产品,以展示对公司的兴趣
  • 突出语音合成或相关领域的项目经历,如TTS、VC、语音识别等
  • 展示深度学习框架的使用经验,尤其是PyTorch的模型训练和调优案例
  • 强调阅读英文文献的能力,如有论文发表或技术博客更佳
  • 体现算法基础,如参加过ACM竞赛或数学建模等
  • 补充C++基础,因为岗位要求熟悉C++,尤其是高性能计算部分
  • 学习并行训练技术(如数据并行、模型并行、混合精度训练)以应对多机多卡场景

面试指南

  • 对于项目描述题,采用STAR法则(情境-任务-行动-结果)结构化回答,突出你的贡献和技术难点
  • 对于原理题,先给出核心概念,然后分点阐述具体细节,最后可以加上自己的理解
  • 对于开放性问题(如最新进展),展示你对领域动态的了解,并表达个人见解和未来方向
  • 请详细描述你曾经做过的一个语音合成或音频生成项目,包括模型选型、训练过程、遇到的挑战和解决方案
  • 解释TTS中常用的声码器(Vocoder)原理,如HiFi-GAN的生成器和判别器结构
  • 如何在大规模数据下进行多机多卡并行训练?请谈谈数据并行和模型并行的区别及适用场景
  • 请介绍Transformer在语音合成中的应用,如FastSpeech的duration predictor的设计
  • 你如何看待当前TTS领域的最新进展?比如零样本语音克隆或情感合成

职位点评

64
综合评分

大厂算法实习生,前沿TTS大模型方向,技术成长高但薪资一般、WLB未明确。

更适合这类人
最适合高发展动机的求职者,希望在技术前沿快速成长,对短期待遇和WLB要求不高。
表现最好
成长发展
相对薄弱
工作生活
薪资福利55
成长发展85
工作生活50
使命价值65

薪资福利

55较低

岗位为实习,薪资按市场中等偏上水平,但稳定性较低,福利较少(JD未提及福利),补偿性动机满足程度一般。

薪资信号未披露(AI估算:5K-8K/月)

成长发展

85较高

该岗位能接触前沿音频大模型技术,积累工业级并行训练经验,成长空间大,但JD未明确提及晋升路径。

技术前沿前沿/新兴技术
技术栈TTS、VC、大模型、PyTorch、多机多卡并行训练
业务类型ambiguous

工作生活

50较低

仅现场办公,地点北京,未提及弹性工作制或WLB信息,实习可能面临一定工作强度。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

65中等

AI社交和音频生成属于高速增长赛道,但岗位偏技术,社会影响力中性,创新性较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

昆仑万维 的其他在招职位

  • 音频算法

    昆仑万维 · 北京市
    AI 估算 · 30k-55k
  • 海外增长策略产品

    昆仑万维 · 北京市
    AI 估算 · 25k-40k
  • 文案策划

    昆仑万维 · 广州市
    AI 估算 · 10k-18k
  • AI 社交-算法研究员/专家 - AIGC (NLP)

    昆仑万维 · 北京市
    AI 估算 · 30k-60k
  • 地编设计师

    昆仑万维 · 广州市
    AI 估算 · 10k-20k

相似职位推荐

  • Product Engineer

    采埃孚 · 上海市
    AI 估算 · 12k-25k
  • Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 20k-35k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • Senior R&D Engineer

    魏德米勒 · 苏州市
    AI 估算 · 20k-35k
  • 双电源开关研发结构工程师

    溯高美索克曼 · 杭州市
    AI 估算 · 15k-25k

昆仑万维 的其他在招职位

  • 音频算法

    昆仑万维 · 北京市
    AI 估算 · 30k-55k
  • 海外增长策略产品

    昆仑万维 · 北京市
    AI 估算 · 25k-40k
  • 文案策划

    昆仑万维 · 广州市
    AI 估算 · 10k-18k
  • AI 社交-算法研究员/专家 - AIGC (NLP)

    昆仑万维 · 北京市
    AI 估算 · 30k-60k
  • 地编设计师

    昆仑万维 · 广州市
    AI 估算 · 10k-20k

相似职位推荐

  • Product Engineer

    采埃孚 · 上海市
    AI 估算 · 12k-25k
  • Algorithm Engineer

    采埃孚 · 上海市
    AI 估算 · 20k-35k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • Senior R&D Engineer

    魏德米勒 · 苏州市
    AI 估算 · 20k-35k
  • 双电源开关研发结构工程师

    溯高美索克曼 · 杭州市
    AI 估算 · 15k-25k