Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
保险科技-大模型高级工程师
立即应聘

保险科技-大模型高级工程师

发布于 4 天前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
硕士
软件工程
PyTorch
RAG
LLM
SFT
大模型
Megatron-LM
DeepSpeed
vLLM
RLHF

AI 估算 · 30k–60k

腾讯大厂,大模型高级工程师岗位稀缺,技能要求高,深圳地区薪资竞争力强,参考市场行情估算。

职位详情

关于这个职位

腾讯保险科技团队招聘大模型高级工程师,负责保险领域大模型的后训练全流程,包括SFT、RLHF、奖励模型等,构建高质量指令数据集,搭建自动化评测体系,推动模型在保险业务中的落地应用

你将使用前沿技术如DeepSpeed、vLLM等,参与Agentic-RL探索,与顶尖团队合作解决真实业务挑战

最低要求

硕士及以上学历,计算机、人工智能、机器学习、NLP、统计学等相关专业,2 年以上大模型后训练 / 算法研发经验,有保险 / 金融垂类模型训练或落地经验优先

精通LLM 后训练全流程:SFT、RLHF(PPO/DPO/GRPO)、Reward Model、模型对齐
熟练使用PyTorch、Transformers、DeepSpeed、Megatron-LM、vLLM等训练 / 推理框架
熟悉指令微调数据构建、偏好数据(Preference Data)建设、数据质量评估全链路
有保险 / 金融领域知识图谱、RAG、智能体(Agent)开发经验加分

工作职责

负责保险大模型的Post-training全流程:包括SFT 监督微调、RLHF/DPO/GRPO 模型对齐、奖励模型(Reward Model)研发,提升模型在保险场景的专业问答、复杂推理、合规风控能力

设计并建设保险领域高质量指令数据集(核保、理赔、健康咨询、保单解读、合规问答等),主导数据标注、清洗、过滤、蒸馏与质量评估,支撑模型迭代与能力升级
基于Agentic-RL构建保险业务仿真环境与 API 对接体系,支持保单查询、理赔试算、核保校验、健康咨询等工具调用,提升模型在真实保险流程中的决策与执行能力
搭建保险垂类自动化评测体系(事实准确率、合规率、推理深度、用户满意度),持续跟踪模型效果,驱动数据与算法迭代,保障模型在保险全链路(售前 / 售中 / 售后)的稳定落地

优先资格

有保险 / 金融垂类模型训练或落地经验优先

有保险 / 金融领域知识图谱、RAG、智能体(Agent)开发经验加分

AI 洞察

优缺点分析

优点

  • 腾讯平台强大,资源丰富,能够接触前沿大模型技术和海量真实业务数据
  • 保险科技赛道高速增长,岗位稀缺,个人技术价值和市场竞争力提升快
  • 团队技术氛围浓厚,有机会与行业顶尖专家合作,参与从0到1的模型建设
  • 大模型领域技术迭代快,需要持续学习,保持对前沿算法的跟进
  • 保险业务场景复杂,合规要求高,模型落地的工程难度较大
  • 项目节奏可能较快,需要较强的抗压能力和结果导向思维
  • 适合有大模型后训练经验、对AI落地有热情、愿意深耕垂直领域的技术专家,尤其对保险/金融行业感兴趣者

缺点 / 挑战

暂无明显挑战项

角色解读

  • 在腾讯内部深耕大模型技术,成为保险垂类模型专家或技术负责人
  • 横向拓展至金融、医疗等其他垂直领域,拓宽业务影响力
  • 向技术管理岗发展,带领团队推动AI在保险行业的创新落地
  • 负责保险大模型的后训练全流程,包括SFT、RLHF、奖励模型等,提升模型在保险场景的专业能力
  • 设计并构建高质量保险指令数据集,涵盖核保、理赔、健康咨询等场景,主导数据标注与质量评估
  • 基于Agentic-RL构建保险业务仿真环境,对接API体系,支持工具调用,提升模型在真实流程中的决策能力
  • 搭建自动化评测体系,持续跟踪模型效果,驱动数据与算法迭代,保障模型在售前/售中/售后全链路落地
  • 精通LLM后训练全流程(SFT、RLHF/DPO/GRPO、Reward Model),有实践经验
  • 熟练使用PyTorch、Transformers、DeepSpeed、Megatron-LM、vLLM等训练/推理框架
  • 熟悉指令微调数据构建、偏好数据建设、数据质量评估全链路
  • 了解保险/金融领域知识图谱、RAG、智能体开发,有相关经验优先

申请策略

  • 提前了解腾讯保险科技的业务方向(如微保),在面试中展现对保险+AI结合的思考
  • 关注腾讯大模型技术布道(如混元大模型),准备相关技术观点
  • 重点突出大模型后训练项目经验(SFT、RLHF等),量化模型效果提升(如准确率、合规率)
  • 强调数据构建和评测体系搭建的经历,展示数据驱动优化的能力
  • 如果有保险或金融领域应用经验,务必突出展示
  • 列出熟练使用的框架和工具(如DeepSpeed、vLLM),并说明实际应用场景
  • 补强RLHF的数学原理和工程实现,尤其是GRPO等新方法
  • 了解保险业务基础(核保、理赔流程),提升领域理解

面试指南

  • 使用STAR法则:情境(Situation)、任务(Task)、行动(Action)、结果(Result),清晰结构化回答
  • 先理论后实践:先简述原理,再结合实际项目经验,最后总结收获和反思
  • 突出解决难题的思考过程:遇到什么困难,如何尝试不同方案,为什么选择当前方案
  • 请详细描述你参与过的一个大模型后训练项目,包括SFT和RLHF的具体实现
  • 如何设计和构建高质量的偏好数据(Preference Data)?有哪些关键质量指标?
  • 在RLHF中,奖励模型(Reward Model)的训练有哪些常见问题?如何解决?
  • 保险场景中,如何确保大模型输出的合规性和事实准确性?
  • 请谈谈你对Agentic-RL的理解,以及如何应用于保险业务?

匹配度报告

68
综合匹配度

腾讯大厂,前沿大模型技术栈,发展空间大,但现场办公且可能加班,适合技术驱动型人才。

适合人群
最适合追求技术成长、渴望涉足前沿AI领域并愿意投入时间和精力的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活35
使命价值75

薪资福利匹配

70中等

腾讯作为大厂,薪资福利具有市场竞争力,但JD未明确薪资范围,因此补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

岗位涉及大模型前沿技术,团队资源丰富,能深度参与从0到1的模型建设,发展性动机满足程度很高。

技术前沿前沿/新兴技术
技术栈LLM、SFT、RLHF、DPO、GRPO、PyTorch、DeepSpeed、vLLM、RAG、Agent
业务类型ambiguous

工作生活匹配

35较低

岗位要求现场办公,未提及弹性工作或远程,深圳办公地点为科技园,工作节奏可能较快,生活化动机满足程度较低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

75中等

保险科技属于高速增长赛道,通过AI提升保险服务效率和用户体验,社会意义积极,但JD未突出使命愿景。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 次世代UE5战术射击端游-游戏引擎

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 光子艺术部-高级/资深技术美术-(动画效果把控方向)

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 微信-高级算法工程师-音频理解/ASR/对话模型方向

    腾讯 · 北京市
    AI 估算 · 30k-60k
  • 金铲铲之战--2D场景原画设计师(卡通)

    腾讯 · 深圳市
    AI 估算 · 15k-30k
  • Project T UE5 客户端开发工程师(性能优化)

    腾讯 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI工具实习生(MJ035456)

    携程 · 上海市
    AI 估算 · 4k-7k
  • 后端开发实习(视频方向)(MJ035450)

    携程 · 上海市
    AI 估算 · 4k-8k
  • DLT Senior Full Stack Engineer

    渣打银行 · 广州市
    AI 估算 · 25k-45k
  • 后端/资深后端研发工程师-国际电商风控方向

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 客户端技术负责人-抖音

    字节跳动 · 上海市
    AI 估算 · 30k-60k

腾讯 的其他在招职位

  • 次世代UE5战术射击端游-游戏引擎

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 光子艺术部-高级/资深技术美术-(动画效果把控方向)

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 微信-高级算法工程师-音频理解/ASR/对话模型方向

    腾讯 · 北京市
    AI 估算 · 30k-60k
  • 金铲铲之战--2D场景原画设计师(卡通)

    腾讯 · 深圳市
    AI 估算 · 15k-30k
  • Project T UE5 客户端开发工程师(性能优化)

    腾讯 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI工具实习生(MJ035456)

    携程 · 上海市
    AI 估算 · 4k-7k
  • 后端开发实习(视频方向)(MJ035450)

    携程 · 上海市
    AI 估算 · 4k-8k
  • DLT Senior Full Stack Engineer

    渣打银行 · 广州市
    AI 估算 · 25k-45k
  • 后端/资深后端研发工程师-国际电商风控方向

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 客户端技术负责人-抖音

    字节跳动 · 上海市
    AI 估算 · 30k-60k