Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Baidu logo
百度
PDSA产品解决方案架构师(J99770)
立即应聘

PDSA产品解决方案架构师(J99770)

发布于 大约 13 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
本科
RAG
LLM
向量数据库
推理优化
大模型
SGLang
vLLM

AI 估算 · 35k–65k

大厂高级架构师,大模型方向稀缺,一线城市薪资较高,综合市场行情估算。

职位详情

关于这个职位

作为百度千帆私有化项目的架构师,你需要主导技术方案设计、算力与模型选型,并深入对接客户技术团队

该职位要求深厚的大模型工程落地经验,擅长推理优化、RAG与Agent构建,并具备AI原生工作方式(使用Agent辅助方案撰写)
你将在政务、教育等赛道沉淀可复用方案,推动行业第二单复用率超60%

最低要求

本科及以上,计算机/软件工程/AI/数学/物理等技术类专业优先

年以上技术工作经验,至少2年大模型/AI平台/分布式系统方向
必须具备的技术深度(任三项以上熟悉、其中至少一项精通) -大模型推理与部署:vLLM/SGLang/TensorRT-LLM/TGI至少一个,能独立调优throughput/latency/显存占用
-微调与对齐:SFT/LoRA/RLHF流程能跑通,能向客户解释参数与产出影响 -RAG与Agent工程:向量库选型、召回链路设计、Function Calling/MCP接入 -算力与基础设施:NVIDIA/国产卡(昆仑、昇腾、海光、寒武纪等)至少熟悉一种,了解集群组网、容器化部署 -大模型平台产品工程经验:千帆/百炼/火山方舟/盘古中至少一个的产品体系熟悉 -代码能力:Python熟练,能独立写demo、读懂开源模型代码、改prompt工程脚本
面试会有现场coding环节 -熟练使用Dumate/Claude Code/Cursor/同类agent harness,面试会要求现场用agent起草标书段落+跑一个最小RAG/Agent demo -沟通能力优秀,能与客户CIO/算法负责人/基础架构团队对等对话

工作职责

技术方案主导:负责千帆私有化项目的方案设计、报价、POC、招投标技术应答

亲自下场跑POC、调推理参数、出benchmark
架构与选型决策:主导算力规格(GPU型号/卡数/网络)、模型组合(Base模型/微调/蒸馏)、配套组件(向量库、Agent、知识库、推理框架)的私有化选型,对性能、成本、可行性三个维度的承诺负责到签约
技术深度对接:能与客户算法/平台/基础架构团队对等技术对话——客户问vLLM/SGLang选型、问RAG召回率优化、问长上下文方案、问MoE推理成本
AI工程化沉淀:在政务、非能源央企、教育三大赛道沉淀可复用方案模板,以skill/prompt/MCP等可执行形式沉淀(不是Word),同行业第二单复用率≥60%
跨团队协同:在售前阶段作为研发、交付、产品的对内唯一接口人
签约后向交付完成方案交接
AI Native工作方式:以Dumate/Claude Code/Cursor/同类agent harness为日常工作底座,标书与方案首稿由agent起草、人审核
具备客户现场用agent现场起草方案/竞品对比/SOW片段的能力

AI 洞察

优缺点分析

优点

  • 身处大模型前沿赛道,可以深度参与从零到一的私有化部署,积累稀缺工程经验
  • 百度千帆平台和丰富的国产算力生态,提供顶级技术资源和客户场景
  • AI Native工作方式(使用Agent)能极大提升效率,代表未来工作趋势
  • 方案复用率要求倒逼标准化沉淀,锻炼抽象和产品化思维
  • 需要同时精通推理、微调、RAG、基础设施等多领域,技术广度要求极高
  • 适合技术深度扎实、热爱大模型工程落地、享受与客户对等技术对话的资深工程师

缺点 / 挑战

  • 项目周期紧张,可能面临频繁出差和客户现场压力
  • 面试有现场coding和Agent实操,准备成本较高

角色解读

  • 可以纵深发展为大模型架构专家,负责更大规模私有化部署和技术决策
  • 横向拓展为行业解决方案负责人,涵盖政务、央企等行业的AI转型
  • 未来可晋升为技术Leader或产品架构师,带领团队沉淀行业方案
  • 主导客户私有化大模型项目的技术方案设计,包括算力选型、模型组合、推理框架等,并亲自进行POC验证和性能调优
  • 作为技术接口人,与客户算法、平台、基础架构团队深度对接,解答技术选型问题(如vLLM vs SGLang、RAG召回优化等)
  • 在政务、教育等赛道沉淀可复用的方案模板(以skill/prompt/MCP形式),确保同行业客户第二单复用率超60%
  • 采用AI Native工作方式,使用Agent工具起草标书和方案,并能在客户现场使用Agent现场产出方案片段
  • 精通大模型推理部署(vLLM/SGLang等),能独立优化吞吐、延迟和显存
  • 熟悉微调(SFT/LoRA/RLHF)和RAG/Agent工程(向量库、Function Calling)
  • 掌握至少一种GPU(NVIDIA或国产卡)的集群组网和容器化部署
  • 熟练使用Agent工具(Dumate/Claude Code/Cursor)进行方案撰写和代码开发

申请策略

  • 关注百度千帆的产品动态和行业案例,面试时能结合具体场景讨论
  • 准备一个简洁的Agent辅助方案的演示,展示AI Native工作能力
  • 突出大模型推理部署的实际项目经验,包括vLLM/SGLang调优案例和性能指标
  • 详述RAG或Agent系统的完整搭建经历,包括向量库选型、召回率优化等
  • 如果有使用Agent工具(如Cursor、Claude Code)进行方案或代码生产的经历,务必强调
  • 展示与客户或跨团队技术沟通的成果,如成功签约或POC通过案例
  • 熟记常见推理框架的配置和调优参数,练习from scratch搭建最小推理服务
  • 动手实现一个端到端的RAG demo(包括向量库、检索、LLM生成),并尝试用Agent工具编写

面试指南

  • 对于技术选型问题,先明确场景需求(吞吐、延迟、显存、成本),再对比各方案的优劣势,最后给出推荐
  • 对于优化类问题,遵循“问题定位 → 指标量化 → 尝试方案 → 效果验证”的步骤,突出可落地的细节
  • 现场实操环节,先快速理解任务目标,利用Agent生成框架,再手动调整关键参数,解释每一步逻辑
  • 如何选择vLLM和SGLang?在什么场景下用哪个?
  • 优化RAG召回率有哪些策略?
  • 请现场用Cursor/Claude Code起草一份简单的私有化部署方案框架
  • 在MoE模型推理时,如何降低显存占用?
  • 客户要求使用国产卡(如昇腾),你会如何评估和选型?

匹配度报告

65
综合匹配度

大厂大模型架构师,技术前沿、成长快,但工作强度大、WLB不确定。

适合人群
最适合追求前沿技术成长和挑战的求职者,不太适合重视工作生活平衡的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利60
成长发展95
工作生活40
使命价值65

薪资福利匹配

60中等

薪资水平较高,但JD未明确福利和奖金,稳定性一般。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

95较高

前沿技术栈(大模型、Agent),大量实战机会,成长空间巨大,但未明确晋升通道。

技术前沿前沿/新兴技术
技术栈vLLM、SGLang、RAG、Agent、Python、Kubernetes
业务类型profit_center

工作生活匹配

40较低

工作地点在核心城市但未说明弹性办公,且项目导向可能导致出差和高强度。

工作模式未明确
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

65中等

大模型行业前景好,但社会影响中性,创新性较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • 数字人产品实习生(J99806)

    百度 · 北京市
    AI 估算 · 3k-6k
  • 百科PGC运营实习生(J99807)

    百度 · 北京市
    AI 估算 · 4k-6k
  • 战略运营PMO(J99754)

    百度 · 北京市
    AI 估算 · 20k-35k
  • 千帆Agent&Tools后端研发(J99773)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 运营实习生(J99741)

    百度 · 北京市
    AI 估算 · 4k-6k

相似职位推荐

  • 高级客户端开发工程师(AFK Journey)

    莉莉丝 · 上海市
    AI 估算 · 25k-40k
  • 用户增长算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • MVA LLM Developer

    奔驰 · 北京市
    AI 估算 · 30k-60k
  • 前端开发实习生(27届)

    知乎 · 北京市
    AI 估算 · 4k-7k
  • Android开发实习生(27届)

    知乎 · 北京市
    AI 估算 · 4k-8k

百度 的其他在招职位

  • 数字人产品实习生(J99806)

    百度 · 北京市
    AI 估算 · 3k-6k
  • 百科PGC运营实习生(J99807)

    百度 · 北京市
    AI 估算 · 4k-6k
  • 战略运营PMO(J99754)

    百度 · 北京市
    AI 估算 · 20k-35k
  • 千帆Agent&Tools后端研发(J99773)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 运营实习生(J99741)

    百度 · 北京市
    AI 估算 · 4k-6k

相似职位推荐

  • 高级客户端开发工程师(AFK Journey)

    莉莉丝 · 上海市
    AI 估算 · 25k-40k
  • 用户增长算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • MVA LLM Developer

    奔驰 · 北京市
    AI 估算 · 30k-60k
  • 前端开发实习生(27届)

    知乎 · 北京市
    AI 估算 · 4k-7k
  • Android开发实习生(27届)

    知乎 · 北京市
    AI 估算 · 4k-8k