JD Compare · 2026

岗位 JD 对比分析：选对方向比努力重要

六类主流 AI 岗位横向拆解——做什么、要什么、去哪投、给多少。看完这一页，你应该能清楚知道自己的简历该往哪个方向改。

阅读建议：先扫一眼下面的横向对比表，锁定 2-3 个候选方向，再回头读对应小节的详细内容。全文约 4200 字，认真读 15 分钟。

1. 大模型算法工程师 / LLM Engineer
2. 推理优化工程师 / Inference Engineer
3. AI Infra / 分布式训练工程师
4. Agent / Applied AI 工程师
5. 传统机器学习 / 推荐搜索算法工程师
6. AI Research Scientist / 研究员
岗位 × 关键维度横向对比
如何选择主攻方向

1. 大模型算法工程师 / LLM Engineer hot

最拥挤也最亮眼的赛道。2023 年之前还有"NLP 算法"这种叫法，现在基本统一成"大模型算法"。按做的事情可以再切成 pretrain、continue pretrain、SFT、RLHF/DPO、数据工程几条线，越靠近 pretrain 壁垒越高，越靠近 SFT/数据越卷。

日常做什么

举几个真实场景：一个组全年可能就做一件事——把 1T token 的中文数据洗到足够干净，然后跑一次 70B 的 continue pretrain；另一个 RLHF 组每天在和标注平台扯皮、调 reward model、盯 PPO/GRPO 的 loss 曲线不发散；还有一类是"effective training"——做数据配比实验、loss 归因、scaling law 小规模验证。

技能要求

必须：PyTorch 熟练；读过 Llama / Qwen / DeepSeek 至少一家开源代码；懂 transformer 每一层在 forward/backward 里发生了什么；会用 Megatron / DeepSpeed 至少一个；数据 pipeline（dedup、quality filter、PII 脱敏）有实操经验。
加分：跑过 100B+ 参数训练；做过 long context 扩展（RoPE / YaRN / NTK）；有 RLHF 或 DPO/GRPO 的线上落地；熟悉 MoE 路由与 load balance loss；有一作 ACL/NeurIPS/ICLR。

典型 JD 原文摘录

字节 Seed · 大模型预训练算法工程师（P6-P7）

1. 负责千亿参数稠密/MoE 模型的预训练，包括但不限于数据配比、课程学习、训练稳定性优化；

2. 跟进 scaling law 前沿，设计小规模 ablation，给出大规模训练的超参决策依据；

3. 要求：有 100B 以上模型训练经验，或在顶会发表过一作 pretrain/alignment 相关工作。

Moonshot · Post-training 工程师

1. 负责 SFT 数据清洗、配比、质量评估，主导一个垂类能力（如代码 / 数学 / agent）的提升；

2. 熟悉 DPO、GRPO、RLOO、PRM 等 RL 算法，能独立 debug reward hacking；

3. 加分：熟悉 sandbox 执行环境 / 自动评测 pipeline。

对口公司

国内字节 Seed、阿里通义、Moonshot（月之暗面）、DeepSeek、智谱、百川、MiniMax、阶跃星辰、腾讯混元。
海外 OpenAI、Anthropic、Google DeepMind、Meta FAIR / GenAI、xAI、Mistral、Cohere。

薪资区间（2026 行情）

国内 P6（3-5 年）：80-140 万；P7（5-8 年）：140-260 万；P8+：300-600 万，头部 pretrain lead 包含期权可到 800 万+。
海外 L4：350-500k USD TC；L5：500-900k；L6/Staff：900k-1.5M（OpenAI / Anthropic 给到顶级研究员现金+PPU 可过 2M）。

面试侧重

八股占比约 40%（transformer 细节、attention 变体、优化器、并行策略），手撕 20%（写 attention、KV cache、sampling），系统题 20%（"给你 1000 张 H100 训 70B 怎么排布"），论文讨论 20%。越靠近 pretrain 团队，论文讨论比重越高。

2. 推理优化工程师 / Inference Engineer hot

2024 年起突然被抬到和算法同级工资的岗位。原因很简单：训练卡再多也是花钱，推理卡每天在帮公司收钱（或省钱），1% 的吞吐优化对一个日活千万的产品可能就是每年千万级的成本。

日常做什么

典型一天：早上看昨晚线上 P99 延迟为什么尖了一下，定位到是某个 prompt 触发了超长 decode；中午在 vLLM 上提一个 PR 把 chunked prefill 的 block size 调一下；下午和算法组撕——他们想上一个新模型但 KV cache 布局不兼容，你得评估要改多少 kernel；晚上跑一组 FP8 vs INT8 的精度对比。

技能要求

必须：C++/CUDA 能写能读；熟悉 vLLM、TensorRT-LLM、SGLang 中至少一个的源码级原理；理解 PagedAttention、continuous batching、speculative decoding、prefix caching；会用 Nsight / nvprof profile kernel。
加分：写过自定义 CUDA kernel（flash attention 变体、fused MoE、GEMM）；做过 W4A16 / FP8 量化落地；熟悉 NVLink / RDMA / NCCL；对 Hopper / Blackwell 架构特性（TMA、WGMMA）有实战。

典型 JD 原文摘录

阿里通义 · 大模型推理引擎工程师（P7）

1. 负责自研推理引擎的 kernel 层优化，重点方向：MoE 推理、long context prefill、投机解码；

2. 参与量化方案落地（INT4 / FP8），对精度与吞吐 trade-off 有量化判断；

3. 要求：精通 CUDA；有开源推理框架（vLLM/TRT-LLM/SGLang）贡献者优先。

DeepSeek · Inference Infra

1. 针对 DeepSeek 系列 MoE 模型做 expert parallel 下的通信优化，目标是把 all-to-all 的开销压到 10% 以内；

2. 主导一次完整的 H20/H100 迁移，输出性能对比报告；

3. 要求：有千卡以上推理集群排障经验。

对口公司

国内字节、阿里、腾讯、DeepSeek、Moonshot、硅基流动、摩尔线程、华为昇腾（自研路线）。
海外 NVIDIA、OpenAI、Anthropic、Together AI、Fireworks、Groq、Cerebras、AWS（Inferentia / Trainium 团队）。

薪资区间

国内 P6：70-130 万；P7：130-240 万；P8：260-500 万。头部公司对能手写 CUDA kernel 的候选人有明显溢价，同级比算法岗可能高 10-20%。
海外 L4-L5 推理岗在 NVIDIA / Anthropic 普遍 400-800k USD TC；Groq / Cerebras 这种硬件公司股票占比高，波动大。

面试侧重

手撕占大头，约 40%——现场写 CUDA kernel（reduce、softmax、一个简化版 attention）、写 C++ 线程池。系统设计 30%（"设计一个支持 100 并发的 LLM serving"）。八股 20%（量化、KV cache、调度算法）。论文讨论 10%，主要是近期工程论文（FlashAttention、vLLM、Medusa）。

3. AI Infra / 分布式训练工程师

和推理优化常被放在一起，但其实很不一样。推理是"低延迟 + 高吞吐"，训练是"大规模 + 稳定性 + 通信"。一次万卡训练中断重启成本就是几十万美元，Infra 工程师的核心价值是让训练不挂、挂了能快速恢复。

日常做什么

看 wandb 上 loss 有没有尖刺、某个 rank 是不是掉队；调 3D parallel（TP/PP/DP）的 shape 让 bubble 最小；debug 某张卡 ECC error 换卡重启的 checkpoint 加载流程；写一个 NCCL 的 hang detector，30 秒没 progress 就 dump stack 自动重启。很多时间其实在处理硬件故障、网络抖动、文件系统问题。

技能要求

必须：精通 Megatron-LM 或 DeepSpeed 或 FSDP 其中一个的源码；懂 TP/PP/DP/EP/SP 的数学与通信模式；熟悉 NCCL、RDMA、InfiniBand；会读 nsys profile 找通信气泡；有千卡以上任务的运维实战。
加分：做过 checkpoint 秒级保存 / 异步上传；实现过 ZeRO-3 offload 优化；懂 PyTorch distributed 内部（c10d、work、process group）；做过训练集群调度（k8s + Volcano / Slurm）。

典型 JD 原文摘录

字节 AML · 分布式训练框架工程师

1. 负责公司自研训练框架的并行策略层，支持稠密 / MoE / VLM 等多形态模型；

2. 优化 checkpoint、通信、容错等核心链路，目标 MFU ≥ 55% @ H100；

3. 要求：对 PyTorch 2.x 的 compile / distributed 有深入理解；有万卡规模训练经验优先。

智谱 · GPU 集群基础设施

1. 负责训练任务的 job 调度、优先级抢占、故障自愈；

2. 推动 NCCL 通信的 topology-aware 优化，降低跨机房 all-reduce 带宽占用；

3. 加分：有开源贡献（Megatron / NeMo / Ray）。

对口公司

国内字节 AML、阿里 PAI、腾讯机智、百度飞桨、华为、智谱、Moonshot、商汤。
海外 Meta（PyTorch/FSDP 团队）、NVIDIA（Megatron/NeMo）、Google（JAX/Pathways）、OpenAI、Anthropic、Databricks、CoreWeave。

薪资区间

国内 P6：75-130 万；P7：130-230 万；P8：250-450 万。
海外和推理岗基本一档，400-900k USD TC。PyTorch / JAX 核心贡献者在 Meta / Google 给的会更高。

面试侧重

系统设计占大头（约 40%）：给一个 70B 模型 + 512 张卡，让你设计 TP/PP/DP 切分并估算 MFU。八股 30%（NCCL 算法、PyTorch 分布式、通信优化）。手撕 20%，多是 C++/Python 的并发题。论文 10%。

4. Agent / Applied AI 工程师 new

2024 下半年开始才成规模的新工种。本质是"用别人训好的模型，做出有用的产品"。岗位名字特别杂：AI 产品工程师、Agent 工程师、Applied Scientist、Solution Architect，做的事其实很像——都是在模型、工具、数据、前端之间搭桥。

日常做什么

拿一个 Claude / Qwen-Max / GPT 当底座，做一个具体产品——可能是写代码 Agent、客服 Agent、数据分析 Agent。70% 的时间在写 prompt 和评估 pipeline，20% 在做工具调用 / MCP server / browser 控制，10% 在调 RAG 的召回和 rerank。很少训模型，偶尔做一点 LoRA 或 small model 蒸馏。产出看的是产品指标（任务成功率、用户留存），不是 loss。

技能要求

必须：强 prompt engineering 手感（能讲清楚为什么一个改动让成功率从 62% 到 78%）；熟悉至少一个 agent 框架（自写或 LangGraph / AutoGen / CrewAI）；懂 function calling / tool use / MCP；RAG 全链路实操（embedding 选型、chunking、rerank、eval）。
加分：做过线上 Agent 产品有真实用户；能写前端（用户交互是 Agent 体验的关键）；有 browser use / computer use 项目经验；做过自动化评测 pipeline（LLM-as-judge 的偏差处理）。

典型 JD 原文摘录

Anthropic 上海 · Applied AI Engineer

1. 和客户团队一起把 Claude 集成到他们的业务流程中，解决从 demo 到生产的所有问题；

2. 主导至少一个行业垂类的 agent 模板建设（金融 / 法律 / 代码）；

3. 要求：能读 Python，但更看重产品直觉与快速迭代能力。

某 AI 编程产品公司 · Coding Agent 工程师

1. 负责 codebase 理解、检索与编辑规划模块，目标是 SWE-bench Verified 提升 10 个点；

2. 设计工具集（文件读写、LSP、git、bash），保证 agent 在长任务下不 loop；

3. 加分：有 Copilot / Cursor / Cline / Aider 类产品使用经验，能说出每家的 trade-off。

对口公司

国内 Moonshot、字节（豆包/Coze/Trae）、阿里（百炼/通义灵码）、腾讯、MiniMax、Dify、扣子、Manus、各类 AI 创业公司。
海外 OpenAI、Anthropic、Cursor、Replit、Perplexity、Glean、Harvey、Cognition（Devin）、Factory、Poolside。

薪资区间

国内 P6：55-110 万；P7：110-200 万；P8：200-400 万。同级比算法岗低约 10-20%，但创业公司股票 upside 大。
海外这个岗位分层剧烈：大厂 Applied 约 300-600k USD；Cursor / Anthropic 的顶级 Applied 给到 700k-1.2M；早期创业公司现金偏低但股票可能翻几十倍。

面试侧重

产品 case 讨论是重头戏（约 40%）："你会怎么设计一个订机票的 agent？怎么评估？失败怎么 recover？"手撕 25%（LeetCode 中等）。系统设计 20%（RAG 系统、agent orchestration）。八股比例很低，约 15%，主要是 transformer 基础常识。几乎不问论文。

5. 传统机器学习 / 推荐搜索算法工程师

每年都有人喊"推荐要被大模型颠覆"，每年大厂都在继续批量招推荐算法。原因：广告和电商的钱还是靠推荐在赚，CTR 提升 0.5% 的收入增量远大于"用 LLM 做推荐"的 ROI。对应届生来说，这个赛道实际上比大模型好进，且有明确的收益归因。

日常做什么

主流是"堆特征 + 调模型 + AB 实验"三件套。典型一周：周一和产品对齐新实验组的目标（比如提升女装类目停留时长）；周二挖新特征（用户近 7 天点击的同 shop 商品 embedding）；周三改精排模型加一个 target attention；周四灰度 1% 观察；周五 AB 报告——大盘 CTR +0.12%、GMV +0.3%，发周会。

技能要求

必须：精通 GBDT（XGBoost / LightGBM）与深度排序模型（DIN / DIEN / SIM / TDM）；懂召回 / 粗排 / 精排 / 重排的链路分工；会写 SQL + Spark / Flink；有完整的 AB 实验读数经验。
加分：做过召回新范式（双塔、生成式召回、TDM）；懂 uplift / 因果推断；有大规模稀疏训练（参数服务器）经验；做过 LLM + 推荐的结合（生成式推荐、语义 ID、Cold-start LLM 初始化）。

典型 JD 原文摘录

字节抖音电商 · 推荐算法工程师

1. 负责商品推荐精排模型迭代，目标 CTR 与 GMV 双提升；

2. 探索生成式召回、LLM 语义理解在推荐链路的落地；

3. 要求：扎实的机器学习基础，有大规模在线实验经验。

腾讯广告 · 召回算法

1. 优化多目标双塔召回，平衡多样性与相关性；

2. 建设向量索引（HNSW / ScaNN）的工程化能力；

3. 加分：对对比学习、embedding 坍缩有深入思考。

对口公司

国内字节（抖音 / TikTok / 电商 / 广告）、阿里（淘宝 / 1688 / 阿里妈妈）、腾讯（微信看一看 / 广告 / 视频号）、快手、美团、京东、小红书、拼多多。
海外 Meta（Ads / Reels）、Google Ads、TikTok US、Netflix、Pinterest、Airbnb、Uber、Shopify。

薪资区间

国内应届 SP：40-60 万；P6：60-110 万；P7：110-200 万；P8：200-400 万。字节广告、抖音电商的头部 P7 包整体比大模型岗不差，甚至更稳。
海外：L4 250-400k / L5 400-650k USD。广告团队给得比大模型研究组还高不是新鲜事。

面试侧重

八股 45%（所有推荐论文从 wide&deep 到 SIM 到 HSTU，都要能画图讲清楚）。业务场景题 25%（"如果冷启用户占比突然涨 10%，你怎么定位")。手撕 20%（LeetCode 中等 + 写一个 AUC）。系统设计 10%。几乎不问论文前沿，但问业务落地细节非常深。

6. AI Research Scientist / 研究员

和"大模型算法工程师"容易混。区别是：算法工程师产出的是更好的线上模型，Research 产出的是可被同行 cite 的论文。一个典型信号是 JD 里写"要求一作顶会论文 X 篇"还是"要求有线上模型迭代经验"。

日常做什么

读论文（每天 2-5 篇 arxiv）、想 idea、跑 small-scale 实验、写论文、审稿。很多 Research 岗有 1-3 个月的"自由探索期"，之后需要对外 publish。国内几家大厂的 Research 团队（字节 Seed、阿里达摩、腾讯 AI Lab、华为诺亚）+ 高校合作 + 实习生带队是常态。

技能要求

必须：顶会一作发表（NeurIPS / ICML / ICLR / ACL / CVPR 等）；数学功底（优化、概率、线性代数）扎实到能自己推公式；独立 research 闭环能力（提问题→设计实验→写论文）。
加分：博士学位（MIT / Stanford / CMU / Berkeley / 清北 / 港中文等强势组）；有 high-impact 工作（>500 cite）；审稿 / 组 workshop / 讲 tutorial 经验；跨领域（AI4Science、机器人、多模态）。

典型 JD 原文摘录

字节 Seed · Research Scientist（Reasoning 方向）

1. 主导一个 research 方向（如 reasoning / agent / multimodal），每年产出 2-3 篇顶会一作或 co-lead；

2. 和 engineering 团队合作把 research idea 转化为下一代模型能力；

3. 要求：博士；至少 3 篇相关顶会论文，h-index ≥ 8。

Anthropic · Member of Technical Staff, Research

1. Drive research on alignment, interpretability, or capability evaluation；

2. Publish when publishing advances our mission, but impact on models is primary；

3. Strong empirical skills required; theoretical background welcomed but not sufficient alone.

对口公司

国内字节 Seed / Research、阿里达摩院、腾讯 AI Lab、华为诺亚、百度研究院、微软亚研（MSRA）、上海 AI Lab、智源。
海外 Google DeepMind、OpenAI、Anthropic、Meta FAIR、NVIDIA Research、Apple MLR、MSR Redmond、Mistral、Cohere、Allen AI。

薪资区间

国内博士应届研究员：60-100 万（特殊 SSP 到 150 万+）；Senior Researcher：150-300 万；首席 / 杰出：400-800 万，少数明星研究员到千万级。
海外 PhD 应届：350-600k USD；Senior：600k-1.2M；Staff / Principal：1.2-2.5M。Anthropic / OpenAI 对顶级研究员的 retention 包甚至冲到 5M+。

面试侧重

论文讨论 50%——让你 1 小时讲自己的工作，每 30 秒可能被打断提问。Research taste 面 20%（"最近最喜欢哪篇论文，为什么"）。手撕 15%。八股 10%。系统题很少，但数学推导会现场让你写。Research 岗最终是看 taste 的主观判断，hire bar 最难稳定。

岗位 × 关键维度横向对比

下面这张表是上面 6 个岗位的"一张图看懂"版。注意这是行业普遍情况的估计值，具体公司、具体团队会有较大偏差。

维度	LLM 算法	推理优化	AI Infra	Agent/Applied	推荐搜索	Research
核心技能栈	PyTorch、Megatron、数据工程、RLHF	CUDA、C++、vLLM/TRT-LLM、量化	Megatron/DeepSpeed、NCCL、k8s	Prompt、RAG、MCP、产品直觉	GBDT/DNN、SQL/Spark、AB 实验	数学、论文写作、实验设计
入门门槛	高（需要顶校 + 项目）	高（CUDA 难学）	中高（工程经验要求高）	中（最低，但天花板不低）	中（可以从实习做起）	极高（博士 + 一作顶会）
卷度	极卷，简历海	卷，但供给少	中等，需求稳定	卷程度上升中	稳卷，批量招人	最卷（每个坑上百人抢）
天花板	极高（pretrain lead）	高（稀缺工种）	高（集群 leader）	中高（CTO / 创始人路径）	高（广告 / 电商负责人）	极高（首席科学家）
应届友好度	难，但不是没机会	中（有 CUDA 实习就行）	中（hpc / 系统背景有优势）	友好（项目驱动）	最友好（成熟招聘线）	PhD only
5 年后前景	头部模型公司继续聚拢	随模型规模扩大只会更重要	同上，不会消失	如果 agent 爆发，这是最大赢家	存在，但岗位数可能缓慢下降	论文产出门槛越来越高，分化严重
是否需要 GPU	需要（大量）	需要	需要（集群）	几乎不需要	需要（但已经是成熟基础设施）	需要
线上反馈周期	周～月	天～周	天	小时～天	小时～天	月～年

如何选择主攻方向

上面的信息看完，你可能更焦虑了——都想做。下面给几条自查式的决策建议，每条对应一类典型画像。

1. 看你最愿意花周末在什么事情上

愿意花周末读 arxiv.org/abs/... 的最新论文并推公式 → Research 或 LLM pretrain。
愿意花周末 profile CUDA kernel 看为什么慢了 5% → 推理优化 / Infra。
愿意花周末 vibe coding 一个自己用的 agent → Agent / Applied。
愿意花周末看用户访谈、抠商品详情页转化率 → 推荐搜索。

2. 看你的硬约束

没有博士、不打算读博：Research 放弃，其他五个都开放。
数学不强、不喜欢公式：避开 Research 和 LLM pretrain，往 Agent / 推荐 / Infra 靠。
C++/CUDA 基础好或愿意学：推理优化是投入产出比最高的赛道，稀缺度 > 薪资溢价。
应届 + 想快速拿 offer：推荐搜索招聘漏斗最成熟，有明确准备路径。

3. 看你想赌什么

赌基础模型能力会继续跃迁 → 去 LLM 算法 / Research。
赌基础模型不再提升、应用层爆发 → 去 Agent / Applied。
赌成本会持续是核心竞争力 → 去 推理优化。
不想赌、想稳稳拿钱 → 去 大厂推荐。

4. 可逆性原则

从 Infra / 推理转到算法相对容易（你已经比大部分算法的人更懂训练细节）；从算法转到 Research 难（要补论文）；从 Agent 转到 pretrain 最难（几乎要从头学）。如果不确定，优先选可逆性更高的——也就是越底层、越"硬"的方向，未来换赛道的摩擦越小。

一个重要提醒：JD 上写的 ≠ 实际做的。JD 常常是 HR 拿 3 年前的模板改几个词、或者为了招人故意写得光鲜。强烈建议你在投之前：
1. 去脉脉搜目标部门名，看匿名员工吐槽；
2. 去小红书搜"字节 seed 面经 2026" / "阿里推理岗日常"这类关键词；
3. 去 LinkedIn 找在职员工，直接私信问"你们组现在主要做什么"。
花 30 分钟做这件事，比投完进去再后悔便宜得多。

岗位 JD 对比分析：选对方向比努力重要

1. 大模型算法工程师 / LLM Engineer hot

日常做什么

技能要求

典型 JD 原文摘录

对口公司

薪资区间（2026 行情）

面试侧重

2. 推理优化工程师 / Inference Engineer hot

日常做什么

技能要求

典型 JD 原文摘录

对口公司

薪资区间

面试侧重

3. AI Infra / 分布式训练工程师

日常做什么

技能要求

典型 JD 原文摘录

对口公司

薪资区间

面试侧重

4. Agent / Applied AI 工程师 new

日常做什么

技能要求

典型 JD 原文摘录

对口公司

薪资区间

面试侧重

5. 传统机器学习 / 推荐搜索算法工程师

日常做什么

技能要求

典型 JD 原文摘录

对口公司

薪资区间

面试侧重

6. AI Research Scientist / 研究员

日常做什么

技能要求

典型 JD 原文摘录

对口公司

薪资区间

面试侧重

岗位 × 关键维度 横向对比

如何选择主攻方向

1. 看你最愿意花周末在什么事情上

2. 看你的硬约束

3. 看你想赌什么

4. 可逆性原则

岗位 × 关键维度横向对比