LLM 大模型全栈工程师学习路线图

阶段一：Python 基础强化（2-3 周）

掌握 LLM 开发所需的 Python 核心能力：

Python 高级特性：装饰器、生成器、异步 async/await、类型注解
数据处理：NumPy、Pandas 基础操作
HTTP 客户端：requests、httpx 异步请求
环境管理：venv、conda、pyproject.toml

阶段二：LLM 核心原理（2-3 周）

理解大模型的底层机制：

Transformer 架构与 Self-Attention 原理
Tokenizer 分词机制（BPE、WordPiece）
主流模型对比：GPT 系列、千问、ChatGLM、Llama
LLM API 调用规范（OpenAI 兼容接口）
Prompt Engineering 基础

阶段三：智能体框架（3-4 周）

掌握 AI Agent 开发核心工具：

LangChain：Chain、Memory、Tools、Agents 完整体系
LangGraph：有状态多步骤工作流、循环图
Dify：低代码 Agent 平台，快速原型
RAG 系统：文档加载、分块、Embedding、向量检索、重排序

阶段四：ML 框架与微调（3-4 周）

具备模型训练与微调能力：

PyTorch：张量操作、自动微分、模型训练循环
HuggingFace Transformers：模型加载、推理、Pipeline
PEFT / LoRA：参数高效微调，低资源适配业务场景
vLLM：高吞吐推理服务部署

阶段五：后端服务化（2-3 周）

将模型能力封装为生产级 API：

FastAPI：异步 API、依赖注入、流式响应 SSE
Function Calling：工具调用、结构化输出
数据库集成：MySQL + SQLAlchemy、Redis 缓存、MongoDB 文档存储
RESTful API 设计规范

阶段六：部署与工程化（2-3 周）

具备生产部署能力：

Docker：多阶段构建、GPU 容器、Compose 编排
Kubernetes：Pod、Service、Deployment、HPA 弹性伸缩
Spring Cloud：微服务架构、服务发现、API 网关（Java 技术栈对接）
CI/CD：GitHub Actions 自动化测试与部署

阶段七：金融场景实战（持续）

结合业务场景深化：

智慧信贷 Agent 设计
知识问答系统（RAG + 金融知识库）
风控模型 API 集成
多模型协作流程设计

技术栈全景图

LLM 大模型全栈
├── 语言基础
│   ├── Python（主力）
│   └── Java（Spring Cloud 对接）
├── 大模型 API
│   ├── 千问 / 通义千问
│   ├── ChatGLM
│   └── OpenAI 兼容接口
├── 智能体框架
│   ├── LangChain / LangGraph
│   ├── Dify
│   ├── AutoGen / CrewAI
│   └── Rasa
├── ML 框架
│   ├── PyTorch
│   ├── HuggingFace Transformers
│   ├── PEFT / LoRA
│   └── vLLM
├── RAG & 向量库
│   ├── LlamaIndex
│   ├── Chroma / Faiss
│   └── Milvus
├── 后端服务
│   ├── FastAPI
│   └── Spring Cloud
├── 数据库
│   ├── MySQL / Oracle
│   ├── MongoDB
│   └── Redis
└── 部署
    ├── Docker
    └── Kubernetes

LLM 大模型全栈工程师学习路线图 ​

阶段一：Python 基础强化（2-3 周） ​

阶段二：LLM 核心原理（2-3 周） ​

阶段三：智能体框架（3-4 周） ​

阶段四：ML 框架与微调（3-4 周） ​

阶段五：后端服务化（2-3 周） ​

阶段六：部署与工程化（2-3 周） ​

阶段七：金融场景实战（持续） ​

技术栈全景图 ​

LLM 大模型全栈工程师学习路线图

阶段一：Python 基础强化（2-3 周）

阶段二：LLM 核心原理（2-3 周）

阶段三：智能体框架（3-4 周）

阶段四：ML 框架与微调（3-4 周）

阶段五：后端服务化（2-3 周）

阶段六：部署与工程化（2-3 周）

阶段七：金融场景实战（持续）

技术栈全景图