LLM 大模型全栈工程师学习路线图
阶段一:Python 基础强化(2-3 周)
掌握 LLM 开发所需的 Python 核心能力:
- Python 高级特性:装饰器、生成器、异步 async/await、类型注解
- 数据处理:NumPy、Pandas 基础操作
- HTTP 客户端:requests、httpx 异步请求
- 环境管理:venv、conda、pyproject.toml
阶段二:LLM 核心原理(2-3 周)
理解大模型的底层机制:
- Transformer 架构与 Self-Attention 原理
- Tokenizer 分词机制(BPE、WordPiece)
- 主流模型对比:GPT 系列、千问、ChatGLM、Llama
- LLM API 调用规范(OpenAI 兼容接口)
- Prompt Engineering 基础
阶段三:智能体框架(3-4 周)
掌握 AI Agent 开发核心工具:
- LangChain:Chain、Memory、Tools、Agents 完整体系
- LangGraph:有状态多步骤工作流、循环图
- Dify:低代码 Agent 平台,快速原型
- RAG 系统:文档加载、分块、Embedding、向量检索、重排序
阶段四:ML 框架与微调(3-4 周)
具备模型训练与微调能力:
- PyTorch:张量操作、自动微分、模型训练循环
- HuggingFace Transformers:模型加载、推理、Pipeline
- PEFT / LoRA:参数高效微调,低资源适配业务场景
- vLLM:高吞吐推理服务部署
阶段五:后端服务化(2-3 周)
将模型能力封装为生产级 API:
- FastAPI:异步 API、依赖注入、流式响应 SSE
- Function Calling:工具调用、结构化输出
- 数据库集成:MySQL + SQLAlchemy、Redis 缓存、MongoDB 文档存储
- RESTful API 设计规范
阶段六:部署与工程化(2-3 周)
具备生产部署能力:
- Docker:多阶段构建、GPU 容器、Compose 编排
- Kubernetes:Pod、Service、Deployment、HPA 弹性伸缩
- Spring Cloud:微服务架构、服务发现、API 网关(Java 技术栈对接)
- CI/CD:GitHub Actions 自动化测试与部署
阶段七:金融场景实战(持续)
结合业务场景深化:
- 智慧信贷 Agent 设计
- 知识问答系统(RAG + 金融知识库)
- 风控模型 API 集成
- 多模型协作流程设计
技术栈全景图
LLM 大模型全栈
├── 语言基础
│ ├── Python(主力)
│ └── Java(Spring Cloud 对接)
├── 大模型 API
│ ├── 千问 / 通义千问
│ ├── ChatGLM
│ └── OpenAI 兼容接口
├── 智能体框架
│ ├── LangChain / LangGraph
│ ├── Dify
│ ├── AutoGen / CrewAI
│ └── Rasa
├── ML 框架
│ ├── PyTorch
│ ├── HuggingFace Transformers
│ ├── PEFT / LoRA
│ └── vLLM
├── RAG & 向量库
│ ├── LlamaIndex
│ ├── Chroma / Faiss
│ └── Milvus
├── 后端服务
│ ├── FastAPI
│ └── Spring Cloud
├── 数据库
│ ├── MySQL / Oracle
│ ├── MongoDB
│ └── Redis
└── 部署
├── Docker
└── Kubernetes