Skip to content

LLM 大模型全栈工程师学习路线图

阶段一:Python 基础强化(2-3 周)

掌握 LLM 开发所需的 Python 核心能力:

  • Python 高级特性:装饰器、生成器、异步 async/await、类型注解
  • 数据处理:NumPy、Pandas 基础操作
  • HTTP 客户端:requests、httpx 异步请求
  • 环境管理:venv、conda、pyproject.toml

阶段二:LLM 核心原理(2-3 周)

理解大模型的底层机制:

  • Transformer 架构与 Self-Attention 原理
  • Tokenizer 分词机制(BPE、WordPiece)
  • 主流模型对比:GPT 系列、千问、ChatGLM、Llama
  • LLM API 调用规范(OpenAI 兼容接口)
  • Prompt Engineering 基础

阶段三:智能体框架(3-4 周)

掌握 AI Agent 开发核心工具:

  • LangChain:Chain、Memory、Tools、Agents 完整体系
  • LangGraph:有状态多步骤工作流、循环图
  • Dify:低代码 Agent 平台,快速原型
  • RAG 系统:文档加载、分块、Embedding、向量检索、重排序

阶段四:ML 框架与微调(3-4 周)

具备模型训练与微调能力:

  • PyTorch:张量操作、自动微分、模型训练循环
  • HuggingFace Transformers:模型加载、推理、Pipeline
  • PEFT / LoRA:参数高效微调,低资源适配业务场景
  • vLLM:高吞吐推理服务部署

阶段五:后端服务化(2-3 周)

将模型能力封装为生产级 API:

  • FastAPI:异步 API、依赖注入、流式响应 SSE
  • Function Calling:工具调用、结构化输出
  • 数据库集成:MySQL + SQLAlchemy、Redis 缓存、MongoDB 文档存储
  • RESTful API 设计规范

阶段六:部署与工程化(2-3 周)

具备生产部署能力:

  • Docker:多阶段构建、GPU 容器、Compose 编排
  • Kubernetes:Pod、Service、Deployment、HPA 弹性伸缩
  • Spring Cloud:微服务架构、服务发现、API 网关(Java 技术栈对接)
  • CI/CD:GitHub Actions 自动化测试与部署

阶段七:金融场景实战(持续)

结合业务场景深化:

  • 智慧信贷 Agent 设计
  • 知识问答系统(RAG + 金融知识库)
  • 风控模型 API 集成
  • 多模型协作流程设计

技术栈全景图

LLM 大模型全栈
├── 语言基础
│   ├── Python(主力)
│   └── Java(Spring Cloud 对接)
├── 大模型 API
│   ├── 千问 / 通义千问
│   ├── ChatGLM
│   └── OpenAI 兼容接口
├── 智能体框架
│   ├── LangChain / LangGraph
│   ├── Dify
│   ├── AutoGen / CrewAI
│   └── Rasa
├── ML 框架
│   ├── PyTorch
│   ├── HuggingFace Transformers
│   ├── PEFT / LoRA
│   └── vLLM
├── RAG & 向量库
│   ├── LlamaIndex
│   ├── Chroma / Faiss
│   └── Milvus
├── 后端服务
│   ├── FastAPI
│   └── Spring Cloud
├── 数据库
│   ├── MySQL / Oracle
│   ├── MongoDB
│   └── Redis
└── 部署
    ├── Docker
    └── Kubernetes

最后更新:

本站内容由 褚成志 整理编写,仅供学习参考