Skip to content

LLM 大模型生态全景

什么是大语言模型

大语言模型(Large Language Model,LLM)是基于 Transformer 架构、在海量文本数据上预训练的神经网络模型。其核心能力是下一个 Token 预测,通过这一简单目标涌现出理解、推理、代码生成等复杂能力。

python
# 最简单的 LLM 调用示例(OpenAI 兼容接口)
from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"  # 千问
)

response = client.chat.completions.create(
    model="qwen-turbo",
    messages=[
        {"role": "system", "content": "你是一个金融分析助手"},
        {"role": "user", "content": "解释什么是 RAG 技术"}
    ]
)
print(response.choices[0].message.content)

主流模型生态

国内模型

模型厂商特点API
千问 / 通义千问阿里云长上下文、工具调用强DashScope
ChatGLM智谱 AI中文优化、开源可本地部署BigModel
DeepSeek深度求索推理能力强、性价比高DeepSeek API
Kimi月之暗面超长上下文(200K)Moonshot API

国际模型

模型厂商特点
GPT-4oOpenAI多模态、Function Calling 标准制定者
Claude 3.5Anthropic长上下文、代码能力强
Llama 3Meta开源、可本地部署微调
GeminiGoogle多模态、与 Google 生态集成

LLM 应用开发技术栈

用户请求


┌─────────────────────────────────────┐
│         应用层(FastAPI)            │
│  Prompt 构建 → LLM 调用 → 结果解析  │
└─────────────────────────────────────┘
    │                    │
    ▼                    ▼
┌─────────┐      ┌──────────────┐
│ 向量检索 │      │  工具调用     │
│ (RAG)   │      │ (Function    │
│ Chroma  │      │  Calling)    │
│ Milvus  │      └──────────────┘
└─────────┘


┌─────────────────────────────────────┐
│         智能体框架                   │
│  LangChain / LangGraph / Dify       │
└─────────────────────────────────────┘


┌─────────────────────────────────────┐
│         LLM 模型层                   │
│  千问 / ChatGLM / GPT-4 / Llama     │
└─────────────────────────────────────┘

核心概念速览

Token 与上下文窗口

  • Token:模型处理的最小单位,中文约 1.5 字/token,英文约 0.75 词/token
  • 上下文窗口:模型一次能处理的最大 token 数,GPT-4 128K,千问 1M
  • KV Cache:推理时缓存注意力键值对,加速长对话

温度与采样参数

python
response = client.chat.completions.create(
    model="qwen-turbo",
    messages=[...],
    temperature=0.7,    # 0=确定性输出,1=创意输出
    top_p=0.9,          # 核采样,控制词汇多样性
    max_tokens=2048,    # 最大输出长度
    stream=True         # 流式输出
)

系统提示词(System Prompt)

python
system_prompt = """
你是一个专业的金融 AI 助手,具备以下能力:
1. 分析金融数据和市场趋势
2. 解答银行、证券、保险相关问题
3. 辅助设计 AI Agent 业务方案

回答要求:
- 专业准确,引用数据时注明来源
- 对不确定的信息明确说明
- 涉及投资建议时添加风险提示
"""

生态全景导航

本站内容由 褚成志 整理编写,仅供学习参考