Qwen3 72B 阿里云
输入
¥0.90
输出
¥2.00

最新旗舰,思维模式可切换,1M上下文,代码/数学/推理全面提升

Qwen2.5 72B 阿里云
输入
¥0.80
输出
¥1.80

稳定版,中文理解出色,代码能力强,开源可微调

DeepSeek V3 深度求索
输入
¥0.50
输出
¥1.50

开源最强,数学推理出色,成本仅为GPT-4o的1/10

DeepSeek R1 深度求索
输入
¥1.00
输出
¥4.00

推理模型,复杂逻辑、多步推理、代码调试首选

Kimi K2.6 月之暗面
输入
¥0.80
输出
¥2.00

最新多模态版,文本/图片/视频输入,长程代码能力强

Kimi K2.5 月之暗面
输入
¥0.70
输出
¥1.80

稳定版,20万上下文,文档/合同/论文处理能力强

MiniMax M3 MiniMax
输入
¥0.30
输出
¥1.00

最新旗舰,超长上下文优化,1M tokens,适合文档分析

MiniMax M2.7 MiniMax
输入
¥0.25
输出
¥0.90

稳定版,性价比极高,多语言能力强

Doubao 1.8 字节跳动
输入
¥0.20
输出
¥0.80

火山引擎,低价策略,中文对话流畅,适合日常轻量任务

Yi Lightning 零一万物
输入
¥0.60
输出
¥2.00

全球SOTA专家混合模型,极速推理,多语言能力强

以下为国际模型,中国境内访问可能不稳定
GPT-4o mini OpenAI
输入
$0.15
输出
$0.60

极速响应,日常任务首选,成本效益最佳

GPT-5.5 OpenAI
输入
$5.00
输出
$30.00

OpenAI最新旗舰,GPT-5系列主力版本,推理能力最强

GPT-5.5 Ultra OpenAI
输入
$10.00
输出
$50.00

GPT-5.5顶级版本,极限推理任务,复杂Agent场景

Claude Opus 4.6 Anthropic
输入
$5.00
输出
$25.00

Anthropic高阶推理旗舰,复杂逻辑、长文档、专业场景

Gemini 3.5 Flash Google
输入
$1.50
输出
$9.00

Gemini 3.5系列主力,高速推理与智能体任务,性能超越前代Pro

Groq Mixtral 8x7B Groq
输入
$0.24
输出
$0.24

超高速推理,Groq LPU芯片,推理速度极快

价格单位:人民币元 / 每百万tokens,或美元 / 每百万tokens。实际按用量精确扣费。

选择指南
模型 优势 劣势 / 局限 最佳场景
GPT-5.5 最强推理 代码最优 价格高 中文稍弱 复杂推理、代码开发、长文撰写、研究分析
GPT-4o mini 速度快 成本低 复杂任务能力有限 日常对话、客服、批量处理、轻量任务
Claude Opus 4.6 长上下文 分析深入 国内访问不稳定 长文档分析、代码审查、创意写作、学术研究
Gemini 3.5 Flash 性价比最高 100万上下文 中文能力一般 大量数据处理、超长文本摘要、多模态任务
Qwen2.5 72B 中文最强 开源可微调 推理能力弱于顶级闭源 中文内容生成、客服机器人、知识库问答
DeepSeek R1 推理能力强 成本极低 非推理场景无优势 数学证明、代码调试、多步逻辑分析、复杂问题
DeepSeek V3 开源最强性价比 生态较新 通用对话、代码生成、中等复杂度任务
Kimi 200K 超长上下文 中文体验好 输出速度一般 合同审查、论文总结、长篇文档处理、多文件分析
MiniMax Text-01 1M超长记忆 低价 生态不够成熟 超长文本分析、多轮对话记忆、大规模数据挖掘
Doubao Pro 价格极低 中文流畅 复杂推理能力有限 轻量客服、日常对话、内容审核、批量任务
Yi Large 200K上下文 多语言强 品牌认知度低 多语言应用、长文本任务、翻译、内容创作
为什么要用 Token API?

自己部署 vs 使用 API

自己部署模型需要:GPU服务器(成本高)+ 模型下载 + 环境配置 + 日常维护 + 升级迭代。使用 API 则只需一个 key,按量付费,零运维。

  • 无需购买昂贵 GPU,按实际用量付费
  • 无需管理服务器,不操心运维
  • 随时切换模型,找到最适合任务的
  • 最新模型第一时间可用,无需自己部署

如何选择合适的模型?

不是越贵越好,也不是越大越好。关键是根据任务特性选择。

  • 日常对话 / 客服 → GPT-4o mini、Doubao Pro(便宜快速)
  • 复杂推理 / 代码 → GPT-5.5、DeepSeek R1(强推理)
  • 长文档分析 → Kimi 200K、MiniMax(超长上下文)
  • 中文内容生成 → Qwen2.5、Yi Large(中文优化)
  • 大规模数据处理 → Gemini 1.5 Flash(低价+长上下文)

API 接口

OpenAI 兼容接口,一行代码切换,无需改变现有代码

POST
/v1/chat/completions
调用模型,OpenAI 兼容格式
POST
/auth/register
注册账号,获取 API Key
POST
/user/topup
充值余额,微信/支付宝
GET
/user/balance/{api_key}
查询账户余额
GET
/v1/models
查看可用模型列表

支持 OpenAI 兼容接口,零迁移成本接入

查看接入指南 →