大模型Token免费或廉价获取攻略(持续更新中)
引言※#
Token消耗概况※#


三维度取舍※#

主流大模型套餐价格※#
Claude Code※#

GPT※#

Gemini※#

Kimi※#

GLM/Minimax※#

英伟达※#

自建API聚合平台(New-API)※#
免费、优惠大模型※#
信息源自Gemini的DeepSearch※#
此表格为暂存,待探索后逐一删除,关注表1和表2的持续更新。
| 服务商 | 国内访问状态 | 免费层级 / 赠送额度 (2026年 政策) | 核心特点/建议 | 实测 |
|---|---|---|---|---|---|
4 | Microsoft Azure [需代理] | $200 试用金 (新用户,30天有效)。 | 企业级稳定性,包含 GPT-4o 和 o1 全系列。 | ||
5 | AWS Bedrock [需代理] | $200 试用积分 (需完成新手引导任务)。 | 涵盖 Claude 3.5 全系列及亚马逊自家 Nova 模型。 | ||
7 | Groq [需代理] | 永久免费层级:限制 RPM,但推理速度极快。 | 速度王者,适合对响应延迟要求极高的场景。 | ||
9 | GitHub Models [需代理] | 免费预览额度 (针对 GitHub 账户每日限额)。 | 适合在 VS Code 开发环境中直接测试顶尖模型。 | ||
15 | Cerebras [需代理] | 永久免费层级 (基于其独家硬件加速)。 | 主打毫秒级延迟,适合实时流式输出需求。 | ||
16 | SambaNova [需代理] | 永久免费层级。 | 支持 405B 等超大规模 Llama 模型的高速推理。 | ||
17 | Hugging Face [需代理] | Serverless API 免费额度 (针对小型模型)。 | 适合调用特定的垂直领域微调模型。 | ||
18 | Cloudflare [需代理] | 每天固定 Neurons 免费额度。 | Workers AI 平台,适合轻量级模型部署在边缘侧。 |
供应商 | 核心大参数模型 (>10B) | 每日免费额度 (刷新周期: 每日) | 接口兼容性 | 核心优势 | 风险/备注 |
|---|---|---|---|---|---|
Cerebras | Qwen 3 (235B MoE), GPT-OSS 120B, Llama 3.3 70B | 14,400 次请求 (RPD) / 100 万 Tokens | OpenAI 兼容 | 极致吞吐量,并发能力极强,适合 tradingagents 高频扫描。 | 偶尔会有短时间的维护停机。 |
SambaNova | DeepSeek-R1 (满血版), Llama 3.3 70B, Qwen 3 235B | 约 100 万 Tokens 或 1000+ 次请求 | OpenAI 兼容 | 满血模型,不砍参数,不降智。LPU 加速非常快。 | 对新号审核较严,需正常开发用途。 |
Groq Cloud | Llama 4 Maverick (MoE), Llama 3.3 70B, Mixtral 8x22B | Llama 3.3 70B: 1,000 RPD | OpenAI 兼容 | 毫秒级响应。首字生成速度(TTFT)行业第一。 | 强力限流(Rate Limit),不适合大段文本并发。 |
Mistral (La Plateforme) | Mistral Large 2 (123B), Codestral | 10 亿 Tokens/月(按量分摊到每日) | 原生/OpenAI | 欧洲最强模型,Codestral 是目前代码生成的前三名。 | 必须手机号验证,实验计划(Experiment)有时会变动。 |
Cloudflare Workers AI | Qwen 2.5 Coder 32B, Llama 3.3 70B (FP8) | 每日 100 万 Neurons (约几十万 Tokens) | 原生 API | 边缘计算部署,如果你有 CF 账户,直接集成在代码里最快。 | 部分模型是 FP8 量化版,相比满血版略有精度损失。 |
| 序号 | 服务商 | 国内访问状态 | 免费层级/赠送额度(2026) | 核心特点(建议) | 实测 |
|---|---|---|---|---|---|
| 1 | 智谱AI(GLM) | 无需代理 | 2000万 Token (新用户);GLM-4-Flash 永久免费。 | 国产自研底座,Function Call 工具调用非常稳。 | 新注册用户送2000万token,新手机就可以注册,不需实名制 |
| 2 | 阿里云百炼 | 无需代理 | 数千万 Token (新用户);Qwen 开源版有免费配额。 | Qwen 2.5/3 系列,代码生成能力在国产中顶尖。 | 数百模型,多数模型在开启百炼平台后都赠送100万token左右的免费额度,需实名制,一个人通常只能注册一个账号 |
| 3 | 硅基流动(SiliconFlow) | 无需代理 | 注册送消费金;部分开源模型永久免费。 | 聚合国内主流模型,一个 API Key 调遍所有。 | 2026年2月,大参数量的模型基本都收费,10b左右的小模型很多免费。注册需要实名认证(支付宝扫脸认证)才能领消费代金券16元,定期有活动送代金券。有知识库、RAG需求的可以用上面的免费嵌入模型和重排序模型 |
| 4 | OpenRouter | 需代理 | 永久免费 (筛选 "Free" 标签的模型)。 | 聚合器,方便一键切换不同的开源模型。 | 免费用户50RPD,20RPM,充值>$10,1000RPD,20RPM,可注册多个账号(需Google账号或GitHub账号关联登录信息) |
| 5 | 月之暗面 (Kimi) | 无需代理 | 注册后实名认证送15元 | 擅长处理超长上下文及复杂文本解析。 | 手机号即可注册多个账号,点击个人认证就送15元 |
| 6 | MiniMax | 无需代理 | 注册后实名认证送15元 | 文本风格多变,在角色扮演和逻辑对话上表现不俗。 | 需支付宝扫脸实名认证后送15元 |
| 7 | Google Gemini | 需代理 | 永久免费层级:Flash版 15 RPM,100万+ 上下文。 | 超长文档分析首选,免费额度非常慷慨。 | 可以注册多个Google账号进行多渠道切换,额度如下 Gemini 3 Flash, 5 RPM, 250K TPM, 20 RPD Gemini 3.1 Flash Lite, 15 RPM, 250K TPM, 500 RPD Gemini 2.5 Flash, 5 RPM, 250K TPM, 20 RPD Gemini 2.5 Flash Lite, 10 RPM, 250K TPM, 20 RPD |
| 8 | 美团龙猫 (LongCat) | 无需代理 | 每日有免费额度 | 福利期,日常对话简单工作足够用 | 手机号注册,暂时不需实名认证,每日额度刷新 LongCat-Flash-Lite,5000万tokens LongCat-Flash-Chat, LongCat-Flash-Thinking, LongCat-Flash-Thinking-2601 每日共享50万额度 美团 LongCat 大模型 API 接入New-API指南:每日白嫖 5000 万 Token! |
| 9 | 百度千帆 | 无需代理 | 20代金券、部分模型赠送100万token额度 | 国内合规性极佳,适合正式的商业化环境。 | 人脸识别实名认证后赠送20代金券和部分模型的100万token额度,控制台的使用和阿里百炼的使用习惯不同,额度和代金券比较难找,问ai助手吧 |
| 10 | 字节火山引擎 | 无需代理 | 每个模型50万+ Token (新用户) | 豆包系列模型,高并发处理能力优秀。 | 人脸识别实名认证,全部模型赠送50万额度。参与协作奖励计划后,部分模型每日赠送200万额度,当前计划到26年3月31日,后续不知道会不会延长。注意后付费问题,使用模型未开启推理限额则当免费额度用尽仍会继续使用一小段时间(即使账户中没钱)产生欠费,欠费后有免费额度的模型也无法使用 |
| 11 | 腾讯云 (混元) | 无需代理 | 100万 Token (新用户大礼包); | 不太行,第三方没有,自己的模型不强 | |
| 12 | atomgit | 无需代理 | 200万免费tokens | GLM-5、Qwen3.5-397B-A17B、 Qwen3.5-122B-A10B三个模型限免,模型的上下文长度都被设限了,和官方的版本不一致,目前验证到的是32kb,不清楚后续会不会有变化 手机号即可注册账号,每个账号200万免费tokens,可使用模型数量还可以 | |
| 13 | 讯飞 星火 | 无需代理 | 10万免费tokens | 自有平台的spark lite模型永久免费,但是只有32k上下文。文档有点乱,没看懂没调通,放弃了。maas平台的免费期已过 | |
| 14 | 阶跃星辰 | 无需代理 | 15元代金券 | 手机注册即送15元代金券,step-3-flash模型可用,还有多个能力稍弱的模型 | |
| 15 | ollama | 无需代理 | 免费额度 | 邮箱即可注册,部分邮箱需手机号验证(具体机制不清,估计刚开云端机制不完善),不同邮箱可用同一个手机号验证。4-5小时刷新额度,每周刷新周额度,具体额度不清。 | |
| 16 | Nvidia Nim | 无需代理 | 免费额度 | 可注册多账号但没试,有rpm限制为40 | |
| 17 | modelscope | 无需代理 | 免费额度 | 账号需绑定阿里云,通过实名认证,每天总调用次数为2000次,每个模型单日额度为500 |
其他补充,信息源自reddit、抖音评论等社交媒体※#
| 序号 | 服务商 | 国内访问状态 | 免费层级/赠送额度(2026) | 核心特点(建议) | 实测 |
|---|---|---|---|---|---|
| 2 | iflow | ||||
| cherry studio探索免费模型 | |||||
| opencode | 长期,多模型可选,速度慢 | glm-5,minimax- m2.5, kimi-k2.5 | |||