大模型Token免费或廉价获取攻略（持续更新中）

- 字

2026-02-11

引言※

Token消耗概况※

三维度取舍※

主流大模型套餐价格※

Claude Code※

GPT※

Gemini※

Kimi※

GLM/Minimax※

英伟达※

自建API聚合平台（New-API）※

从零开始：用群晖 NAS 搭建 New-API 并集成智谱 AI 打造全能 AI 编程助手

🛠️ 进阶：如何优雅地配置 New-API 模型重定向（以阿里云大模型服务平台百炼为例）

免费、优惠大模型※

信息源自Gemini的DeepSearch※

此表格为暂存，待探索后逐一删除，关注表1和表2的持续更新。

	服务商	免费层级 / 赠送额度 (2026年政策)	核心特点/建议
4	Microsoft Azure [需代理]	$200 试用金 (新用户，30天有效)。	企业级稳定性，包含 GPT-4o 和 o1 全系列。
5	AWS Bedrock [需代理]	$200 试用积分 (需完成新手引导任务)。	涵盖 Claude 3.5 全系列及亚马逊自家 Nova 模型。
9	GitHub Models [需代理]	免费预览额度 (针对 GitHub 账户每日限额)。	适合在 VS Code 开发环境中直接测试顶尖模型。

15	Cerebras [需代理]	永久免费层级 (基于其独家硬件加速)。	主打毫秒级延迟，适合实时流式输出需求。
16	SambaNova [需代理]	永久免费层级。	支持 405B 等超大规模 Llama 模型的高速推理。

18	Cloudflare [需代理]	每天固定 Neurons 免费额度。	Workers AI 平台，适合轻量级模型部署在边缘侧。

供应商	核心大参数模型 (>10B)	每日免费额度 (刷新周期: 每日)	接口兼容性	核心优势	风险/备注
Cerebras	Qwen 3 (235B MoE), GPT-OSS 120B, Llama 3.3 70B	14,400 次请求 (RPD) / 100 万 Tokens	OpenAI 兼容	极致吞吐量，并发能力极强，适合 tradingagents 高频扫描。	偶尔会有短时间的维护停机。
SambaNova	DeepSeek-R1 (满血版), Llama 3.3 70B, Qwen 3 235B	约 100 万 Tokens 或 1000+ 次请求	OpenAI 兼容	满血模型，不砍参数，不降智。LPU 加速非常快。	对新号审核较严，需正常开发用途。
Mistral (La Plateforme)	Mistral Large 2 (123B), Codestral	10 亿 Tokens/月（按量分摊到每日）	原生/OpenAI	欧洲最强模型，Codestral 是目前代码生成的前三名。	必须手机号验证，实验计划（Experiment）有时会变动。
Cloudflare Workers AI	Qwen 2.5 Coder 32B, Llama 3.3 70B (FP8)	每日 100 万 Neurons (约几十万 Tokens)	原生 API	边缘计算部署，如果你有 CF 账户，直接集成在代码里最快。	部分模型是 FP8 量化版，相比满血版略有精度损失。

序号	服务商	国内访问状态	免费层级/赠送额度（2026）	核心特点（建议）	实测
1	智谱AI（GLM）	无需代理	2000万 Token (新用户)；GLM-4-Flash 永久免费。	国产自研底座，Function Call 工具调用非常稳。	新注册用户送2000万token，新手机就可以注册，不需实名制从零开始：用群晖 NAS 搭建 New-API 并集成智谱 AI 打造全能 AI 编程助手
2	阿里云百炼	无需代理	数千万 Token (新用户)；Qwen 开源版有免费配额。	Qwen 2.5/3 系列，代码生成能力在国产中顶尖。	数百模型，多数模型在开启百炼平台后都赠送100万token左右的免费额度，需实名制，一个人通常只能注册一个账号 🛠️ 进阶：如何优雅地配置 New-API 模型重定向（以阿里云大模型服务平台百炼为例）
3	硅基流动（SiliconFlow）	无需代理	注册送消费金；部分开源模型永久免费。	聚合国内主流模型，一个 API Key 调遍所有。	2026年2月，大参数量的模型基本都收费，10b左右的小模型很多免费。注册需要实名认证（支付宝扫脸认证）才能领消费代金券16元，定期有活动送代金券。有知识库、RAG需求的可以用上面的免费嵌入模型和重排序模型
4	OpenRouter	需代理	永久免费 (筛选 "Free" 标签的模型)。	聚合器，方便一键切换不同的开源模型。	免费用户50RPD，20RPM，充值>$10，1000RPD，20RPM，可注册多个账号（需Google账号或GitHub账号关联登录信息）
5	月之暗面 (Kimi)	无需代理	注册后实名认证送15元	擅长处理超长上下文及复杂文本解析。	手机号即可注册多个账号，点击个人认证就送15元
6	MiniMax	无需代理	注册后实名认证送15元	文本风格多变，在角色扮演和逻辑对话上表现不俗。	需支付宝扫脸实名认证后送15元
7	Google Gemini	需代理	永久免费层级：Flash版 15 RPM，100万+ 上下文。	超长文档分析首选，免费额度非常慷慨。	可以注册多个Google账号进行多渠道切换，额度如下 Gemini 3 Flash, 5 RPM, 250K TPM, 20 RPD Gemini 3.1 Flash Lite, 15 RPM, 250K TPM, 500 RPD Gemini 2.5 Flash, 5 RPM, 250K TPM, 20 RPD Gemini 2.5 Flash Lite, 10 RPM, 250K TPM, 20 RPD
8	美团龙猫 (LongCat)	无需代理	每日有免费额度	福利期，日常对话简单工作足够用	手机号注册，暂时不需实名认证，每日额度刷新 LongCat-Flash-Lite，5000万tokens LongCat-Flash-Chat, LongCat-Flash-Thinking, LongCat-Flash-Thinking-2601 每日共享50万额度美团 LongCat 大模型 API 接入New-API指南：每日白嫖 5000 万 Token！
9	百度千帆	无需代理	20代金券、部分模型赠送100万token额度	国内合规性极佳，适合正式的商业化环境。	人脸识别实名认证后赠送20代金券和部分模型的100万token额度，控制台的使用和阿里百炼的使用习惯不同，额度和代金券比较难找，问ai助手吧
10	字节火山引擎	无需代理	每个模型50万+ Token (新用户)	豆包系列模型，高并发处理能力优秀。	人脸识别实名认证，全部模型赠送50万额度。参与协作奖励计划后，部分模型每日赠送200万额度，当前计划到26年3月31日，后续不知道会不会延长。注意后付费问题，使用模型未开启推理限额则当免费额度用尽仍会继续使用一小段时间（即使账户中没钱）产生欠费，欠费后有免费额度的模型也无法使用
11	腾讯云 (混元)	无需代理	100万 Token (新用户大礼包)；		不太行，第三方没有，自己的模型不强
12	atomgit	无需代理	200万免费tokens		GLM-5、Qwen3.5-397B-A17B、 Qwen3.5-122B-A10B三个模型限免，模型的上下文长度都被设限了，和官方的版本不一致，目前验证到的是32kb，不清楚后续会不会有变化手机号即可注册账号，每个账号200万免费tokens，可使用模型数量还可以
13	讯飞星火	无需代理	10万免费tokens		自有平台的spark lite模型永久免费，但是只有32k上下文。文档有点乱，没看懂没调通，放弃了。maas平台的免费期已过
14	阶跃星辰	无需代理	15元代金券		手机注册即送15元代金券，step-3-flash模型可用，还有多个能力稍弱的模型
15	ollama	无需代理	免费额度		邮箱即可注册，部分邮箱需手机号验证（具体机制不清，估计刚开云端机制不完善），不同邮箱可用同一个手机号验证。4-5小时刷新额度，每周刷新周额度，具体额度不清。
16	Nvidia Nim	无需代理	免费额度		可注册多账号但没试，有rpm限制为40
17	modelscope	无需代理	免费额度		账号需绑定阿里云，通过实名认证，每天总调用次数为2000次，每个模型单日额度为500
18	小米 MIMO	无需代理	5元代金券		账号绑定小米id，实名认证后有5元代金券，新模型mimo-v2-pro、mimo-v2-omni在cline、kilocode等工具中从3月19日起免费试用一周。持续有各种优惠方案，openclaw、hermes有两周免费使用，又推出了免费token plan领取计划，邀请码优惠券等
19	联通元景	无需代理	有免费试用模型		模型广场标记为“免费试用”的模型可用，不清楚免费额度是怎样计算的
20	联通云	无需代理	免费额度		多个模型100额度，需注意不同云区域支持的模型不同。也提供coding plan和token plan
21	商汤科技 SenseNova	无需代理	免费额度		公测期间免费的token plan畅想使用，有5小时窗口独立计算
22	opencode （go）		免费额度		有bigpicle 免费模型，额度较少。可订阅go计划5美元首月，次月10美元，享受60美元的token额度
23	Hugging Face	需代理	免费额度		2026的免费额度极少0.1美元/月
24	天翼云	无需代理	免费额度		手机号注册就有免费额度可用，部分模型glm-5等10款较新模型有2500万免费额度可用，但有效期为2周
25	移动云模型服务平台MoMA	无需代理	免费额度		需实名认证，但可以多个手机号注册，貌似一个人最多注册10个移动云账号。每个账号有2500万免费token，不过有使用期限为30天

表1. 主流大模型云供应商探索

参考链接※

如何买到便宜的大模型token？