画图又不打字,为什么也收 Token 费?
很多人以为只有文字对话才消耗 Token,其实 AI 画图 тоже要消耗 Token。
今天说说图文模型里的 Token 是怎么工作的。

图文模型的 Token 机制
文字部分
你输入的提示词(Prompt)会被转换成 Token。
比如 ” 一只可爱的猫咪 ” → 转换成 Token → AI 理解要画什么
图片部分
生成的图片也会被编码成 Token 序列,用于处理和输出。
为什么不能免费?
因为图片生成需要大量计算资源,和文字模型是类似的。
DALL- E 的计费方式
按张数计费
DALL- E 不直接收 Token 费,而是按生成图片数量收费。
• DALL-E 3:约 0.04-0.08 美元 / 张
• DALL-E 2:约 0.02 美元 / 张
和 Token 什么关系?
虽然你看不到 Token 消耗,但底层还是 Token 在计算。

Midjourney 的计费方式
订阅制
Midjourney 不按 Token 收费,采用会员订阅制。
• Basic 计划:约 10 美元 / 月
• Standard 计划:约 30 美元 / 月
• Pro 计划:约 120 美元 / 月
包含内容
• 快速生成时间
• 并发数量
• 隐私保护
Stable Diffusion 的计费
本地部署
自己部署完全免费,只需要电费和硬件。
在线版
• 第三方托管平台按次收费
• 通常 0.01-0.05 美元 / 张
图文模型的 Token 消耗
输入消耗
你的提示词会被转换成 Token。
提示词越长,消耗越多。
输出消耗
生成的图片会被编码成 Token 处理。
分辨率越高,消耗越多。
参考信息
如果上传参考图,参考图也会消耗 Token。
常见问题
Q:画图比文字更费 Token 吗?
A:不一定。取决于模型实现,有些按张收费,有些按 Token 收费。
Q:能控制画图消耗吗?
A:可以。精简提示词、选择较低分辨率、减少生成数量。
Q:免费画图工具有吗?
A:Stable Diffusion 本地版免费,New Bing 的 Image Creator 有免费额度。
总结
图文 AI 也需要消耗 Token,只是计费方式不同。
有的是按张收费(DALL-E),有的是订阅制(Midjourney)。
底层都是 Token 在计算,只是用户感知不到。
选择合适的工具和参数,可以控制成本。
