先说个你可能遇到过的困惑:为什么 AI 收费按 Token 算?
用 ChatGPT API 的时候,发现计费单位是 Token,不是字数。很多人搞不清楚 Token 到底是什么,和字有什么区别。
今天用最简单的话,把 Token 这件事讲清楚。

Token 是什么?一句话解释
Token 就是 AI 处理文字的基本单位。可以理解成 ” 文字碎片 ”。
简单类比:
如果把文章比作一串珠子,Token 就是每一颗珠子。AI 不是一颗一颗读珠子,而是把珠子分成小组来处理。每组就是一个 Token。
Token 和字有什么区别?
中文情况
一个汉字通常是 1 - 2 个 Token。
比如 ” 今天天气真好 ” 这句话,可能是 5 - 8 个 Token。
英文情况
英文更复杂。一个单词可能是 1 个 Token,也可能是多个 Token。
• 简单单词:”hello” ≈ 1 个 Token
• 复杂单词:”unbelievable” 可能拆成 3 个 Token
为什么不一样?
因为 AI 的 ” 词汇表 ” 是有限的。常见词用 1 个 Token 表示,不常见的词要拆成多个 Token。

为什么 AI 用 Token 不用字数?
技术原因
AI 内部处理的是 Token,不是字符。Token 是 AI” 理解 ” 语言的最小单位。
成本原因
处理一个 Token 消耗的计算资源相对固定。按 Token 计费,更准确地反映成本。
公平性
不同语言同样意思的字数不同。按 Token 算,不同语言更公平。
Token 的几种类型
单字符 Token
标点符号、单个字符。比如 ”,”、”。”、”a”。
单词 Token
常见单词整体是一个 Token。比如 ”the”、” 是 ”、” 你好 ”。
子词 Token
不常见的词会被拆分。比如 ”unhappiness” 可能拆成 ”un”、”happy”、”ness”。
特殊 Token
AI 自己用的特殊标记,比如句子开始、句子结束、填充符等。
生活中的类比
类比一:购物
Token 就像 ” 购物单位 ”。你去超市买苹果,不是按 ” 个 ” 算,是按 ” 斤 ” 算。Token 就是 AI 世界的 ” 斤 ”。
类比二:快递
快递收费按重量和体积算,不按件数。Token 就是 AI 处理的 ” 重量 ”。

常见问题
Q:一个 Token 大约是多少字?
A:中文约 0.5- 1 个字,英文约 0.75 个单词。具体看内容和模型。
Q:Token 能自己数吗?
A:可以用 OpenAI 官方的 Tokenizer 工具在线计算。
Q:不同模型的 Token 一样吗?
A:不一样。每个模型有自己的分词方式,Token 数量可能不同。
总结
Token 是 AI 处理文字的基本单位,可以理解成 ” 文字碎片 ”。
中文 1 个字约等于 1 - 2 个 Token,英文 1 个单词约等于 1 -1.5 个 Token。
了解 Token,才能准确估算 AI 的使用成本。
简单说:Token 就是 AI 收费的计量单位。
