什么是Token?为什么AI算钱都按Token算?一文看懂

先说个我踩过的坑:以为按字数算钱,结果被扣了一堆 Token

刚开始用 ChatGPT 的时候,我看它显示消耗了 ”2000 tokens”,一脸懵。啥是 Token?字数?不是按对话次数收费?

后来才知道,Token 是 AI 公司收费的方式,跟中文字数不完全一样。

今天就把这个讲清楚,看完你也能算清楚用 AI 到底花了多少钱。

什么是 Token?为什么 AI 算钱都按 Token 算?一文看懂

Token 到底是什么?

Token 不是字,也不是词,是 AI 处理文本的基本单位。

简单理解:AI 把文字切成一小块一小块,每一块叫一个 Token。

英文 Token

英文比较简单,一个 Token 大约等于 4 个字符,或者 3 / 4 个单词。

所以 ”hello world” 大概 2 个 Token,”AI is amazing” 大概 4 个 Token。

中文 Token

中文更费 Token。一个中文汉字通常算 1 - 2 个 Token。

一句话 ” 今天天气真好 ” 大概 5 - 8 个 Token。

什么是 Token?为什么 AI 算钱都按 Token 算?一文看懂

为什么 AI 公司按 Token 收费?

原因很简单:Token 数量直接影响计算成本。

AI 处理你的文字,需要 ” 思考 ”,这个思考过程消耗的是算力。Token 越多,算力消耗越大,成本越高。

打个比方:Token 就像水表上的数字,用得越多,水费越多。

AI 公司的收费模式

• 输入的 Token(你发给 AI 的文字)

• 输出的 Token(AI 回复的文字)

两部分都算钱。

所以对话越长,消耗的 Token 越多,花钱越多。

怎么估算 Token 消耗?

有个大概的估算方法:

英文

1000 个 Token ≈ 750 个单词 ≈ 3000 个字符

中文

1000 个 Token ≈ 500-1000 个汉字

不同模型的换算比例略有差异,具体看官方文档。

什么是 Token?为什么 AI 算钱都按 Token 算?一文看懂

主流 AI 的 Token 定价

ChatGPT(OpenAI)

GPT-3.5 Turbo:便宜,约 $2/ 百万 Token

GPT-4:贵,约 $30-60/ 百万 Token

一句话总结:GPT- 4 比 GPT-3.5 贵 15-30 倍。

Claude(Anthropic)

Claude 3 Sonnet:中等价位

Claude 3 Opus:较贵,性能最强

国产模型

通义千问、文心一言等:相对便宜,有些免费额度

怎么省 Token?

知道了 Token 是什么,就得学会省着用:

技巧一:简洁提问

别啰嗦,一句话能说清楚的,别用三句。

❌ “ 你好呀,我想请教你一个问题,这个问题是我最近遇到的,具体是这样的 …”

✅ “ 请解释什么是 Token”

技巧二:精简上下文

对话太长时,AI 会记住全部内容,消耗大量 Token。可以开启新对话,或者让 AI 总结之前的内容。

技巧三:用更小的模型

简单问题用 GPT-3.5,难问题再用 GPT-4。省钱又高效。

常见问题

Q:Token 数会清零吗?

A:不会清零,但每次对话结束(开启新对话),之前的 Token 不会累计到新对话里。

Q:1000 个 Token 能写多少字文章?

A:中文大概 500-800 字,英文大概 750 个单词。

Q:Token 不够用会怎样?

A:对话会 ” 忘记 ” 之前的内容,或者直接拒绝回答。有些模型有上下文长度限制。

总结

Token 就是 AI 处理文本的基本单位,按输入和输出分别计费。

用 AI 的时候,尽量简洁提问,省 Token 就是省钱。

了解这个底层逻辑,你就能更聪明地使用 AI 工具了。

正文完
 0