去年夏天,我帮一个网文作者朋友改稿,他信誓旦旦说"这章绝对手写的"。结果编辑三分钟打回,批注只有四个字:"AI味太重"。我俩对着屏幕愣了半天——他确实没开ChatGPT,但问题出在哪?后来逐句拆解才发现,他的语感已经被三个月的AI辅助"腌入味""了。这件事让我意识到,判断AI味的关键,从来不在于"有没有用AI",而在于文本本身携带了多少可量化的机器特征。
困惑度:最硬核的技术指标
平台审核系统判定AI生成的核心依据,是一个叫困惑度(Perplexity)的指标。简单说,它衡量的是一段文字的"不可预测性"——人类写作充满意外,AI输出则高度可预测。
| 文本类型 | 典型困惑度范围 | 特征 |
|---|---|---|
| 纯AI生成 | 10-30 | 用词平滑,句式规律,转折可预期 |
| AI辅助+人工润色 | 30-60 | 局部有波动,但整体节奏仍偏整齐 |
| 纯人工创作 | 60-150+ | 随机性强,常有"突兀"但生动的表达 |
番茄小说2026年Q1的审核日志泄露过一个细节:系统对正文进行滑动窗口检测,任何连续500字段落困惑度低于40,就会触发人工复核。这解释了为什么很多作者"明明自己写的却被判AI"——他们的写作习惯已经被AI训练得过于"顺滑"了。
句法熵:节奏的规律性陷阱
比困惑度更隐蔽的是句法熵,也就是句子结构的多样性程度。人类写作有句长波动、有残缺句、有突然插入的口语碎片;AI则倾向于保持稳定的"主谓宾"节奏,像心跳监测仪上过于规律的波纹。
一个简单自测方法:把你写的300字段落按句长标出来。如果呈现15字→18字→16字→17字这种锯齿极小的波形,AI味已经很重。活人写的文字更像是8字→23字→6字→31字——有急刹,有冲刺,有磕绊。
情感极性方差:机器的中立病
AI的底层训练目标之一是"安全",这导致它的情感表达趋于收敛。用NLP工具分析文本的情感极性(-1到+1的评分),AI生成的段落方差通常小于0.15,而人类写作可以轻松突破0.4——我们在同一章里能同时做到让读者笑出声和骂脏话,AI只能让你"感到一定的情绪波动"。
那个被退稿的朋友后来做了件事:把稿子扔进情感分析工具,结果整章情感曲线像超市停车场——平得能开卡车。他重写了一版,故意在第三章中间塞了一句"这剧情烂得我想把键盘吃了",困惑度瞬间从38飙到72,过审。
代词密度与视角漂移
还有一个冷门但有效的指标:第一人称代词密度。AI写第一人称时,"我"的出现频率往往过于均匀,大约每3.5句一次,像打点计时器;人类则极度不规律——激动时连续七八个"我"砸出去,转场时可能整段消失。
更微妙的是视角漂移。活人写久了会突然跳到上帝视角吐槽一句,或者钻进配角的脑子待半页,再晃回来。AI被RLHF训练得"忠于设定",这种"走神"几乎绝迹。
最终的审判:你的语感指纹
技术指标再多,也绕不过一个事实——平台编辑的肉眼判断仍是终审。他们不看数字,看的是"这像不像活人喘的气"。
一位从业八年的编辑跟我说过标准:"我读的时候会不会好奇'接下来呢'?AI写的让我知道接下来,人写的让我想知道接下来。"
说到底,AI味的核心指标只有一个综合值:你的文字在多大程度上保留了认知的摩擦感。机器追求顺滑,人类天生粗糙——那种粗糙,才是读者买单的东西。