论文 AIGC 降重的底层原理可以概括为一句话:“打散 AI 语言指纹,再注入人类写作特征”。具体由 4 个环节闭环完成:
语义解析:
系统先用 Transformer/BERT 把文本转成高维向量,通过注意力机制识别 AI 常见痕迹,如过长平滑句、固定连接词、低困惑度分布 。
语义重构:
在保持专业术语的前提下,进行同义词替换、主动被动互换、长短句拆分、逻辑顺序调整,使语言特征偏离 AI 统计分布 。
风格重铸:
用生成对抗网络(GAN)或强化学习模型引入人类常见的情感波动、句式跳跃和口语化过渡,输出自然、连贯的新文本 。
多目标优化:
同时优化“语义保真度 + 语言流畅度 + 文本新颖度”三项指标,确保降重后 AIGC 率 ≤10%,且学术逻辑不变 。