AI写的还是人写的？连AI自己都分不清！_体育

　　编者按：在人工智能浪潮席卷全球的今天，AI生成文本已渗透进教育、商业、传媒等各个领域，引发了一场关于真实性与原创性的深刻讨论。老师们头疼如何辨别学生作业是否出自AI之手，消费者困惑广告文案背后是人类创意还是机器算法。尽管制定AI内容使用规则相对容易，但真正的挑战在于如何准确检测文本的来源。当前，无论是基于学习模型的检测工具、依赖统计信号的分析方法，还是寄望于水印技术，都面临各自的局限性与现实困境。在这场AI与人类智慧的博弈中，我们或许终将接受一个事实：完美的检测工具可能永远无法实现，而社会需要在技术进步与伦理规范之间找到新的平衡点。

　　如今，人们与机构正在努力应对AI生成文本带来的种种问题。老师们想知道学生的作业是否真正反映了他们自己的理解；消费者则好奇广告文案究竟出自人类之手还是机器之笔。

　　制定管理AI生成内容使用的规则相对容易，但执行这些规则却取决于一个棘手得多的难题：如何可靠地检测一段文本是否由人工智能生成。

　　一些研究已经探讨了人类能否识别AI生成的文本。例如，研究表明，那些频繁使用AI写作工具的人，往往能更准确地识别出AI生成的文本。在受控环境下，甚至人类评审团的表现能超越自动化检测工具。然而，这种专业能力并不普及，而且个人的判断也可能前后不一。因此，那些需要大规模、一致性判断的机构，便转向了自动化的AI文本检测器。

　　AI文本检测的难题

　　AI文本检测背后的基本流程描述起来很简单。首先，拿到一段你想追溯来源的文本。然后，运用一个检测工具——通常本身也是一个AI系统——来分析文本并生成一个分数（通常以概率形式表示），用以说明该文本由AI生成的可能性有多大。最后，利用这个分数来辅助后续决策，比如是否要对违规行为进行处罚。

　　然而，这个简单的描述掩盖了大量的复杂性。它忽略了许多需要明确的前提假设。你知道可能使用了哪些AI工具来生成这段文本吗？你对这些工具的访问权限如何？你能自己运行它们，还是能探查其内部工作机制？你手头有多少文本？是单一段落，还是长期收集的一系列作品？AI检测工具能告诉你什么、不能告诉你什么，关键取决于对这些问题的回答。

　　还有一个额外细节尤为重要：生成文本的AI系统是否故意嵌入了标记，以便日后更容易被检测？

　　这些标记被称为“水印”。带有水印的文本看起来与普通文本无异，但标记以微妙的方式嵌入，不经专门检查难以察觉。掌握正确密钥的人可以在后期检查这些标记是否存在，从而验证文本是否来自一个带有水印的AI生成源。不过，这种方法依赖于AI供应商的合作，并非总是可用。

　　AI文本检测工具如何工作

　　一个显而易见的方法是“以AI治AI”。思路很直接：首先收集一个大型语料库，即大量被标记为“人类撰写”或“AI生成”的文本样本，然后训练一个模型来区分两者。实际上，AI文本检测被当作一个标准的分类问题来处理，其思路类似于垃圾邮件过滤。训练完成后，检测器会检查新文本，并预测它更接近之前见过的AI生成样本还是人类撰写样本。

　　即使你对可能生成文本的AI工具知之甚少，这种基于学习的检测器方法也可能奏效。主要要求是训练语料库必须足够多样化，能涵盖各种AI系统的输出。

　　但是，如果你确实能够访问你所关心的那些AI工具，那么另一种方法就成为可能。这第二种策略不依赖于收集大量标记数据集或训练单独的检测器。相反，它寻找文本中的统计信号（通常与特定AI模型如何生成语言有关），以评估文本是否可能由AI生成。例如，一些方法会检查AI模型赋予一段文本的概率。如果模型对确切的词语序列赋予了异常高的概率，这可能是一个信号，表明该文本实际上就是由该模型生成的。

　　最后，对于由嵌入了水印的AI系统生成的文本，问题就从“检测”转向了“验证”。利用AI供应商提供的密钥，验证工具可以评估文本是否与由带水印系统生成的特征相符。这种方法依赖于无法仅从文本中获得的信息，而不是基于对文本本身的推断。

　　检测工具的局限性

　　每种工具都有其自身的局限性，很难说哪一种有绝对优势。例如，基于学习的检测器对新文本与其训练数据的相似度非常敏感。当文本与训练语料库差异很大时，其准确性就会下降，而随着新AI模型的发布，训练数据可能迅速过时。持续整理新数据并重新训练检测器成本高昂，且检测器不可避免地会落后于它们本应识别的系统。

　　统计测试则面临另一套限制。许多方法依赖于关于特定AI模型如何生成文本的假设，或者依赖于访问这些模型的概率分布。当模型是专有的、频繁更新的或者根本未知时，这些假设就不成立了。因此，在受控环境下运行良好的方法，在现实世界中可能变得不可靠或不适用。

　　水印技术将问题从检测转向验证，但它也引入了自身的依赖条件。它依赖于AI供应商的合作，并且仅适用于启用了水印功能生成的文本。

　　更广泛地说，AI文本检测是一场不断升级的“军备竞赛”的一部分。检测工具必须公开可用才能发挥作用，但这种透明度同时也为规避检测提供了可能。随着AI文本生成器的能力越来越强，规避技术也越来越复杂，检测器不太可能获得持久的优势。

　　残酷的现实

　　AI文本检测的问题说起来简单，但要可靠地解决却很难。那些制定了AI生成文本使用规则的机构，不能仅仅依赖检测工具来确保规则执行。

　　随着社会逐渐适应生成式AI，我们可能会完善关于AI生成文本可接受使用的规范，并改进检测技术。但最终，我们将不得不学会接受一个事实：这类工具永远无法做到完美无缺。

　　安布·特瓦里是密歇根大学统计学教授。

　　本文由路知网原创发布，未经许可，不得转载！

　　本文链接：https://m.yrowe.com/td/69732.html

• 【突发】美元汇率跌破1510，创17年新低；股市暴	• 【震惊！美国女子冒用亡母身份为特朗普投票，法
• 日本在8月报告中仍对关税的经济影响持谨慎态度	• 伊朗暂停与联合国核监督机构的合作
• 内塔尼亚胡的“大以色列”迷梦：一场危险的思想	• 通勤者欢迎连接大士与柔佛西南部的新捷运系统（