教育工作者希望获得一种工具,用于检测学生是否使用人工智能程序代写作业。甚至还有专供教师使用的程序,据称能识别学生是否通过使用人工智能"作弊"。
人工智能生成的文本常见特征包括:
- 奇怪的千篇一律或重复性写作。AI模型是在海量文本数据集上训练的,因此它们可能会简单重复之前见过的内容。这可能导致奇怪的千篇一律或重复性写作。
- 事实性错误。人工智能模型并非总是准确无误,因此它们在生成文本时可能会出现事实性错误。
- 缺乏创造力或原创性。人工智能模型不像人类那样富有创造力或原创性,因此其写作可能缺乏这些特质。
- 不自然的词序或句式结构。AI模型未必能完全理解人类语言的微妙之处,因此其生成的文本可能出现不自然的词序或句式结构。
为帮助教育工作者识别学生使用人工智能的情况,OpenAI训练了一款工具(AI文本分类器),能够区分人类撰写的文本与来自不同供应商的人工智能生成的文本。
然而,OpenAI认定其分类器 不可靠。在内部测试中,该分类器仅能正确识别26%的人工智能文本(真实阳性)为"可能由人工智能生成",同时错误地将9%的人类文本标记为人工智能生成(虚假阳性)。
其他公司和网站也宣称拥有AI检测工具。其中包括GPTZero和Copyleaks AI内容检测器。根据我的评测,Copyleaks表现最为出色,但并非完美无缺,同样会出现误判。
人工智能存在局限性或许不足为奇……包括无法准确识别人工智能生成的内容。
ChatGPT开发者OpenAI上周悄然下线了其AI检测工具AI Classifier,该公司表示这是因为该工具"准确率较低"。
查看引用文章