AI代写论文现象如何科学治理(2)

光山新闻网采集侠 2024-01-18 10:34:01

浏览

“针对某个问题，提出方法来解决，并通过实验来证明方法的可行性——这是专业论文的常用模式。人工智能不能做实验，哪怕它给的实验数据再理想，也都是虚假的。”温睿认为，虚假的数据背离了科学研究的真正意义。

除了数据处理，更多人使用AIGC来解释概念。温睿发现AIGC生成的概念简洁明了，查重率也非常低。但当记者询问这些概念是否正确时，温睿显得有些迟疑：“我也没有把握，通常默认它是对的。”

为了验证AIGC给出答案的准确性，记者就一些新兴概念提问，但它给出的答案往往和真正概念毫不沾边。当记者让AI生成5篇某领域的重点参考文献，它又胡编乱造了5个不存在的作者和不存在的文献。

在人工智能领域，描述AI“一本正经地胡说八道”的专业名词是“AI幻觉”。哈尔滨工业大学（深圳）特聘校长助理、教授张民解释，AI幻觉是指AI会生成貌似合理连贯，但与输入问题意图不一致、与现实或已知数据不符合或无法验证的内容。这多是由于AI对知识的记忆不足、理解能力不够、训练方式固有的弊端及模型本身技术的局限性所导致。

“如果不警惕AI幻觉，很有可能损害科学研究的真实性和客观性。”梁正表示，AI生成的错误信息一旦被广泛传播，不仅会造成“学术垃圾”泛滥，还将影响学术生态的良性发展。

一场你追我逃的“猫鼠游戏”

一项新技术的出现，对于社会的发展往往是把双刃剑。虽然人工智能技术存在种种隐患，但其在图文创作、数据处理等方面的强大能力已被大多数人认可。“归根结底，我们认为AI将增加人类的智慧，而非取代人类。其使用应在人类监督之下，并将道德因素考虑在内。”施普林格·自然集团发言人说。

推动AI向善发展，需要借助行之有效的技术手段。值得注意的是，AI生成的论文并不能被查重工具检测出来。因此，国内外都在探索研发专门针对AIGC的检测工具。

从原理看，AIGC检测技术是在“用AI打败AI”。同方知网数字出版技术股份有限公司副总经理柯春晓介绍：“人类的创作往往是随机且富有灵感的，而接受过大量文本训练的AI已经形成了生产文本的‘固有’范式，倾向于使用‘一致’的结构和规则，因此具有更高的可预测性。”AIGC检测的核心就是依托海量的文本和数据样本，识别出人类和AIGC工具在平均句子长度、词汇多样性和文本长度等方面的不同点，从而揪出AI论文“枪手”。

一些期刊出版机构通过检测工具发现了AIGC代写论文的痕迹。“从去年7月底到现在，我们发现涉嫌AI写作的论文数据每个月都在上升，大约有六七十篇的文章疑似使用AI的程度超过了50%。”《中华医学杂志》社有限责任公司新媒体部主任沈锡宾介绍。

沈锡宾向记者展示了检测过程：一篇论文经过检测系统后，会显示疑似AI生成占全文比重，相关疑似段落也会被标红。但记者注意到，和传统的查重报告单明确标注重复痕迹不同，AIGC检测报告单只是指出某些文本AIGC的“置信度”，并不能回答为什么是这个值。

“这使得报告单往往只起到参考和警示作用。”柯春晓说。

目前，人工智能大模型正在以“周”为单位进行迭代升级。如何适应不断升级的技术，是摆在AIGC检测工具面前的一道必答题。

科技频道

AI代写论文现象如何科学治理(2)

相关阅读

推荐文章

主编推荐

大家在读