![]()
朱自清的散文《荷塘月色》被AI检测工具判定疑似生成率超60%,相关话题迅速引发热议。这场检测乌龙,让不少大学生感慨,自身毕业论文AI检测率偏高已然见怪不怪。今年毕业季,本科毕业论文的AIGC(人工智能生成内容)监测,成为不少学生需要应对的新考验。
针对此次AI论文监测的争议,业内专家解读:所谓AI生成率,是指文本由人工智能创作的概率,并非指文本中AI生成内容的实际占比。从技术层面而言,当下人工智能模型尚无法精准分辨文字的原创内核,不同大模型的监测维度各有差异,部分侧重语义逻辑,部分偏重词汇频次。技术标准缺失、检测原理模糊、结果互斥性强,导致同一篇文本在不同平台会出现截然不同的检测结果,甚至催生了学生借助AI修改AI生成文章的荒诞现象,还让花钱“去除AI写作痕迹”成了一门灰色生意。
AI监测技术的应用,是教育领域应对数字化变革的主动探索,对遏制学术造假、规范学术风气具有积极意义,但其技术不成熟、标准不统一、阈值随意设定的短板也客观存在。评判的偏差并非新技术的独有困境,文本评判的标准失衡,自古便是治学难题。《聊斋志异》中的《司文郎》记叙:两位赶考学子将所作文章交由一位盲僧品鉴优劣,结果盲僧不看文字,只以焚烧文稿、闻辨灰烬气味的方式评判文章水准,两人的文章,一篇气韵清雅被定为佳作,一篇气息污浊被判落榜。可最终科举放榜的结果,却与盲僧评判结果截然相反。
以气味评判文章优劣,是蒲松龄的艺术夸张,更是对古代科场评判不公、标准失衡的反讽。海量文本的优劣评判,历来是学术领域的难题。而今依托算法判定文字原创性与优劣,同样也有值得商榷之处。如今的大模型仅能识别字符组合、词频规律与句式结构,无法感知写作底蕴、情感温度与思想脉络,将纯粹的字符数据作为原创评判唯一依据,缺乏学理支撑与伦理正当性。
当下AI对教育领域的渗透愈发深入,学术乱象也随之滋生。不少大学生直接使用AI生成结课论文,部分研究生借助AI伪造调研数据、制作实验图表、撰写毕业论文正文。有一线教师发声感慨,越来越多学生依赖AI完成作业,消解了自主思考的学习价值。为遏制这类学术乱象,AI监测技术应运而生。但技术只能识别“形式相似”,无法判断“思想原创”;只能筛查“文本重复”,不能界定“学术不端”。虽然技术算法还有待完善,但归根结底,无论是AI辅助写作,还是AI筛查检测,人工智能始终只是服务人的辅助工具,不能成为评判文本、裁定学术成果的最终标尺。过去的学术抄袭多为复制粘贴,如今则演变为AI生成,学生的应对手段也从手动降重变成依赖各类AI工具。从这个角度而言,AI时代更需呼唤的是学术的原创自觉与学术深度自信。
技术的本质是为人赋能、辅助实践,充当不了公正的审判者。单纯依靠AI生成率数据评判文章优劣,容易束缚学术创作的多元性与创新性,僵化学术评价体系。AI时代下,学术科研、教育教学的模式与标准都在与时俱进、迭代更新,但时代的变革仍需守正,不能让数据成为评判文本的唯一标准,让学术尊严沦为功利主义的附庸。教育评价应回“过程性考核”与“成果真实性”并重,而非单一依赖检测数值。
《司文郎》的结局耐人寻味,引荐盲僧的书生成为了执掌文运的“司文郎”。古人面对失衡的科考评判归于虚无的文运。无论古代科场还是当代学术,机械化、单一化的评判标准,终将偏离育人、治学的初心,人文思辨与思想深度,永远是文字评判的核心标尺。算法可以修饰文字的句式章法、规整文本的外在形式,却无法丈量思想的深度。文有章法,更有德行,能否让论文和学术回归“求真、求实、求新”的育人本质,才是永恒不变的评判标准。





京公网安备 11011402013531号