我用 Gemini Deep Research “写了”篇论文,中文系的博士们给它打几分?

我用 Gemini Deep Research “写了”篇论文,中文系的博士们给它打几分?

引言生成式人工智能技术(GAI)的应用正在飞速普及,然而,这一工具却像是给学生打开了潘多拉魔盒。我周围不少高校老师都在抱怨,今年学生交上来的论文乍看之下质量变高了,但仔细阅读之后却发现这些文章存在不少知识性错误,充满了“ AI 味”。于是,不少高校开始要求学生在提交毕业论文时,AI 检测不能超过一定比例。

使用生成式人工智能软件生成的文字往往存在大量幻觉(AI Hallucinations),不仅内容不可靠,内涵也犹如白开水一般寡淡。2024年12月,Google Gemini 推出了新功能 Deep Research,该功能号称可以对某一主题进行整理并汇总成丰富的书面报告——似乎,我们有了更厉害的工具来抵抗幻觉和无趣。那么,这一新功能可以直接用来写学术论文么?

什么是 Gemini Deep Research?用Gemini自己的话说,Deep Research “是 Google Gemini 中的一项高级功能,旨在自动化和加速研究过程。它可以理解复杂的查询,自动从网络收集和分析信息,并生成结构全面、内容丰富的报告。这项功能就像一个高效的数字研究助理,能显著减少人工查找和整理资料的时间,目前是 Gemini Advanced(需订阅)的一部分”。

Gemini 介绍 Deep Research 功能从我的理解来看,Gemini Deep Research 吸收了 Google 做搜索时期的优势,其能够对不同网站进行汇总整理,并最终给出结构化、整合性的调研报告。Google 的服务器首先会对各大网站内容进行系统性的抓取和检索,然后自己“学习和理解”这些网站的内容,最后根据使用者的要求对特定信息进行摘取和梳理。那么 Gemini Deep Research 的结果可靠吗,更进一步来看,GAI 自动生成的论文是否具有一定价值呢?

这篇论文是如何被“创作”出来的?我要求 Gemini Deep Research 2.5 pro 以“AI 驱动下的国际中文教学研究”为主题进行创作,并特意提醒 Gemini 必须使用论文格式,具有学术性(风格模仿),只能引用中英论文(控制检索范围)。

论文生成指令在对57个网站进行整理分析后,Gemini 告诉我可以开始写论文了。

和所有具备“深度思考”的生成式人工智能系统一样,Gemini Deep Research 也在后台进行了非常细致的思考过程。这一过程大致分为“概念界定”、“信息搜集”和“发现问题”,并在此基础上形成论文。

Gemini Deep Research 2.5 pro 的大致思考流程经过对获取到的数据进行整理和分析,Google Gemini Deep Research 向我提交了论文全文。

Google Gemini Deep Research 生成的论文第一页中文系的博士们给了多少分?参照南京大学叶继元教授对学术“全评价”体系的维度,我邀请了五位中国语言文学系的博士同学对该研究进行简要评分。对该“论文”的评价共有三个项目,首先是“形式评价”,主要是指文本是否流畅自然、论述是否清晰;其次是“内容评价”,主要是讨论该论文是否能够满足科研需求;最后是“效用评价”,主要是讨论该论文的研究结果是否具有一定价值。各个单项的满分均为10分。

几位同学对论文进行了认真阅读并打分,最后三项结果的平均分分别是:形式评价 7分,内容评价 7.6分,效用评价 7.1分。看起来,由 Google Gemini Deep Research “撰写”的论文质量已经超过及格线。

那么,这是否预示着文科生再次失业了呢?

文科再次受到冲击?先不提生成文章的质量如何, Google Gemini Deep Research 在撰写论文过程中像是人一样进行了思考,这些思考的过程有时候要比生成的论文本身更有价值。事实上,我周围不少老师在新的教学改革中,也开始引导学生在科研中参考 Deepseek 的思考方式——人类不可能做任何事情都面面俱到,机器却能够通过大量的思维性学习对不同问题进行全方位的分析,尽管这些分析不见得都是对的,但是思辨的过程本身也具有一定的价值。我想,人类也没想到有一天要向机器请教思考的流程吧。

尽管最后论文拿到了及格分数,但是该论文仍旧有很多问题。严格来说,这篇论文无论是内容还是体例,都只能称得上是“报告”。几位同学都指出,这篇文章虽然可以称得上是值得一读的“文献综述”,但内容仍旧泛泛而谈,拼凑感强,较为“假大空”。同时,因为 Gemini Deep Research 只是形式上的总结,导致一些学术表达习惯上存在问题。例如“培养师资”这句话,使用“师资培养”这一专业词汇进行改写更为恰当。

生成的论文(部分)这两年 AI 技术的变化太快了,无论是教师还是学生都在错愕和震惊中学习。文科似乎经历了一次又一次的冲击,但是一味的禁止使用 GAI 并不能从根本上解决所有问题——知识的获取与书写正在逐渐发生根本性变革——教师的引导与判断在当下显得更加珍贵。

在论文写作中,我们应该抵制废话文学,文献综述的能力固然重要,但是一手经验和对于事物独特且有价值的深入分析更为重要。并且,高校也不应该过分看中“查重率”和“GAI 生成率”——毕竟我相信,总有一天机器可以以假乱真。我们真正应该做的是尝试接纳个性化、富有创意和具备扎实田野数据的论文表达。与此同时,文科教学也不能要求严格意义上的“正确”——哲学本身需要思辨,只有不断的、善意的多方商榷才能营造更好的学术空间。

结语不得不承认,本次调研的样本量过小,作为一个“临时起意”的小调查,也存在诸多分析流程上的不足。欢迎在这里下载原文,并给出你的评分。

🎭 相关推荐 🎭

剑灵主线任务一共多少幕
谁有365体育投注网址

剑灵主线任务一共多少幕

📅 08-17 👀 9745
辭典檢視
365bet游戏网站

辭典檢視

📅 08-17 👀 7394
老题新解,欧洲杯含金量是不是比世界杯含金量更高