Loading...

AI 席卷校园:百万条对话揭秘“Claude 是代码救星还是作弊工具”

AI 技术已经深入到编程和写作的各个方面!针对数百万条学生对话的研究表明,AI 可以调试代码、修改文章、甚至生成学习材料。但在这一切背后,学术诚信的界限又该如何划定呢?

如今,AI 不再局限于研究工具,它已经成为大学生学习过程中的得力助手。

随着 AI 越来越广泛地纳入教育体系,我们需要审视一系列与学习、评估以及技能培养相关的重要问题。

迄今为止,大部分讨论主要依赖于调查和实验,缺乏学生在真实学习环境中自然使用 AI 的直接证据。

为了填补这一空白,Anthropic 开展了一项针对高等教育中 AI 实际应用的大规模研究,分析了 Claude.ai 平台上百万条匿名学生对话记录。

AI 席卷校园:百万条对话揭秘“Claude 是代码救星还是作弊工具”

报告的主要结论包括:

  • 理工科学生是 Claude 等 AI 工具的早期采用者,尤以计算机专业为甚。虽然计算机专业仅占美国学位的 5.4%,但在 Claude.ai 的对话中,该专业学生的比例高达 36.8%。相比之下,商科、健康科学和人文学科的学生使用率相对较低。

  • 总结了学生与 AI 互动的四种模式,每种模式在数据中的占比大致相当(分别占对话总数的 23%至29%),分别是直接解决问题、直接生成内容、协作解决问题以及协作生成内容。

  • 学生使用 AI 主要目的在于创造新知识和进行分析,如创建编程项目或分析法律概念。这样的使用符合布鲁姆分类法中的高阶认知功能,但也引发了人们的担忧:如何避免学生过度依赖 AI,而忽视自身关键认知能力的锻炼呢?

教育领域的 AI 使用现状

在研究人们如何使用 AI 模型时,保护用户隐私成为首要任务。

Claude Insights and Observations(简称 Clio)是一款自动分析工具,旨在帮助了解人们使用 Claude 的具体情况。

Clio 能够深入挖掘用户与 Claude 的对话内容,将其提炼为诸如「调试代码」「解释经济概念」等高层次总结,从而揭示 AI 的使用模式。

本研究中,Clio 分析了来自 Claude.ai 的免费和付费账户所产生的约 100 万条匿名对话。

随后,研究团队筛选出与学生学习紧密相关的对话,如课程作业和学术研究,最终得到 574,740 条有效对话。

接着,Clio 对这些对话进行分类汇总,得出有价值的洞见,包括不同学科对话的占比、学生与 AI 交互方式的差异,以及学生交给 AI 完成的任务类型等。

学生用 AI 做了什么?

研究发现,学生使用 Claude 的主要目的是跨学科地创建和优化教育内容,这类对话的占比达到了 39.3%。

具体来说,涉及设计练习题、润色论文、总结学术资料等。

33.5% 的对话涉及让 Claude 为作业提供技术解答,如帮助学生调试代码、修复编程错误、实现算法和数据结构,或解答数学难题。

其中某些行为可能存在作弊嫌疑,后面会对此进行详细讨论。

此外,还有一部分学生用于数据分析和可视化(11.0%)、辅助研究设计和工具开发(6.5%)、绘制技术图表(3.2%),以及进行翻译和校对(2.4%)。

下图展示了各学科常见请求的详细分类。

AI 席卷校园:百万条对话揭秘“Claude 是代码救星还是作弊工具”

各学科的 AI 使用情况

通过对比 Claude.ai 的使用模式与美国各学科授予学士学位的数量,发现计算机专业使用 Claude 的比例非常高。

尽管计算机专业在学士学位中仅占 5.4%,但在 Claude.ai 的对话中占比达 38.6%。这很可能归因于 Claude 在编程方面的独特优势。

自然科学和数学专业在 Claude.ai 的使用占比,也超过这两个专业学生人数的占比(分别为 15.2% 和 9.2%)。

理工科学生,尤其是计算机专业的学生,可能更早将 Claude 用于学习。

这可能是因为计算机学生对 Claude 更加熟悉,同时 AI 系统在处理科学、技术、工程和数学任务时表现得更为优越。

商科相关的对话在 Claude.ai 上仅占 8.9%,而商科学位在美国学士学位中占比高达 18.6%,这表明 Claude 在商科领域的使用率较低。

AI 席卷校园:百万条对话揭秘“Claude 是代码救星还是作弊工具”

学生与 AI 的互动方式

在分析学生与 AI 的交互时,研究识别出了四种不同的交互模式,并根据两个不同的维度进行分类,具体如下图所示。

AI 席卷校园:百万条对话揭秘“Claude 是代码救星还是作弊工具”

第一个维度是「交互模式」,包括:

(1)直接对话,即用户期望及时获得问题的答案,以解决自身疑惑。

(2)协作对话,即用户主动与模型互动,通过对话实现自身目标。

第二个维度是交互的「期望结果」,分为:

(1)解决问题,指用户寻求问题的解决方案或解释。

(2)生成输出,意味着用户希望生成类似演示文稿或论文这样的较长内容。

这四种交互在对话中的占比相对接近(均在 23% 至 29% 之间),显示出学生多样化使用 AI 的趋势。

传统的网络搜索往往只能返回直接答案,而 AI 则支持更丰富的交互方式,为教育提供了新的机会。

以下是一些学习中的实际应用案例:

  • 阐释哲学概念与理论,帮助学生理解其内涵。

  • 构建全面的化学学习资料,支持化学知识的学习。

  • 为作业讲解肌肉的解剖结构及其生理功能。

与此同时,AI 也带来了新的挑战。

一个备受关注的问题是:「学生在多大程度上使用 AI 来作弊?」

这个问题难以回答,因为无法明确 Claude 的具体回应在特定学习环境中的实际应用。

例如,「直接解决问题」的对话,既可能代表学生在家考试中作弊,也可能仅是在核对练习题答案。

「直接生成内容」的对话,可能是学生希望直接生成论文,也可能只是为了总结额外的知识要点。

至于协作对话是否属于作弊,主要取决于具体课程的要求。

实际上,近一半(约 47%)的学生与 AI 的对话属于直接对话,通常涉及他们主动寻求答案或内容。

虽然许多对话是为了合理学习目标(如询问概念性问题、生成学习指南),但也发现了一些令人担忧的情况:

  • 请 AI 提供机器学习选择题答案。

  • 直接获得英语测试的答案。

  • 借助 AI 修改营销和商业文本,以规避抄袭检测。

这些现象引发了关于学术诚信、批判性思维能力培养和如何有效评估学生学习成果的讨论。

即使是协作对话,学习成果也可能存在争议。

例如,「求解概率和统计作业的问题并提供解释」虽然涉及学生与 AI 多次交流,但大部分思考过程由 AI 完成。

Anthropic 将持续关注这些互动,努力甄别哪些行为真正有助于学习和批判性思维的培养。

特定学科的 AI 使用模式

不同学科的学生与 AI 的互动方式存在差异。

在自然科学与数学领域,学生的对话主要集中在解决问题,常见内容如「逐步计算特定概率问题」或「为学术作业或考试题目提供详细解答」。

计算机科学、工程以及自然科学与数学专业的学生,更倾向于采用协作对话。而在人文、商业及健康领域,学生在协作对话与直接对话之间的选择较为均衡。

在教育领域的对话中,生成输出的需求最为显著,占比达到 74.4%。但这可能反映了筛选方法的局限。

这表明,为不同学科制定专门的 AI 教育策略,或许能够取得更好的效果。

AI 席卷校园:百万条对话揭秘“Claude 是代码救星还是作弊工具”

学生交给 AI 的认知任务

研究团队还研究了学生交给 AI 的认知任务。

研究采用了布鲁姆分类法,这是一种用于教育领域的框架,将认知过程从简单到复杂进行分类。

尽管该框架最初是为学生思维设计的,但经过调整后,适用于分析 Claude 与学生对话时的回应。

研究结果显示,Claude 主要承担高阶认知功能,创造(39.8%)和分析(30.2%)是最常见的操作。

低阶认知任务的占比较低,应用(10.9%)、理解(10.0%)和记忆(1.8%)。

AI 席卷校园:百万条对话揭秘“Claude 是代码救星还是作弊工具”

生成学术文本摘要、撰写论文反馈等相关生成任务,更多涉及创造。而求解微积分问题、解释编程基础知识等任务,则多运用分析能力。

尽管 AI 具备这些能力,但这并不意味着学生不能独立使用这些技能。

例如,学生可以与 AI 共同完成项目,或在其他场合借助 AI 生成的代码分析数据集。

然而,这确实引发了人们的担忧,学生会否过度依赖 AI,从而影响自身认知能力的发展。

毕竟,如果基础技能得不到锻炼,就如同建造金字塔的倒金字塔结构,难以稳固支撑高阶思维的发展。

参考资料:

  • https://www.anthropic.com/news/anthropic-education-report-how-university-students-use-claude

  • https://x.com/AnthropicAI/status/1909626720476365171

本文来自微信公众号:新智元(ID:AI_era)

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...