当ai能写出博士论文,却写不好一篇小说

GPT-5.5来了。Ethan Mollick用它干了件事:给AI一堆放了十年的研究数据,让它"整理数据、提出假设、用高级统计方法检验、写一篇学术论文"。四个提示词,没动过一个字。结果呢?论文的文献综述是真的,统计方法很复杂,逻辑也能自洽——相当于一个博士二年级学生的水平。
听起来很吓人?别急,同一篇文章里还有另一个故事:Mollick让AI设计一款全新的桌面角色扮演游戏,规则、世界观、配图、排版,一气呵成,101页的PDF相当漂亮。但仔细读内容,问题就暴露了:每个角色说话的腔调都一样;比喻华丽但空洞;"天气和建筑是同一个论点在不同速度下的表达"——这种句子堆多了,读着累。
这就是AI的"锯齿形边界":一边是接近专业水平的能力,一边是明显的短板。它们不是"聪明"或"笨"的二元问题,而是"某些事做得比人类还好,某些事还在犯低级错误"的不均匀分布。
这个发现,对教育意味着什么?
第一,学生需要学会"识坑"。
AI能写出看起来很专业的论文,但"看起来专业"和"真正有价值"是两回事。Mollick的论文统计方法很复杂,但假设不够有趣,因果推断也有问题。这种"表面光鲜、内核薄弱"的输出,正是学生需要学会识别的陷阱。未来的教育,应该教孩子问:这篇文章的结论是不是只是"技术性正确"?论证过程有没有用复杂术语掩盖逻辑漏洞?
第二,评价方式需要改变。
如果一篇论文可以用四个提示词生成,那"写论文"这件事本身已经不足以证明学习能力。教育者需要设计更能考察深度理解的任务:让学生评价AI输出的质量,找出其中的问题;让学生基于AI生成的草稿,提出更有价值的假设;让学生解释"为什么这个统计方法虽然复杂,但结论依然存疑"。
第三,学生的"人味儿"会变得更重要。
AI写得出的,是人类不需要再花时间打磨的;AI写不出的,恰恰是人类需要深耕的领域。那个桌面游戏的故事告诉我们:AI能生成规则和配图,但"让角色有自己的声音"、"让比喻有真正的内容",这些事情它还做不到。未来,有独特表达风格、能创作有情感深度的作品,会成为人的核心价值。
第四,"用AI"本身就是一种能力。
Mollick的论文不是AI独立完成的,而是"他给提示词→AI生成→他用GPT-5.5 Pro审阅→反馈给AI修改"的迭代过程。这种"人类判断+AI执行"的协作模式,本身就是一种需要培养的技能。学生不仅要学会"让AI做事",还要学会"判断AI做得好不好"、"知道如何改进AI的输出"。
AI的锯齿形边界,正在重新定义什么是"值得学的东西"。那些AI已经做得很好的事,人类不需要再花大量时间训练;那些AI还做不好的事,恰恰是人类应该深耕的方向。教育的任务,不是让学生跑赢AI,而是让学生学会与AI协作,做AI做不到的事。
XuePilot.com | 派乐学伴





