Gpt-5.5来了:四条指令就能写论文,教育该怎么办?

上周,OpenAI发布了GPT-5.5。宾夕法尼亚大学教授Ethan Mollick拿到早期访问权限后做了测试,结论让所有人坐不住:四个提示词,零人工修改,AI写出了一篇达到博士二年级水平的学术论文。
这不是噱头。Mollick的测试显示,GPT-5.5 Pro完成一个复杂的3D港口城市模拟程序——从公元前3000年建到公元3000年——只用了20分钟。而上一个版本GPT-5.4 Pro做同样的事需要33分钟。不只是快了,是质变了:只有GPT-5.5 Pro真正模拟了城镇的"演化",而不是简单地把建筑替换来替换去。
更值得注意的是"三驾马车"效应。Mollick反复强调,AI的能力不再只看模型本身,而是模型(Model)+应用(App)+工具链(Harness)的组合。GPT-5.5是好模型,Codex是好应用,新的图像生成能力是好工具。当三者叠加,效果不是1+1+1=3,而是指数级跃升。
Mollick还用GPT-5.5完成了一件他拖延了十年的事:把几百个众筹数据文件整理成一篇完整的学术论文。文献综述全部真实,统计方法相当复杂。他只需要给四个提示词。当然,作为领域专家,他认为AI提出的假设"不够有趣",因果关系仍有疑虑——但这是专家视角的批评,不是能力不足的批评。
对教育领域来说,这释放了一个极其明确的信号:AI能力还在加速,不是趋缓。去年还做不到的事,今年轻松完成。今年做不到的事,明年大概率也能做。
具体到教育场景,这意味着三件事。第一,作业评估体系必须升级。如果四个提示词就能产出博士水平的论文,传统论文写作评估已经形同虚设。第二,教学重心要从"产出结果"转向"判断质量"。Mollick能批评AI论文"假设不够有趣",是因为他是领域专家。学生如果没有这个判断力,就会被AI的表面完美所迷惑。第三,AI工具链的教育应用需要加速。不是简单的"用ChatGPT写作业",而是像Mollick那样,把AI当成研究伙伴,用它来处理繁琐工作,把精力集中在真正需要人类判断力的环节。
当然,AI的"锯齿前沿"依然存在。Mollick让GPT-5.5创作了一款101页的桌面角色扮演游戏,规则完整、插图精美,但叙事依然扁平——所有角色说话腔调一样,比喻堆砌到令人疲惫,还有莫名其妙的细节。AI的创作能力提高了,但创造力的边界仍然清晰。
这个边界,恰恰是教育最应该守护的地方。AI越来越擅长完成,但仍然不擅长选择。教学生做什么选择、为什么做这个选择——这件事的价值只会越来越高。
XuePilot.com | 派乐学伴





