研究结果中显示,ChatGPT4o以26分的高分几乎达到了正常人类的认知水平,而Gemini 1的得分仅为16分,显然显示出较为严重的认知障碍。此外,所有模型在视觉空间和执行功能的任务(比如画钟和路径绘制)中都表现不佳,类似于人类认知障碍患者的表现。这一现象令人眉头紧锁,仿佛机器也有了“认知衰退”的可能。