9月14日,OpenAI发布了最新的预览模型o1,宣称其推理能力达到了理科博士生的水准。根据官方技术博客的说法,o1在推理能力上已经超越了现有的人工智能水平,并且还提供了多个有关OpenAI o1的演示视频。
其中一个演示是利用OpenAI o1来开发一个在线游戏,玩家需要控制一只考拉躲避不断增加的草莓,并在3秒内找到出现的松鼠。这个游戏要求较高的逻辑推理能力,因此更能考验OpenAI o1的实际应用能力。
官方表示,与现有的大模型如GPT-4等相比,OpenAI o1能够解决更为复杂和困难的推理问题,并改进了之前模型中存在的缺陷。例如,在解决编程问题时会更加条理清晰,并且在开始编写代码之前会全面思考整个回答过程后再进行输出。
然而,在经过实际测试后发现,尽管OpenAI o1展现出了强大的推理能力,但它仍然无法解决“9.11和9.8哪个大”的经典难题,这一结果受到了严重的限制。因为在解决这个问题时,之前的AI大模型集体失智情况经常发生,因此...
评论