号称博士生水准！OpenAI最新模型仍分不出9.11和9.8哪个大

一便士的月亮

原创

09-14

9月14日，OpenAI发布了最新的预览模型o1，宣称其推理能力达到了理科博士生的水准。根据官方技术博客的说法，o1在推理能力上已经超越了现有的人工智能水平，并且还提供了多个有关OpenAI o1的演示视频。

其中一个演示是利用OpenAI o1来开发一个在线游戏，玩家需要控制一只考拉躲避不断增加的草莓，并在3秒内找到出现的松鼠。这个游戏要求较高的逻辑推理能力，因此更能考验OpenAI o1的实际应用能力。

官方表示，与现有的大模型如GPT-4等相比，OpenAI o1能够解决更为复杂和困难的推理问题，并改进了之前模型中存在的缺陷。例如，在解决编程问题时会更加条理清晰，并且在开始编写代码之前会全面思考整个回答过程后再进行输出。

然而，在经过实际测试后发现，尽管OpenAI o1展现出了强大的推理能力，但它仍然无法解决“9.11和9.8哪个大”的经典难题，这一结果受到了严重的限制。因为在解决这个问题时，之前的AI大模型集体失智情况经常发生，因此...

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X200 Pro(12GB/256GB)

vivo X200 Pro(12GB/256GB)

9人评分

89%好评

vivo X100 Ultra(12GB/256GB)

vivo X100 Ultra(12GB/256GB)

4676人评分

80%好评

HUAWEI Mate 60（12GB/256GB）

HUAWEI Mate 60（12GB/256GB）

2672人评分

78%好评

iQOO Z9 Turbo+(12GB/256GB)

iQOO Z9 Turbo+(12GB/256GB)

2人评分

80%好评

Redmi K70至尊版(12GB/256GB)

Redmi K70至尊版(12GB/256GB)

393人评分

79%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具