ARC AGI: GPT-5略好于o3, 但成本降低90%

GPT-5是一种成本策略模型。它能以很低的价格构建出略好一些的模型。ARCAGI1证明了这一点。GPT-5high比o3-pro好10%左右,但成本却低90%

ARCAGI2上

GPT-5相对o3好52.3%,而且便宜12.5%。

GPT-5性能更高,并且每点ARCAGI2比o3便宜42.5%

所以这解释了Sam提供每周3000次的GPT-5thinking?毕竟成本降低了很多

问题是实际使用中GPT-5真的比o3好吗?大家怎么看?