
OpenAI近日推出了两个新AI模型o3和o4-mini,这些模型能够在推理过程中“以图像思考。这标志着视觉感知的重大进步,使它们能够在分析过程中操作图像,包括裁剪、缩放和旋转。 与之前的模型不同,o3和o4-mini能够智能地利用ChatGPT的所有工具,包括网页搜索、Python代码执行和图像生成,允许它们根据任务选择合适的工具,解决多面向的问题。这些模型在多个领域设立了新的性能基准。 在视觉任务方面,o3在MathVista上取得了86.8%的准确率,在CharXiv-Reasoning上为78.6%;而o4-mini在AIME 2024竞赛中得分91.6%。在专家评估中,o3在复杂现实任务中相比前任减少了20%的重大错误。 ChatGPT Plus、Pro和Team用户从今天起将在模型选择器中看到o3、o4-mini及o4-mini-high,替代之前的o1、o3'mini和o3'mini'high。