OpenAI发布升级版AI推理模型o3-pro

【导语】当地时间6月10日，OpenAI震撼发布o3-pro人工智能模型，作为o3推理模型的升级版，o3-pro在物理、数学和编程等领域展现出卓越性能。在多项基准测试中超越顶尖竞品，包括在数学能力测试AIME 2024中优于谷歌Gemini 2.5 Pro，在科学测试GPQA Diamond中击败Anthropic的Claude 4 Opus。o3-pro支持多种工具功能，但响应速度较慢且不支持图像生成和Canvas功能。该(gāi)模(mó)型(xíng)将(jiāng)向(xiàng)ChatGPT Pro和(hé)Team订(dìng)阅(yuè)用(yòng)户(hù)开(kāi)放(fàng)，并(bìng)上(shàng)线(xiàn)开(kāi)发(fā)者(zhě)API平(píng)台(tái)。OpenAI CEO山(shān)姆(mǔ)·奥(ào)特(tè)曼(màn)展(zhǎn)望(wàng)技(jì)术(shù)奇(qí)点(diǎn)未(wèi)来(lái)，预(yù)言(yán)2030年(nián)代(dài)的(de)智(zhì)能(néng)突(tū)破(pò)将(jiāng)彻(chè)底(dǐ)改(gǎi)变(biàn)世(shì)界(jiè)。

当(dāng)地(de)时(shí)间(jiān)6月(yuè)10日(rì)，OpenAI正(zhèng)式(shì)推(tuī)出(chū)o3-pro人工智能模型，该模型是OpenAI今年初发布的o3推理模型的升级版。

与传统AI模型不同，推理模型可逐步推理解答问题，在物理、数学和编程等领域表现得更可靠。根据OpenAI的内部测试，o3-pro在主流人工智能基准测试中取得了亮眼成绩。在评估模型数学能力的AIME 2024测试中，o3-pro的表现优于谷歌顶级模型Gemini 2.5 Pro。在博士级水平的科学知识测试GPQA Diamond中，o3-pro也击败了Anthropic最新发布的Claude 4 Opus模型。

OpenAI CEO山姆·奥特曼表示，o3-pro很聪明，“第一次看到的时候，我不相信它相对于o3的胜率。”根据OpenAI的说法，o3-pro支持调用工具功能，可以搜索网络、分析文件、对视觉输入进行推理、使用Python、利用记忆库个性化回复等。但该模型也存在缺陷，响应速度通常慢于o1-pro。o3-pro不能生成图像，不支持OpenAI的人工智能工作空间功能Canvas。

自本周二起，o3-pro将向ChatGPT Pro和Team订阅用户开放，取代原有的o1-pro模型。o3-pro也将上线OpenAI开发者API平台。在API服务中，o3-pro的输入价格为每百万token 20美元，输出价格为每百万token 80美元。一百万输入token相当于75万个单词，篇幅略长于《战争与和平》。

奥特曼还在博客上发表了《温柔的奇点》一文，其中提到，在某种意义上，ChatGPT已比任何人类个体更强大，数亿人每天依赖它处理日益重要的任务。2025年，能执行真实认知工作的智能体已经诞生，编程领域永久改变。2026年或将出现自主发现新知的系统。2027年可能迎来能在现实世界中作业的机器人。难以置信的数字智能已融入生活，短暂惊诧后习以为常。例如震撼于AI生成的优美段落，开始期待完整小说；惊讶于它可以创建一个小的计算机程序，期待它什么时候可以创建一个完整的新公司。这就是技术奇点的轨迹。

奥特曼表示，OpenAI承载多重身份，但首先是超级智能研究机构。前路仍长，但光明已照亮大部分路径，黑暗区域正急速消退。“便宜到无法衡量的智能是唾手可得的。这听起来可能很疯狂，但如果我们在2020年告诉你，我们将成(chéng)为今天的样子，这可能听起来比我们目前对2030年的预测更疯狂。”他表示，21世纪30年代可能会与以往任何时候都大不相同。智能的突破边界尚不可知，但人(rén)类(lèi)将(jiāng)去(qù)探(tàn)索(suǒ)发(fā)现(xiàn)。