官方网站-首页官方网站-首页

首页 新闻资讯 OpenAI发布升级版AI推理模型o3-pro
OpenAI发布升级版AI推理模型o3-pro
发布日期:2025-06-12 07:30:33

【导语】当地时间6月10日,OpenAI震撼发布o3-pro人工智能模型,作为o3推理模型的升级版,o3-pro在物理、数学和编程等领域展现出卓越性能。在多项基准测试中超越顶尖竞品,包括在数学能力测试AIME 2024中优于谷歌Gemini 2.5 Pro,在科学测试GPQA Diamond中击败Anthropic的Claude 4 Opus。o3-pro支持多种工具功能,但响应速度较慢且不支持图像生成和Canvas功能。该(gāi)模(mó)型(xíng)将(jiāng)向(xiàng)ChatGPT Pro和(hé)Team订(dìng)阅(yuè)用(yòng)户(hù)开(kāi)放(fàng),并(bìng)上(shàng)线(xiàn)开(kāi)发(fā)者(zhě)API平(píng)台(tái)。OpenAI CEO山(shān)姆(mǔ)·奥(ào)特(tè)曼(màn)展(zhǎn)望(wàng)技(jì)术(shù)奇(qí)点(diǎn)未(wèi)来(lái),预(yù)言(yán)2030年(nián)代(dài)的(de)智(zhì)能(néng)突(tū)破(pò)将(jiāng)彻(chè)底(dǐ)改(gǎi)变(biàn)世(shì)界(jiè)。

OpenAI发布升级版AI推理模型o3-pro

当(dāng)地(de)时(shí)间(jiān)6月(yuè)10日(rì),OpenAI正(zhèng)式(shì)推(tuī)出(chū)o3-pro人工智能模型,该模型是OpenAI今年初发布的o3推理模型的升级版。

与传统AI模型不同,推理模型可逐步推理解答问题,在物理、数学和编程等领域表现得更可靠。根据OpenAI的内部测试,o3-pro在主流人工智能基准测试中取得了亮眼成绩。在评估模型数学能力的AIME 2024测试中,o3-pro的表现优于谷歌顶级模型Gemini 2.5 Pro。在博士级水平的科学知识测试GPQA Diamond中,o3-pro也击败了Anthropic最新发布的Claude 4 Opus模型。

OpenAI CEO山姆·奥特曼表示,o3-pro很聪明,“第一次看到的时候,我不相信它相对于o3的胜率。”根据OpenAI的说法,o3-pro支持调用工具功能,可以搜索网络、分析文件、对视觉输入进行推理、使用Python、利用记忆库个性化回复等。但该模型也存在缺陷,响应速度通常慢于o1-pro。o3-pro不能生成图像,不支持OpenAI的人工智能工作空间功能Canvas。

自本周二起,o3-pro将向ChatGPT Pro和Team订阅用户开放,取代原有的o1-pro模型。o3-pro也将上线OpenAI开发者API平台。在API服务中,o3-pro的输入价格为每百万token 20美元,输出价格为每百万token 80美元。一百万输入token相当于75万个单词,篇幅略长于《战争与和平》。

奥特曼还在博客上发表了《温柔的奇点》一文,其中提到,在某种意义上,ChatGPT已比任何人类个体更强大,数亿人每天依赖它处理日益重要的任务。2025年,能执行真实认知工作的智能体已经诞生,编程领域永久改变。2026年或将出现自主发现新知的系统。2027年可能迎来能在现实世界中作业的机器人。难以置信的数字智能已融入生活,短暂惊诧后习以为常。例如震撼于AI生成的优美段落,开始期待完整小说;惊讶于它可以创建一个小的计算机程序,期待它什么时候可以创建一个完整的新公司。这就是技术奇点的轨迹。

奥特曼表示,OpenAI承载多重身份,但首先是超级智能研究机构。前路仍长,但光明已照亮大部分路径,黑暗区域正急速消退。“便宜到无法衡量的智能是唾手可得的。这听起来可能很疯狂,但如果我们在2020年告诉你,我们将成(chéng)为今天的样子,这可能听起来比我们目前对2030年的预测更疯狂。”他表示,21世纪30年代可能会与以往任何时候都大不相同。智能的突破边界尚不可知,但人(rén)类(lèi)将(jiāng)去(qù)探(tàn)索(suǒ)发(fā)现(xiàn)。

上一篇 查看列表 下一篇