OpenAI 与谷歌 AI 闪耀 ICPC 2025,登顶金牌榜
在计算机程序设计领域享有 “奥林匹克” 盛誉的国际大学生程序设计竞赛(ICPC),今年迎来了两位特殊选手 ——OpenAI 的 GPT-5 和 Google DeepMind 的 Gemini 2.5 DeepThink,它们的出色发挥,改写了赛事格局。
ICPC 堪称全球最顶尖的大学生编程赛事,自 20 世纪 70 年代起,便吸引着全球高校算法天才同场竞技。今年总决赛,来自 103 个国家、139 所高校的战队齐聚,在 5 小时内挑战解答 12 道算法题,解题数和用时共同决定排名。这些题目涉及图论、数论、动态规划等前沿算法知识,对选手编码速度、数学功底及团队协作能力要求极高,每年斩获金牌的队伍,后续大多成为全球科技公司的技术中流砥柱。
在本次赛事中,GPT-5 和 Gemini 2.5 DeepThink 虽未与学生团队现场同场较量,但表现堪称惊艳。GPT-5 一路 “过关斩将”,12 道题全部解出,拿下满分,相当于 “金牌” 水准;Gemini 2.5 DeepThink 也毫不逊色,在 677 分钟内成功解出 12 题中的 10 题,同样达到金牌级别,按谷歌的说法,这一成绩放在人类排名中能位居全球第二。要知道,今年人类金牌队伍来自圣彼得堡国立大学、东京大学、北京交通大学和清华大学等顶尖学府,可即便是他们,也没有一支队伍做到全对,最好成绩仅为 11/12。也就是说,AI 首次在这类算法竞赛中实现对人类的超越。
OpenAI 官方透露,GPT-5 参赛时,既未针对 ICPC 进行专门训练,也没有借助任何 “外挂” 工具。它如同人类队伍一样,拿到相同 PDF 赛题,通过官方判题系统提交答案,并在 5 小时内完成全部解答。结果令人惊叹,11 道题一次提交便顺利通过,唯一一道难题在第 9 次提交时成功攻克,最终实现 12/12 满分的优异成绩,这在 ICPC 历史上都极为罕见。OpenAI 在 X 平台自豪分享:“我们的 GPT-5 在 ICPC 的 AI 赛道正式参赛,同样 5 小时解 12 题,答案由 ICPC 评测系统实时判定。12 道题里 11 道一次提交即通过,最难的一题在第 9 次提交时解出,而最好的人类队伍只解出 11 道。”
谷歌 DeepMind 的 Gemini 2.5 DeepThink 也毫不示弱,比赛开始后迅速崭露头角,45 分钟内就成功解出 8 题,3 小时内答对 10 题。更令人震撼的是,比赛前半小时,它就解决了 “问题 C”,而这道题所有大学队伍都未能解出。“问题 C” 要求在由多个水库和管道构成的复杂网络中,找到一种管道开关配置,让所有水库能在最短时间内注满水。由于每条管道开关状态多样,组合近乎无限,导致搜索最优解困难重重。Gemini 2.5 DeepThink 巧妙解题,先为每个水库设定 “优先级值”,基于此通过动态规划找到管道最优配置,再运用极小化极大定理转化问题,最后在凸优化空间利用嵌套三分搜索快速收敛到最优解。谷歌在博客中强调,这不仅是正确解答,更是一次 “创造性突破”。
长久以来,大模型在各类考试、基准测试中屡创佳绩,像 ChatGPT、Gemini 等大语言模型(LLM)在 SAT、律师资格考试、托福等人类考试中频繁取得高分,今年 7 月 Gemini 在国际数学奥林匹克(IMO)中斩获金牌,在各类自然语言处理(NLP)、逻辑推理基准测试里也频频 “刷榜”。但 ICPC 这类现场算法竞赛截然不同,题目新颖,几乎不会出现在训练语料中,还需综合运用数学建模、推理及代码实现,最重要的是必须在有限时间内找到解法,而非离线慢慢思考。此次 GPT-5 与 Gemini 2.5 DeepThink 在 ICPC 的出色表现,有力证明它们已具备临场推理、抽象建模以及创造性解题能力,相较于在标准化考试中取得高分,这一成果更具说服力,预示着 AI 在算法编程领域迈向新高度,未来或许将深度改变软件开发模式,成为程序员真正的得力助手 。
版权声明:本站部分内容素材由第三方供稿或网络公开信息整理,若其中内容有误或不慎侵犯了您的权益,请向我们提供确切的证明,以便我们进行核实处理。本站所展示的内容仅供参考并不构成任何投资建议,感谢您的关注和对我们的支持!
转载请注明出处:https://www.euobiz.cn/tech/openai-google-gemini-won-champion-2025.html