谷歌发布全新推理 AI 模型 Gemini 2.5和Gemini 2.5 Pro实验版

新模型的发布

近日,谷歌在开发者平台 Google AI Studio 及 Gemini 应用程序上发布了其最新的人工智能推理模型——Gemini 2.5。此模型具备停下来“思考”的能力,标志着人工智能技术的新进步。谷歌还推出了 Gemini 2.5 Pro Experimental,这款多模式推理 AI 模型被认为是截至目前最智能的。

Gemini 2.5的强大性能

Gemini 2.5的发布是谷歌针对每月20美元的 Gemini Advanced 订阅者的一项新服务,用户可以体验到其强大的推理能力

QQ_1742953421808.png

竞争格局与推理技术发展

自从2024年9月 OpenAI 发布首个 AI 推理模型以来,各大科技公司如 Anthropic、DeepSeek、谷歌和 xAI 等纷纷推出了各自的推理模型,以期在智能化水平上相互竞争。推理技术的应用使得这些模型在数学和编程任务上表现得更加出色,推动了人工智能的进一步发展。

Gemini 2.5 Pro的基准测试表现

谷歌声称,Gemini 2.5 Pro 在多个基准测试中超越了其之前的 AI 模型及一些领先竞争对手。例如,在名为 Aider Polyglot 的代码编辑评估中,Gemini 2.5 Pro 获得了68.6%的高分,超过了 OpenAI、Anthropic 及 DeepSeek 的顶尖 AI 模型。

QQ_1742953507187.png

软件开发能力评价

而在软件开发能力的测试中,虽然其得分为63.8%,低于 Anthropic 的 Claude 3.7 Sonnet 的70.3%,但仍然优于 OpenAI 的 o3-mini 和 DeepSeek 的 R1。

人类的最后考试

此外,在“人类的最后考试”中,Gemini 2.5 Pro 的得分为18.8%,同样表现优于多家竞争对手。谷歌表示,Gemini 2.5 Pro 配备了100万个 token 的上下文窗口,这使得 AI 模型能够在一次提示中处理大约75万个单词,长度甚至超过了整个《指环王》系列。未来,谷歌计划推出200万个 token 的上下文窗口,进一步提升模型的能力。

QQ_1742953530355.png

谷歌在推理模型领域的探索

值得注意的是,谷歌在推理模型方面的探索并非首次,早在去年12月,公司就曾推出过 Gemini 的“思考”版本。但显然,Gemini 2.5 是谷歌目前对 OpenAI o 系列模型最有力的竞争者。关于 Gemini 2.5 Pro 的 API 定价,谷歌尚未透露更多信息。

官方信息

官方博客:https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#advanced-coding

划重点:

  • 🌟 Gemini 2.5 和 Pro 版本具备推理能力,标志着 AI 技术新进展。
  • 🚀 在多个基准测试中,Gemini 2.5 Pro 表现优于多家竞争对手。
  • 📈 将推出200万个 token 的上下文窗口,进一步提升 AI 模型处理能力。

​谷歌发布全新推理 AI 模型 Gemini 2.5和Gemini 2.5 Pro实验版

YiAI团队

YiAI团队

AI大模型技术专家团队

YiAI团队是一支专注于AI大模型应用的技术团队,由来自国内外知名科技公司的AI专家组成。 我们致力于为企业和开发者提供高质量、低成本的AI大模型API服务,涵盖文本生成、对话交互、 内容理解、知识问答等多个领域。团队拥有丰富的大规模语言模型开发和应用经验,深入理解 企业在AI落地过程中的实际需求和技术痛点。