谷歌发布全新推理 AI 模型 Gemini 2.5和Gemini 2.5 Pro实验版
新模型的发布
近日,谷歌在开发者平台 Google AI Studio 及 Gemini 应用程序上发布了其最新的人工智能推理模型——Gemini 2.5。此模型具备停下来“思考”的能力,标志着人工智能技术的新进步。谷歌还推出了 Gemini 2.5 Pro Experimental,这款多模式推理 AI 模型被认为是截至目前最智能的。
Gemini 2.5的强大性能
Gemini 2.5的发布是谷歌针对每月20美元的 Gemini Advanced 订阅者的一项新服务,用户可以体验到其强大的推理能力。
竞争格局与推理技术发展
自从2024年9月 OpenAI 发布首个 AI 推理模型以来,各大科技公司如 Anthropic、DeepSeek、谷歌和 xAI 等纷纷推出了各自的推理模型,以期在智能化水平上相互竞争。推理技术的应用使得这些模型在数学和编程任务上表现得更加出色,推动了人工智能的进一步发展。
Gemini 2.5 Pro的基准测试表现
谷歌声称,Gemini 2.5 Pro 在多个基准测试中超越了其之前的 AI 模型及一些领先竞争对手。例如,在名为 Aider Polyglot 的代码编辑评估中,Gemini 2.5 Pro 获得了68.6%的高分,超过了 OpenAI、Anthropic 及 DeepSeek 的顶尖 AI 模型。
软件开发能力评价
而在软件开发能力的测试中,虽然其得分为63.8%,低于 Anthropic 的 Claude 3.7 Sonnet 的70.3%,但仍然优于 OpenAI 的 o3-mini 和 DeepSeek 的 R1。
人类的最后考试
此外,在“人类的最后考试”中,Gemini 2.5 Pro 的得分为18.8%,同样表现优于多家竞争对手。谷歌表示,Gemini 2.5 Pro 配备了100万个 token 的上下文窗口,这使得 AI 模型能够在一次提示中处理大约75万个单词,长度甚至超过了整个《指环王》系列。未来,谷歌计划推出200万个 token 的上下文窗口,进一步提升模型的能力。
谷歌在推理模型领域的探索
值得注意的是,谷歌在推理模型方面的探索并非首次,早在去年12月,公司就曾推出过 Gemini 的“思考”版本。但显然,Gemini 2.5 是谷歌目前对 OpenAI o 系列模型最有力的竞争者。关于 Gemini 2.5 Pro 的 API 定价,谷歌尚未透露更多信息。
官方信息
划重点:
- 🌟 Gemini 2.5 和 Pro 版本具备推理能力,标志着 AI 技术新进展。
- 🚀 在多个基准测试中,Gemini 2.5 Pro 表现优于多家竞争对手。
- 📈 将推出200万个 token 的上下文窗口,进一步提升 AI 模型处理能力。