顶尖推理能力
Gemini3在推理方面达到全新高度,在Humanity's Last Exam中获得37.5%的成绩,在GPQA Diamond科学知识测试中达到91.9%。Gemini3能够深入理解复杂问题,提供精准且有深度的答案。
Gemini3是谷歌DeepMind团队打造的新一代人工智能模型,具备顶尖推理能力、多模态理解和强大的智能代理功能,助你将任何创意变为现实。
Gemini3在前代模型基础上实现全面升级,融合多模态理解、深度推理和智能代理三大核心能力,为用户提供前所未有的AI体验。
Gemini3在推理方面达到全新高度,在Humanity's Last Exam中获得37.5%的成绩,在GPQA Diamond科学知识测试中达到91.9%。Gemini3能够深入理解复杂问题,提供精准且有深度的答案。
Gemini3可同时处理文本、图像、视频、音频和代码等多种形式的信息。在MMMU-Pro多模态测试中达到81%,Video-MMMU视频理解测试中获得87.6%,展现卓越的跨模态理解能力。
Gemini3具备强大的代理功能,可自主规划并执行复杂的多步骤任务。在Vending-Bench 2长期规划测试中表现出色,能够在你的监督下完成预订服务、整理邮箱等日常任务。
Gemini3是目前最强的编程AI模型之一,在SWE-bench Verified获得76.2%,Terminal-Bench 2.0获得54.2%。无论是零样本代码生成还是复杂项目开发,Gemini3都能提供专业级的编程支持。
Gemini3将学习、构建和规划三大能力完美融合,无论你是学生、开发者还是职场人士,都能在Gemini3的帮助下提升效率。
Gemini3可以解析学术论文、翻译手写笔记、生成互动式学习卡片,帮助你以最适合自己的方式掌握新知识。
利用Gemini3的多模态能力,你可以快速生成文案、设计方案、可视化图表,将抽象创意转化为具体作品。
Gemini3支持百万级token上下文,可以分析大型数据集、处理复杂文档,为决策提供数据支撑。
从零开始构建应用程序,Gemini3提供完整的编程支持,包括代码生成、调试优化和项目架构设计。
Gemini3的智能代理可以帮你规划日程、管理任务、自动执行重复性工作,释放你的时间专注于更重要的事。
Gemini3在MMMLU多语言测试中获得91.8%,支持全球100多种语言,打破语言障碍,实现无缝跨语言交流。
LMArena Elo评分
AIME 2025数学测试
Token上下文窗口
SWE-bench编程测试
Deep Think是Gemini3的增强推理模式,专为解决最复杂的问题而设计,将Gemini3的智能水平提升到新的高度。
Gemini3 Deep Think在多项测试中展现惊人表现:Humanity's Last Exam达到41%,GPQA Diamond达到93.8%,ARC-AGI-2视觉推理测试达到45.1%。这意味着Gemini3 Deep Think能够解决传统AI难以处理的复杂挑战。
Deep Think可以作为研究人员的强力工具,推理复杂科学问题,辅助学术发现。
面对高难度数学题,Gemini3 Deep Think展现出超越普通模型的解题能力。
在复杂编程场景中,Deep Think擅长权衡各种方案,优化时间复杂度。
从日常工作到专业创作,Gemini3正在改变人们与AI交互的方式,以下是Gemini3的典型应用场景。
学生可以使用Gemini3解析复杂教材、生成学习计划、创建互动式复习材料。Gemini3能够理解长篇学术内容并转化为易于理解的形式。
职场人士借助Gemini3处理邮件、撰写报告、分析数据。Gemini3的智能代理功能可以自动化处理日常重复任务,大幅提升工作效率。
开发者通过Gemini3进行代码编写、项目调试和架构设计。Gemini3支持在Google AI Studio、Vertex AI和多个第三方平台使用。
创作者利用Gemini3的多模态能力生成文字、分析视频、设计视觉内容。Gemini3帮助创作者快速将灵感转化为高质量作品。
研究人员使用Gemini3 Deep Think分析复杂数据、验证假设、探索新的研究方向。Gemini3的强大推理能力加速科学发现进程。
普通用户在日常生活中使用Gemini3查询信息、规划旅行、学习新技能。Gemini3让AI真正成为每个人的贴心助手。
Gemini3在Gemini2的基础上实现全面升级。Gemini3具备更强的推理能力、更精准的指令理解,以及更可靠的智能代理功能。在各项基准测试中,Gemini3均显著超越Gemini 2.5 Pro。
你可以通过Gemini应用直接体验Gemini3,也可以在Google搜索的AI Mode中使用。开发者可通过Google AI Studio或Vertex AI接入Gemini3 API进行开发。
Gemini3支持全球100多种语言,在MMMLU多语言测试中达到91.8%的准确率。无论你使用中文、英文还是其他语言,Gemini3都能提供高质量的响应。
Gemini3 Deep Think模式将向Google AI Ultra订阅用户开放。该模式专为需要深度推理的复杂任务设计,适合科研、高难度编程等应用场景。
Gemini3是谷歌迄今最安全的AI模型,经过全面的安全评估。模型具备更强的抗提示注入能力,减少阿谀奉承式回复,并与多个外部安全专家合作进行独立评估。