谷歌将多模态搜索功能引入AI模式,用户可询问图像内容

新功能概述

谷歌近日在其博客中宣布,将多模态搜索功能引入AI模式,这一新功能允许用户通过复杂的问题深入了解图像内容。此功能为有权使用AI模式的用户提供,用户现在可以直接对他们上传或用相机拍摄的照片进行提问。

图像分析能力

AI模式中的新图像分析功能是基于Google Lens的多模式技术。谷歌表示,该模式能够理解图像中的整个场景,包括物体之间的关系、材质、颜色、形状及排列等。通过一种称为“查询扇出”的技术,用户可以对图像及其所显示的对象提出多个问题,获得比传统搜索更详细的信息。

QQ_1744075778663.png

QQ_1744075795700.png

互动搜索实例

例如,用户可以拍摄一张书架的照片,然后询问: “如果我喜欢这些书,还有哪些类似的、评价很高的书?”AI模式将识别照片中的每本书,并生成一份推荐书籍列表,附带了解更多信息和购买链接。更为人性化的是,用户还可以继续提问,以进一步缩小搜索范围,比如“我在寻找快速阅读材料,这些推荐中哪一个最短?”这样的互动方式让搜索变得更加智能和个性化。

推广计划与未来展望

谷歌表示,AI模式的新功能将在未来几周内向数百万加入实验室的用户推广,此前该模式仅限于Google One AI Premium订阅用户使用。此次推出的AI模式旨在与市面上流行的服务,如Perplexity和OpenAI的ChatGPT Search等进行竞争。

谷歌还表示,未来将持续改进用户体验,并扩展这一新功能,力求为用户带来更优质的服务体验。

划重点:

  • 🌟 新功能:谷歌AI模式允许用户通过多模态搜索深入提问图像内容。
  • 📚 智能推荐:用户可上传照片并获得相关书籍推荐及链接。
  • 🚀 扩展计划:新功能将在数百万用户中推广,未来将持续改进。

​谷歌将多模态搜索功能引入AI模式,用户可询问图像内容

YiAI团队

YiAI团队

AI大模型技术专家团队

YiAI团队是一支专注于AI大模型应用的技术团队,由来自国内外知名科技公司的AI专家组成。 我们致力于为企业和开发者提供高质量、低成本的AI大模型API服务,涵盖文本生成、对话交互、 内容理解、知识问答等多个领域。团队拥有丰富的大规模语言模型开发和应用经验,深入理解 企业在AI落地过程中的实际需求和技术痛点。