谷歌云重磅推出高清语音模型 Chirp 3,支持248种声音

谷歌云在位于伦敦的 DeepMind 总部举行了一场会,正式推出其高清语音模型 Chirp3。该模型通过 Vertex AI 统一机器学习平台向开发者开放,提供了丰富的开发工具,助力程序的创新。

QQ_1742262673191.png

Chirp3模型特点与应用

Chirp3支持248种不同的声音,并可用31种语言进行语音合成。开发者可以利用这一模型创建多种应用,如智能语音助手、有声读物和视频配音等。谷歌表示,Chirp3的语音功能能够捕捉人类语调的细微差别,使得对话更加生动和引人入胜。

除了使用现成的语音,用户还可以通过谷歌云的文本转语音 API 创建自定义语音。然而,谷歌为了确保负责任的使用,限制了这一语音克隆功能的访问权限,以防止潜在的滥用行为,并确保符合伦理 AI 的实践。

谷歌云的新愿景与产品

在发布会上,谷歌云首席执行官托马斯·库里安(Thomas Kurian)强调,谷歌的总体愿景是提供一系列广泛的模型,除了 Chirp3外,还包括GeminiImagenVeil等多款产品。谷歌还推出了一个名为Agent Space的新产品,专为商业用户设计,以满足其特定需求。

Gemini的演进与多模态理解能力

谷歌 DeepMind 的首席执行官德米斯·哈萨比斯(Sir Demis Hassabis)也介绍了 Gemini 的演进,尤其是其多模态理解能力。他提到,在 AI Studio 中,用户可以发布 YouTube 链接,Gemini 能够处理视频内容,利用其长时上下文窗口让用户提问,快速找到讲座或体育赛事的关键时刻。

谷歌的英国AI技能提升计划

此外,谷歌还借此机会宣布了一项计划,旨在通过综合培训项目来提升英国的 AI 技能,帮助专业人士有效掌握 AI 技术。谷歌将向英国初创企业提供云基础设施和 AI 工具的使用积分,支持它们快速开发和扩展创新解决方案,以刺激创业活动。

隐私与合规性保障

在隐私和合规性方面,谷歌重申了对数据驻留的承诺,其 Vertex AI 和 Agent Space AI 工具可以帮助组织在符合当地法律的情况下,进行模型的训练和服务。这一点对于医疗和金融等行业至关重要,因为这些领域对隐私和合规性要求极高

项目: https://cloud.google.com/text-to-speech/docs/chirp3-hd

划重点:

  • 🌟 谷歌云推出 Chirp3语音模型,支持248种声音和31种语言,助力开发者构建智能应用。
  • 🔒 谷歌限制语音克隆功能的访问权限,以确保伦理 AI 的实践和防止滥用。
  • 💼 谷歌发起计划提升英国 AI 技能,并向初创企业提供云基础设施支持,促进创新。

​谷歌云重磅推出高清语音模型 Chirp 3,支持248种声音

YiAI团队

YiAI团队

AI大模型技术专家团队

YiAI团队是一支专注于AI大模型应用的技术团队,由来自国内外知名科技公司的AI专家组成。 我们致力于为企业和开发者提供高质量、低成本的AI大模型API服务,涵盖文本生成、对话交互、 内容理解、知识问答等多个领域。团队拥有丰富的大规模语言模型开发和应用经验,深入理解 企业在AI落地过程中的实际需求和技术痛点。