MiniMax Audio推Speech- 02语音模型,一次性可以输入20万字符

备受关注的音频技术创新者MiniMax Audio正式发布了其全新的Speech-02系列语音模型,支持30多种语音,一次性可以输入20万字符。为用户带来更真实、更流畅、更便捷的音频体验。

QQ_1743560661176.png

Speech-02系列的核心亮点

全新的Speech-02系列是本次更新的核心亮点。据官方介绍,该系列在多语言覆盖能力上实现了显著提升,能够更准确、更地道地呈现多种语言的发音。

自然的语音合成体验

更令人惊喜的是,Speech-02的人声相似度高达99%,这意味着合成的语音听起来更加自然、贴近真人。此外,该模型还实现了零节奏故障,彻底解决了音频播放过程中可能出现的卡顿和节奏不稳问题,保证了听感的连贯性和流畅性。值得强调的是,尽管在多方面进行了重大升级,Speech-02系列依然维持了原有的亲民价格。

多项实用新功能

除了核心的语音合成技术的提升,MiniMax Audio还推出了多项实用新功能。全新的“Read Anything”功能允许用户通过上传本地文件或粘贴网络URL,即可随时随地收听各类内容,极大地拓展了用户获取音频信息的渠道。无论是文档、电子书还是网页文章,用户都可以轻松转化为自己喜欢的音色进行聆听。

强大的长文本处理能力

针对长文本处理的需求,MiniMax Audio推出了强大的“Long-Text Mode(长文本)”,该模式单次输入即可支持高达20万字符的异步语音合成,这使得创建音频书籍、播客等长音频内容变得前所未有的便捷,彻底解决了以往长文本合成时需要分段处理的困扰。

优化用户体验

为了优化用户的使用体验,MiniMax Audio还对历史管理功能进行了增强,用户可以更方便地查看、删除和整理自己的语音合成历史和设置。同时,新增的“Discovery Hub”将所有新功能和更新内容集中展示,帮助用户快速了解和掌握MiniMax Audio的最新动态。

体验入口: https://www.minimax.io/audio

MiniMax Audio推Speech- 02语音模型,一次性可以输入20万字符

YiAI团队

YiAI团队

AI大模型技术专家团队

YiAI团队是一支专注于AI大模型应用的技术团队,由来自国内外知名科技公司的AI专家组成。 我们致力于为企业和开发者提供高质量、低成本的AI大模型API服务,涵盖文本生成、对话交互、 内容理解、知识问答等多个领域。团队拥有丰富的大规模语言模型开发和应用经验,深入理解 企业在AI落地过程中的实际需求和技术痛点。