Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频 / 音效等

2024-06-06 16:00 0 63 0

IT之家 6 月 6 日消息，Stability AI 立足 Stable Diffusion 文生图模型，进一步向音频领域拓展，推出了 Stable Audio Open，可以基于用户输入的提示词，生成高质量音频样本。

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频 / 音效等休闲区蓝鸢梦想 - Www.slyday.coM

Stable Audio Open 最长可以创建 47 秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于 transforms 扩散模型（DiT），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。

Stable Audio Open 目前已经开源，IT之家附上相关链接，感兴趣的用户可以在 HuggingFace 上试用。据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。

Stability AI 公司表示：“虽然它可以生成简短的音乐片段，但并不适合完整的歌曲、旋律或人声”。

Stable Audio Open 和 Stable Audio 2.0 不同是，前者为开源模型，专注于短音频片段和音效，而后者能够生成最长 3 分钟的完整音频。

相关阅读：

《Stable Audio 2.0 发布：生成最长 3 分钟音频，能帮音乐家补全创意作品》

《Stability AI 推出 Stable Audio，基于文本生成最长 90 秒音频》

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

相关文章

标签：样本 · 模型 · 音效 · 音频

相关推荐

比亚迪亮相 2025 年首尔车展，同步开启海豹预售

微星推出 RTX 5070 Ti 版泰坦 16 AI 2025 游戏本：国补价 9999 元

我国过敏性鼻炎治疗研究取得新进展，相关国产药物已获批上市

特斯拉 Semi 电动卡车再度延期，客户证实其价格大幅上涨

消息称三星 Galaxy Z Fold 7、Flip 7 将首批预装 One UI 8

小米米家冰箱 Pro 双系统十字平嵌 508L 上架：冷藏冷冻独立制冷，3699 元

OPPO Find X8s+ 手机升级点公布：6000mAh 电池、自定义按键等

全新一代宝马 X5 路试谍照曝光，预计 2026 年首次亮相