Resemble AI 今天在 Hugging Face 发布 DramaBox，面向导演级别的可控语音模型

2026-05-15 14:35:58

据 Beating 称，Resemble AI 于今日在 Hugging Face 发布 DramaBox，这是一款语音生成模型。该模型通过分离的提示语法实现导演级别的可控性——用户在引号中输入对话，同时在引号外指定舞台指令，如叹气、停顿或耳语。该模型会将这些指令渲染为带有情感起伏的语音，而非逐字朗读这些指令。

DramaBox 支持零样本语音克隆，只需 10 秒参考音频，并允许使用自然语言提示来设置角色年龄、口音和情绪。输出为 48kHz 立体声录音室品质音频。所有生成的音频都包含一个不可见的 Perth 水印，能够抵抗 MP3 压缩，并配套标准音频编辑以防止深度伪造的滥用。

声明：文章不代表币小二观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！

Resemble AI 今天在 Hugging Face 发布 DramaBox，面向导演级别的可控语音模型

相关阅读

热门文章