Story321.com

ACE Step – 用于极速、高质量音乐生成的 AI 模型

ACE Step 使开发人员、音乐家和创作者能够使用自然语言提示以及诸如语音克隆等高级功能在几秒钟内原型设计和制作录音棚质量的曲目。

什么是 ACE Step?

ACE Step 是一个由 ACE Studio 和 StepFun 联合开发的用于文本到音乐生成的新型开源基础模型 ([GitHub][1])。 其核心是,ACE Step 集成了基于扩散的生成与深度压缩自动编码器 (DCAE) 和轻量级线性 Transformer,以弥合 AI 音乐模型中速度、连贯性和可控性之间的差距 ([Hugging Face][2])。 与擅长歌词对齐但推理速度较慢的基于 LLM 的方法不同,ACE Step 仅需 20 秒即可在 A100 GPU 上实现长达四分钟的全曲合成,使其比传统基线快大约 15 倍 ([Hugging Face][2])。

通过保留细粒度的声学细节并支持自然语言描述,ACE Step 使创作者能够生成、混音和编辑跨流派的音乐——从柔和的爵士乐到充满活力的电子音乐——而不会牺牲质量或速度 ([Medium][3])。 ACE Step 在 Apache-2.0 许可下发布,可免费用于商业用途,并邀请开源社区通过 LoRA 和 ControlNet 等技术扩展其功能 ([blog.comfy.org][4])。

Process

如何使用 ACE Step

使用 ACE Step 涉及从安装到生成和编辑的几个关键步骤:

1

安装

克隆存储库:`git clone https://github.com/ace-step/ACE-Step.git`。 安装依赖项:`cd ACE-Step` 然后 `pip install -r requirements.txt`。 下载模型权重:`wget https://huggingface.co/ACE-Step/ACE-Step-v1-3.5B/resolve/main/pytorch_model.bin`。 注意:ace step v1-3.5B 权重需要大约 41 GB 的 VRAM。

2

生成音乐

使用 Python:`from ace_step import AceStepModel, MusicPipeline; model = AceStepModel.from_pretrained("ACE-Step/ACE-Step-v1-3.5B"); pipeline = MusicPipeline(model=model); prompt = "一段史诗般的管弦乐乐谱,带有连绵不断的弦乐和大胆的鼓声"; audio = pipeline.text_to_music(prompt=prompt, duration=120); audio.save("epic_orchestral.wav")`。

3

编辑和混音

使用 ACE Step 的编辑 API:`edited = pipeline.edit_music(original_audio="song.wav", edit_prompt="在桥段中添加一段深情的萨克斯独奏"); edited.save("song_remixed.wav")`。 开发人员可以通过其 REST API、Docker 容器或 Hugging Face Spaces 将 ace step 集成到 DAW 或 Web 应用程序中。

FAQ

常见问题解答 (FAQ)

查找有关 ACE Step 的常见问题的解答。

🚀 **准备好使用 ACE Step 进行创作了吗?**

ACE step 标志着 AI 音乐生成的一个关键时刻,它将速度、质量和灵活性融合到一个开源包中。 探索各种可能性,并在几秒钟内开始生成音乐。

👉 **探索 Hugging Face ACE-Step 页面以开始使用,并加入 GitHub 和 ComfyUI 集成上的对话。**