ACE Step – Modèle d'IA pour une génération de musique ultra-rapide et de haute qualité
ACE Step permet aux développeurs, aux musiciens et aux créateurs de prototyper et de produire des morceaux de qualité studio en quelques secondes en utilisant des invites en langage naturel et des fonctionnalités avancées telles que le clonage de voix.
Qu'est-ce qu'ACE Step ?
ACE Step est un nouveau modèle de fondation open source pour la génération de texte en musique développé conjointement par ACE Studio et StepFun ([GitHub][1]). Au cœur de son fonctionnement, ACE Step intègre la génération basée sur la diffusion avec un autoencodeur à compression profonde (DCAE) et un transformateur linéaire léger pour combler le fossé entre la vitesse, la cohérence et la contrôlabilité dans les modèles de musique IA ([Hugging Face][2]). Contrairement aux approches basées sur LLM qui excellent dans l'alignement des paroles, mais souffrent d'une inférence lente, ACE Step réalise une synthèse complète de chansons allant jusqu'à quatre minutes en seulement 20 secondes sur un GPU A100, ce qui le rend environ 15 fois plus rapide que les bases de référence traditionnelles ([Hugging Face][2]).
En préservant les détails acoustiques précis et en prenant en charge les descriptions en langage naturel, ACE Step permet aux créateurs de générer, de remixer et de modifier de la musique dans tous les genres, des morceaux de jazz doux aux morceaux électroniques énergiques, sans sacrifier la qualité ou la vitesse ([Medium][3]). Publié sous la licence Apache-2.0, ACE Step est gratuit pour un usage commercial et invite les contributions de la communauté open source à étendre ses capacités grâce à des techniques telles que LoRA et ControlNet ([blog.comfy.org][4]).
Comment utiliser ACE Step
L'utilisation d'ACE Step implique quelques étapes clés, de l'installation à la génération et à l'édition :
Installation
Clonez le référentiel : `git clone https://github.com/ace-step/ACE-Step.git`. Installez les dépendances : `cd ACE-Step` puis `pip install -r requirements.txt`. Téléchargez les poids du modèle : `wget https://huggingface.co/ACE-Step/ACE-Step-v1-3.5B/resolve/main/pytorch_model.bin`. Remarque : les poids d'ACE Step v1-3.5B nécessitent environ 41 Go de VRAM.
Génération de musique
Utilisez Python : `from ace_step import AceStepModel, MusicPipeline ; model = AceStepModel.from_pretrained("ACE-Step/ACE-Step-v1-3.5B") ; pipeline = MusicPipeline(model=model) ; prompt = "une partition orchestrale épique avec des cordes amples et des batteries audacieuses" ; audio = pipeline.text_to_music(prompt=prompt, duration=120) ; audio.save("epic_orchestral.wav")`.
Edition et remixage
Utilisez l'API d'édition d'ACE Step : `edited = pipeline.edit_music(original_audio="song.wav", edit_prompt="ajouter un solo de saxophone émouvant dans le pont") ; edited.save("song_remixed.wav")`. Les développeurs peuvent intégrer ACE Step dans les stations audionumériques ou les applications Web via son API REST, ses conteneurs Docker ou Hugging Face Spaces.
Foire aux questions (FAQ)
Trouvez des réponses aux questions courantes sur ACE Step.
🚀 **Prêt à créer avec ACE Step ?**
ACE Step marque un moment charnière dans la génération de musique IA, combinant vitesse, qualité et flexibilité dans un seul package open source. Explorez les possibilités et commencez à générer de la musique en quelques secondes.
👉 **Explorez la page Hugging Face ACE-Step pour commencer et rejoignez la conversation sur les intégrations GitHub et ComfyUI.**