MusicGen

Das Modell von Meta (Facebook, Instagram, Whatsapp) erzeugt 12 Sekunden Audio auf der Grundlage einer Textbeschreibung. Optional kann durch Angabe einer Referenz-Datei die Melodie extrahiert werden. Das Modell versucht dann, sowohl der Beschreibung als auch der Melodie zu folgen.

MusicGen Benutzeroberfläche

Beispiel

So stellt sich das Modell hinter MusicGen den Song "Mamma Mia" als 90er-Rocksong vor.

Ausprobieren

MusicGen kann ohne Registrierung im Browser genutzt werden. Die Generierung eines 12-sekündigen Clips dauert ca. eine Minute. Das Modell kann hier ausprobiert werden: MusicGen (opens in a new tab)

Canva Magic Suno.ai