MusicGen
Das Modell von Meta (Facebook, Instagram, Whatsapp) erzeugt 12 Sekunden Audio auf der Grundlage einer Textbeschreibung. Optional kann durch Angabe einer Referenz-Datei die Melodie extrahiert werden. Das Modell versucht dann, sowohl der Beschreibung als auch der Melodie zu folgen.
MusicGen Benutzeroberfläche
Beispiel
So stellt sich das Modell hinter MusicGen den Song "Mamma Mia" als 90er-Rocksong vor.
Ausprobieren
MusicGen kann ohne Registrierung im Browser genutzt werden. Die Generierung eines 12-sekündigen Clips dauert ca. eine Minute. Das Modell kann hier ausprobiert werden: MusicGen (opens in a new tab)