Google kündigte MusicLM an, eine künstliche Intelligenz, die Musik aus den von Ihnen eingegebenen Wörtern erstellt, wie DALL-E 2. Es ist ein von Google Research entwickeltes Sprachmodell. Außerdem haben sie es ausschließlich für die Musikkreation entwickelt.
Und es wurde mit einem riesigen Datensatz von Musikdateien trainiert und kann Musik in einer Reihe von Stilen und Formen produzieren. Wenn Sie sich für Musik interessieren; dann sollten Sie prüfen, was MusicLM anbieten wird.
Mit MusicLM produzieren Sie Musik in einigen Techniken und Formen. Sie können beispielsweise Klavierstücke, Schlagzeugschläge und Melodien für Texte erstellen.
Außerdem können Sie bestimmte Stile optimieren oder vom Benutzer bereitgestellte Eingaben einbeziehen. Es soll Musik produzieren, die harmonisch und rhythmisch zusammenhängend ist. Lassen Sie uns also eintauchen und sehen, worum es bei MusicLM geht.
Frühere Versuche
MusicLM ist nicht das erste KI-generierte Musiksystem. Riffus, Dance Diffusion, Googles AudioML und OpenAIs Musikbox sind Beispiele für vergleichbare Ansätze. Diese früheren Systeme wurden jedoch durch technologische Beschränkungen eingeschränkt.
Außerdem machte es ihr Mangel an Trainingsdaten schwierig, qualitativ hochwertige Melodien zu komponieren. MusicLM hat jedoch die Fähigkeit, Musik mit einem höheren Maß an Raffinesse und Realismus zu erstellen.
Übersicht MusicLM
MusicLM lernt die Struktur und den Stil von Musik. Daher wird es mit einem riesigen Datensatz von MIDI- und symbolischen Musikdateien trainiert. Wie seine ähnlichen Programme basiert MusicLM auf der Transformer-Architektur.
Unter Verwendung von Selbstaufmerksamkeitstechniken zur Konzentration auf bestimmte Eingabekomponenten wird die Transformer-Architektur von MusicLM verwendet, um die Struktur und den Stil von Musik aus einem großen Datensatz zu extrahieren. Als Ergebnis können Sie harmonisch und rhythmisch zusammenhängende Musik erstellen.
Und diese Musik kann die Organisation der Benutzereingabe nachahmen. Daher können Sie das musikalische Ergebnis erzielen, das Sie speziell für das Programm beschreiben.
Der Erfolg der vorherigen Sprachmodelle, wie GPT-2 und GPT-3, die ihre Fähigkeit bewiesen haben, kohärentes und flüssiges Schreiben zu erstellen, haben MusicLM inspiriert. MusicLM hingegen ist das erste Sprachmodell, das ausschließlich für die Musikgeneration gebaut wurde.
Und wir glauben, dass es als eines der raffiniertesten Modelle angesehen werden wird.
Wie funktioniert es?
DALL-E 2 und Googles MusicLM künstliche Intelligenz teilen viele strukturelle Ähnlichkeiten. Diesmal wird Ihr Schreiben jedoch eher musikalisch als visuell vermittelt. An dieser Stelle können Sie entweder ein ganzes Stück komplett konstruieren. Außerdem können Sie mit nur einem Instrument Rhythmus erzeugen.
Auf der Github-Seite von MusicLM können Sie sich mehrere Beispielstudien ansehen, die vom Google AI-Team erstellt wurden. Obwohl sich die KI noch in der Forschungs- und Entwicklungsphase befindet, sind die Geräusche, die sie erzeugen kann, hochauflösend. Außerdem gab es Vorschläge, wie die Integration dieser KI in ChatGPT. Diese Integration könnte zu komplexerer und kreativerer Musik führen.
Vom Summen bis zu Schlagermelodien
MusicLM kombiniert vier verschiedene KI-Modelle: MuLan, AudioLM, w2v-BERT und Soundstream. Obwohl jedes dieser Modelle eine Reihe von charakteristischen Fähigkeiten hat. Als sie jedoch integriert wurden, führten sie zu MusicLM!
Musiker und Branchenprofis haben die Fähigkeit von MusicLM bemerkt, selbst das grundlegendste Summen und Murmeln in ganze Melodien umzuwandeln. Durch die Kombination mit ChatGPT kann es einzigartige Musik produzieren.
Sie können die Musik und Klänge, die von MusicLM erstellt wurden, anhören und erkunden Website . Beachten Sie jedoch, dass es sich derzeit in der Testphase befindet. Es ist offensichtlich, dass MusicLM die Fähigkeit hat, das Musikgeschäft im Zuge der technologischen Entwicklung vollständig zu verändern.
KI-generierte Musik mit menschenähnlichen Nuancen
Um Songs zu produzieren, die auf der Grundlage gründlicher Beschreibungen Sinn machen, wurde MusicLM mit einem großen Datensatz von 280,000 Stunden Musik trainiert. Sie können beispielsweise „einen melodischen Dubstep-Song mit tiefem Bass und ausgefeilten Schlagzeugrhythmen“ erstellen. Oder Sie könnten darum bitten, „einen verlockenden Popsong mit einem fesselnden Gitarrenriff und einem kraftvollen Sänger“ zu kreieren. Ihrer Fantasie sind in diesem Fall keine Grenzen gesetzt.
Die produzierten Songs ähneln denen, die von menschlichen Musikern komponiert wurden. Die Samples von MusicLM sind äußerst erstaunlich. Dies gilt insbesondere, da kein Mensch am Kompositionsprozess beteiligt ist. MusicLM kann nuancierte Aspekte wie musikalische Riffs, Melodien und Emotionen wiederholen. Außerdem funktioniert es auch bei komplizierten und expliziten Spezifikationen.
Wichtige Funktionen
Bildunterschrift Konditionierung
Painting Caption Conditioning ist eine MusicLM-Funktion. Sie können Musik basierend auf einer Textbeschreibung oder „Beschriftung“ eines Gemäldes produzieren. Dies impliziert, dass MusicLM in der Lage ist, Musik zu erstellen, die die in einem Bild ausgedrückten Emotionen, Stimmungen und Ideen einfängt. Diese Funktion ist sehr hilfreich, um Musik für Filme zu machen, Videospiele, und alle Arten von visuellen Medien.
Story-Modus
Die Story-Modus-Funktion nimmt einen Story-Text als Eingabe. Daher erzeugt es begleitende Hintergrundmusik. Benutzer können diese Funktion verwenden, um einen Soundtrack für eine Geschichte, ein Videospiel oder einen Film zu erstellen, indem sie das Szenario oder den emotionalen Ton darstellen.
Der Story-Modus ist ein praktisches Werkzeug für Medienkünstler. Somit kann es ein breites Spektrum an Musikstilen und Instrumenten erzeugen. Der Tale-Modus von MusicLM verstärkt die emotionale Wirkung einer Szene. So können die Zuschauer zusätzlich in die Geschichte eintauchen.
Musikererfahrungslevel
Sie können den Schwierigkeitsgrad der erstellten Musik anpassen. Benutzer können je nach ihrem Können zwischen drei Stufen wählen. Außerdem können sie den bevorzugten Schwierigkeitsgrad angeben: Anfänger, Mittelstufe oder Fortgeschrittene.
Diese Funktion hilft Ihnen, wenn Sie ein wenig musikalische Erfahrung haben und mit neuen Kompositionen experimentieren möchten. Wenn Sie jedoch ein erfahrener Musiker sind, können Sie anspruchsvolle und subtile Musik erstellen. Das Ziel von MusicLM mit dieser Funktion ist es, allen Benutzern ein barrierefreies Erlebnis zu bieten.
Generationenvielfalt
Mit der Generation Diversity-Funktion können Sie viele Versionen eines Songs aus demselben Input produzieren. Und Sie können eine Vielzahl von Ausgängen haben. Dies impliziert, dass die KI mehrere Versionen eines Songs erzeugen kann.
Außerdem gibt es alternative Melodien oder Akkordfolgen, während der grundlegende Stil und die Struktur des Songs beibehalten werden. Diese Funktion hilft der KI bei der Musikkreation, kreativer zu sein. Daher macht es die Musikschöpfung analoger zum menschlichen Songwriting.
Mögliche Einschränkungen von MusicLM
Google hat MusicLM noch nicht für die breite Öffentlichkeit zugänglich gemacht, da es sich noch in der Entwicklung befindet. Daher können Sie noch keine konkreten Beispiele für die Art von Musik geben, die MusicLM produzieren kann. Außerdem ist noch etwas unbekannt, welche Einschränkungen MusicLM haben könnte.
Da sich die Technologie noch in einem frühen Stadium befindet, könnte sie bestimmte Einschränkungen hinsichtlich des Kalibers der produzierten Musik oder ihrer Kapazität zur Verarbeitung bestimmter Eingaben haben.
Die verzerrte Qualität der produzierten Proben ist einer der Hauptnachteile. Dies ist ein notwendiges Nebenprodukt des Schulungsverfahrens, das zur Entwicklung von MusicLM verwendet wurde.
Ein weiterer Nachteil ist, dass MusicLM trotz der technischen Fähigkeit, Gesang zu erzeugen. Dazu gehören Chorlieder. Die von MusicLM produzierten „Texte“ wirken manchmal wie Kauderwelsch. Außerdem können sie schwer zu verstehen sein. MusicLM befindet sich jedoch noch in der Entwicklung und diese Probleme können verbessert werden.
Schlussbemerkungen
Schließlich glauben wir, dass die Technologie, die Google MusicLM zugrunde liegt, sowohl interessant als auch faszinierend ist. Es ist erstaunlich, dass eine KI Musik in einer Vielzahl von Stilen mit einem höheren Grad an Realismus machen kann. MusicLM hat das Potenzial, das Musikgeschäft zu verändern. Und wir sind gespannt, wie sich diese Technologie entwickelt.
Hinterlassen Sie uns einen Kommentar