Google heeft MusicLM aangekondigd, kunstmatige intelligentie die muziek maakt van de woorden die je typt, zoals DALL-E 2. Het is een taalmodel gemaakt door Google Research. Bovendien hebben ze het exclusief ontworpen voor het maken van muziek.
En het is getraind op een enorme dataset van muziekbestanden en kan muziek produceren in een reeks stijlen en vormen. Als je geïnteresseerd bent in muziek; dan moet je kijken wat MusicLM te bieden heeft.
Met MusicLM produceer je muziek in bepaalde technieken en vormen. U kunt bijvoorbeeld pianostukken, drumbeats en melodieën voor songteksten maken.
U kunt ook afstemmen op bepaalde stijlen of door de gebruiker geleverde invoer toevoegen. Het is bedoeld om muziek te produceren die harmonisch en ritmisch samenhangend is. Dus laten we erin duiken en kijken waar MusicLM over gaat.
Vorige pogingen
MusicLM is niet het eerste door AI gegenereerde muzieksysteem. Riffusion, Dance Diffusion, Google's AudioML en OpenAI's Jukebox zijn voorbeelden van vergelijkbare benaderingen. Deze eerdere systemen werden echter beperkt door technologische beperkingen.
Ook maakte hun gebrek aan trainingsgegevens het moeilijk om melodieën van hoge kwaliteit te componeren. MusicLM heeft echter het vermogen om muziek te creëren met een hoger niveau van verfijning en realisme.
Overzicht MuziekLM
MusicLM leert de structuur en stijl van muziek. Daarom wordt het getraind op een uitgebreide dataset van MIDI- en symbolische muziekbestanden. Net als zijn vergelijkbare programma's, is MusicLM gebouwd op Transformer-architectuur.
Door gebruik te maken van technieken voor zelfaandacht om zich te concentreren op bepaalde invoercomponenten, wordt de transformatorarchitectuur van MusicLM gebruikt om de structuur en stijl van muziek uit een grote dataset te extraheren. Hierdoor kun je harmonisch en ritmisch samenhangende muziek creëren.
En deze muziek kan de organisatie van de gebruikersinvoer nabootsen. Daarom kunt u het muzikale resultaat krijgen dat u specifiek voor het programma beschrijft.
Het succes van vorige taalmodellen, zoals GPT-2 en GPT-3, die hun capaciteit hebben bewezen om coherent en vloeiend schrijven te creëren, inspireerden MusicLM. MusicLM daarentegen is het eerste taalmodel dat exclusief voor de muziekgeneratie is gebouwd.
En we denken dat het zal worden beschouwd als een van de meest geavanceerde modellen.
Hoe werkt het?
DALL-E 2 en MusicLM van Google kunstmatige intelligentie veel structurele overeenkomsten vertonen. Deze keer wordt je schrijven echter muzikaal overgebracht in plaats van visueel. Op dit punt kun je ofwel een heel stuk volledig construeren. U kunt ook ritme genereren met slechts één instrument.
U kunt verschillende voorbeeldstudies bekijken die zijn gemaakt door het Google AI-team op de Github-pagina van MusicLM. Hoewel de AI zich nog in de onderzoeks- en ontwikkelingsfase bevindt, zijn de geluiden die het kan maken van hoge resolutie. Er zijn ook suggesties gedaan, zoals het integreren van deze AI met ChatGPT. Deze integratie zou kunnen leiden tot meer ingewikkelde en creatieve muziek.
Van neuriën tot hitmelodieën
MusicLM combineert vier verschillende AI-modellen: MuLan, AudioLM, w2v-BERT en Soundstream. Hoewel elk van deze modellen een reeks onderscheidende mogelijkheden heeft. Toen ze echter geïntegreerd raakten, resulteerden ze in MusicLM!
Muzikanten en professionals uit de industrie hebben kennis genomen van het vermogen van MusicLM om zelfs het meest basale gezoem en gemompel om te zetten in hele melodieën. Door te combineren met ChatGPT kan het unieke muziek produceren.
Je kunt luisteren naar en de muziek en geluiden ontdekken die door MusicLM zijn gemaakt op zijn van de. Houd er echter rekening mee dat het zich momenteel in de testfase bevindt. Het is duidelijk dat MusicLM het vermogen heeft om de muziekbusiness volledig te transformeren naarmate de technologie zich verder ontwikkelt.
Door AI gegenereerde muziek met mensachtige nuances
Om nummers te produceren die logisch zijn op basis van grondige beschrijvingen, is MusicLM getraind op een grote dataset van 280,000 uur muziek. U kunt bijvoorbeeld "een melodieuze dubstepmelodie met een diepe bas en verfijnde drumritmes" maken. Of je zou erom kunnen vragen om "een verleidelijk popnummer met een boeiende gitaarriff en een krachtige zanger" te creëren. Je fantasie is in dit geval de limiet.
De geproduceerde nummers lijken op die gecomponeerd door menselijke muzikanten. De samples van MusicLM zijn buitengewoon verbluffend. Het is waar, vooral omdat er geen mens betrokken is bij het compositieproces. MusicLM kan genuanceerde aspecten herhalen, zoals muzikale riffs, melodieën en emoties. Bovendien werkt het zelfs met ingewikkelde en expliciete specificaties.
Belangrijke mogelijkheden
Schilderen Bijschrift Conditionering
Schilderen Bijschrift Conditionering is een MusicLM-functie. U kunt muziek produceren op basis van een tekstuele beschrijving of "bijschrift" van een schilderij. Dit houdt in dat MusicLM in staat is om muziek te maken die de emoties, stemmingen en ideeën vastlegt die in een foto worden uitgedrukt. Deze mogelijkheid is erg handig voor het maken van muziek voor films, video games, en allerlei visuele media.
Story Mode
Verhaalmodusfunctie neemt een verhaaltekst als invoer. Daarom creëert het begeleidende achtergrondmuziek. Gebruikers kunnen deze functie gebruiken om een soundtrack te bouwen voor een verhaal, videogame of film door het scenario of de emotionele toon weer te geven.
Story Mode is een handig hulpmiddel voor mediakunstenaars. Het kan dus een breed scala aan muziekstijlen en instrumenten genereren. MusicLM's Tale Mode kan de emotionele impact van een scène vergroten. Zo kunnen kijkers een extra mate van onderdompeling in het verhaal hebben.
Ervaringsniveau muzikant
U kunt de moeilijkheidsgraad van gemaakte muziek aanpassen. Gebruikers kunnen kiezen uit drie niveaus op basis van hun vaardigheidsniveau. Ze kunnen ook de gewenste complexiteitsgraad specificeren: beginner, halfgevorderd of gevorderd.
Deze functie helpt je als je een beetje muzikale expertise hebt en wilt experimenteren met nieuwe composities. Als je echter een ervaren muzikant bent, kun je verfijnde en subtiele muziek maken. Het doel van MusicLM met deze functie is om een toegankelijke ervaring voor alle gebruikers te bieden.
Generatie Diversiteit
Met de Generation Diversity-functie kunt u met dezelfde invoer vele versies van een nummer produceren. En u kunt een gevarieerd scala aan uitgangen hebben. Dit houdt in dat de AI meerdere versies van een nummer kan genereren.
Bovendien zijn er alternatieve melodieën of akkoordprogressies, terwijl de basisstijl en structuur van het nummer behouden blijven. Deze functie helpt de muziekcreatie van de AI om creatiever te zijn. Daarom maakt het het maken van muziek meer analoog aan het schrijven van menselijke liedjes.
Mogelijke beperkingen van MusicLM
Google heeft MusicLM nog niet beschikbaar gemaakt voor het grote publiek, aangezien het nog in ontwikkeling is. Daarom kun je nog geen specifieke voorbeelden geven van de soorten muziek die MusicLM kan produceren. Verder is het nog een beetje onbekend welke beperkingen MusicLM zou kunnen hebben.
Aangezien de technologie nog in de kinderschoenen staat, kunnen er bepaalde beperkingen gelden voor het kaliber van de geproduceerde muziek of het vermogen om bepaalde invoer te verwerken.
De vervormde kwaliteit van de geproduceerde monsters is een van de belangrijkste nadelen. Dit is een noodzakelijk bijproduct van de trainingsprocedure die wordt gebruikt om MusicLM te ontwikkelen.
Een ander nadeel is dat, ondanks het technische vermogen van MusicLM om zang te produceren. Hieronder vallen ook koorliederen. De "lyrics" die door MusicLM worden geproduceerd, lijken soms op wartaal. Bovendien kunnen ze moeilijk te begrijpen zijn. MusicLM is echter nog in ontwikkeling en deze problemen kunnen worden verbeterd.
Laatste opmerkingen
Ten slotte zijn we van mening dat de technologie die ten grondslag ligt aan Google MusicLM zowel interessant als fascinerend is. Het is verbazingwekkend dat een AI muziek kan maken in verschillende stijlen, met een hoger niveau van realisme. MusicLM heeft het potentieel om de muziekbusiness te veranderen. En we zijn verheugd om te zien hoe deze technologie evolueert.
Laat een reactie achter