A Google bejelentette a MusicLM-et, a mesterséges intelligenciát, amely zenét hoz létre a beírt szavakból, például a DALL-E 2-ből. Ez a Google Research által létrehozott nyelvi modell. Emellett kizárólag zenealkotásra tervezték.
Ezenkívül a zenei fájlok hatalmas adathalmazára képezték ki, és számos stílusban és formában képes zenét előállítani. Ha érdekel a zene; akkor meg kell nézni, hogy a MusicLM mit kínál.
A MusicLM segítségével bizonyos technikákban és formában zenét készíthet. Létrehozhat például zongoradarabokat, dobütéseket és dallamokat a szövegekhez.
Ezenkívül finomhangolhat bizonyos stílusokat, vagy beillesztheti a felhasználó által biztosított bevitelt. Célja, hogy harmonikusan és ritmikusan összefüggő zenét hozzon létre. Szóval, merüljünk bele, és nézzük meg, miről is szól a MusicLM.
Korábbi próbálkozások
A MusicLM nem az első mesterséges intelligencia által generált zenei rendszer. Riffusion, Dance Diffusion, Google AudioML és OpenAI wurlitzer példák az összehasonlítható megközelítésekre. Ezeket a korábbi rendszereket azonban technológiai korlátok korlátozták.
Emellett a képzési adatok hiánya megnehezítette a jó minőségű dallamok komponálását. A MusicLM azonban képes kifinomultabb és realisztikusabb zenét létrehozni.
A MusicLM áttekintése
A MusicLM megtanulja a zene szerkezetét és stílusát. Ezért a MIDI és szimbolikus zenei fájlok hatalmas adatkészletére tanítják. Hasonló programjaihoz hasonlóan a MusicLM is Transformer architektúrára épül.
A MusicLM transzformátor-architektúráját alkalmazva az önfigyelem technikák segítségével egy nagy adathalmazból kinyerjük a zene szerkezetét és stílusát. Ennek eredményeként harmonikusan és ritmikusan összefüggő zenét hozhat létre.
És ez a zene utánozza a felhasználói bemenet szervezetét. Így megkaphatja azt a zenei eredményt, amelyet kifejezetten a programhoz ír le.
Az előző sikere nyelvi modellek, mint például a GPT-2 és GPT-3, amelyek bebizonyították, hogy képesek koherens és gördülékeny írásra, inspirálták a MusicLM-et. A MusicLM viszont az első olyan nyelvi modell, amely kizárólag a zenei generáció számára készült.
És úgy gondoljuk, hogy az egyik legkifinomultabb modellnek fogják tekinteni.
Hogyan működik?
DALL-E 2 és a Google MusicLM mesterséges intelligencia sok szerkezeti hasonlóságot mutatnak. Ezúttal azonban írásait inkább zeneileg, mint vizuálisan közvetíti. Ezen a ponton vagy teljesen megépíthet egy egész darabot. Ezenkívül egyetlen hangszerrel is létrehozhat ritmust.
A MusicLM Github oldalán több, a Google AI csapata által készített mintatanulmányt is megtekinthet. Annak ellenére, hogy a mesterséges intelligencia még mindig kutatási és fejlesztési szakaszban van, az általa kibocsátott hangok nagy felbontásúak. Vannak olyan javaslatok is, mint például a mesterséges intelligencia integrálása a ChatGPT-vel. Ez az integráció bonyolultabb és kreatívabb zenéhez vezethet.
A dúdolástól a slágerdallamokig
A MusicLM négy különböző AI-modellt egyesít: MuLan, AudioLM, w2v-BERT és Soundstream. Bár ezen modellek mindegyike rendelkezik egy sor megkülönböztető képességgel. Amikor azonban integrálódtak, a MusicLM lett az eredménye!
Zenészek és iparági szakemberek felfigyeltek a MusicLM képességére, hogy a legalapvetőbb zümmögést és mormogást is teljes dallamokká alakítsa. A ChatGPT-vel kombinálva egyedi zenét állíthat elő.
Meghallgathatja és felfedezheti a MusicLM által létrehozott zenét és hangokat . De ne feledje, hogy jelenleg tesztelési fázisban van. Nyilvánvaló, hogy a MusicLM képes teljesen átalakítani a zenei üzletágat a technológia fejlődésével.
AI által generált zene emberhez hasonló árnyalatokkal
Az alapos leírások alapján értelmes dalok előállításához a MusicLM-et 280,000 XNUMX órányi zenei adathalmazra képezték ki. Létrehozhat például „dallamos dubstep dallamot mély basszussal és kifinomult dobritmusokkal”. Vagy megkérheti, hogy alkosson „egy csábító popdalt lebilincselő gitárriffel és erőteljes énekessel”. Ebben az esetben a képzeleted szab határt.
Az előállított dalok hasonlítanak az emberi zenészek által komponált dalokra. A MusicLM mintái rendkívül lenyűgözőek. Ez különösen igaz, mivel a kompozíció folyamatában nem vesz részt ember. A MusicLM olyan árnyalt szempontokat képes megismételni, mint a zenei riffek, dallamok és érzelmek. Ezenkívül bonyolult és egyértelmű specifikációkkal is működik.
Fontos jellemzők
Festmény Felirat kondicionálása
Festés A Felirat kondicionálása a MusicLM funkció. Készíthet zenét egy festmény szöveges leírása vagy „felirata” alapján. Ez azt jelenti, hogy a MusicLM képes olyan zenét létrehozni, amely megragadja a képben kifejezett érzelmeket, hangulatokat és ötleteket. Ez a képesség nagyon hasznos filmzene készítésekor, videojátékok, és mindenféle vizuális média.
Story módban
A Story Mode funkció a sztori szövegét veszi be bevitelként. Ezért kísérő háttérzenét hoz létre. A felhasználók ezt a funkciót felhasználhatják egy mese, videojáték vagy film filmzenéjének elkészítéséhez a forgatókönyv vagy az érzelmi hangnem ábrázolásával.
A Story Mode egy praktikus eszköz a médiaművészek számára. Így a zenei stílusok és hangszerek széles skáláját tudja generálni. A MusicLM mesemódja fokozza egy jelenet érzelmi hatását. Így a nézők további mértékben elmélyülhetnek a történetben.
Zenész tapasztalati szint
Testreszabhatja a létrehozott zene nehézségi fokát. A felhasználók képzettségi szintjük alapján három szint közül választhatnak. Ezenkívül megadhatják a kívánt összetettségi fokot: kezdő, középhaladó vagy haladó.
Ez a funkció akkor segít, ha van egy kis zenei jártassága, és új szerzeményekkel szeretne kísérletezni. Ha azonban tapasztalt zenész, akkor kifinomult és finom zenét alkothat. A MusicLM célja ezzel a funkcióval, hogy minden felhasználó számára elérhető élményt nyújtson.
Generációs sokszínűség
A Generation Diversity funkcióval egy dal több verzióját is létrehozhatja ugyanarról a bemenetről. És sokféle kimenettel rendelkezhet. Ez azt jelenti, hogy az AI több verziót is generálhat egy dalból.
Emellett vannak alternatív dallamok vagy akkordmenetek, miközben megtartják a dal alapvető stílusát és szerkezetét. Ez a funkció segít az AI zenei létrehozásában kreatívabbá tenni. Ezért a zenealkotást jobban hasonlítja az emberi dalszerzéshez.
A MusicLM lehetséges korlátai
A Google még nem tette elérhetővé a MusicLM-et a nagyközönség számára, mivel még fejlesztés alatt áll. Ezért még nem adhat konkrét mintákat a MusicLM által előállított zenékből. Továbbá még mindig egy kicsit ismeretlen, hogy a MusicLM milyen korlátozásokkal rendelkezhet.
Mivel a technológia még korai szakaszában jár, bizonyos korlátozások vonatkozhatnak az előállított zene kaliberére vagy bizonyos bemenetek kezelésére.
Az előállított minták torz minősége az egyik fő hátrány. Ez a MusicLM fejlesztéséhez használt képzési eljárás szükséges mellékterméke.
Egy másik hátránya, hogy a MusicLM énekgyártás technikai képessége ellenére. Ide tartoznak a kórusdalok is. A MusicLM által készített „szöveg” néha halandzsának tűnik. Ráadásul nehéz lehet megérteni őket. A MusicLM azonban még fejlesztés alatt áll, és ezeken a problémákon lehet javítani.
Záró megjegyzések
Végül úgy gondoljuk, hogy a Google MusicLM mögött meghúzódó technológia egyszerre érdekes és lenyűgöző. Megdöbbentő, hogy egy mesterséges intelligencia többféle stílusban tud zenét készíteni, magasabb szintű realizmussal. A MusicLM képes megváltoztatni a zenei üzletágat. És izgatottan várjuk, hogyan fejlődik ez a technológia.
Hagy egy Válaszol