Google ประกาศ MusicLM ปัญญาประดิษฐ์ที่สร้างเพลงจากคำที่คุณพิมพ์ เช่น DALL-E 2 ซึ่งเป็นรูปแบบภาษาที่สร้างขึ้นโดย Google Research นอกจากนี้ พวกเขายังออกแบบมาเพื่อสร้างสรรค์ผลงานเพลงโดยเฉพาะอีกด้วย
และได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลไฟล์เพลงจำนวนมหาศาล และสามารถผลิตเพลงในรูปแบบและรูปแบบที่หลากหลาย หากคุณสนใจดนตรี จากนั้นคุณควรตรวจสอบสิ่งที่ MusicLM จะนำเสนอ
ด้วย MusicLM คุณผลิตเพลงด้วยเทคนิคและรูปแบบบางอย่าง ตัวอย่างเช่น คุณสามารถสร้างท่อนเปียโน จังหวะกลอง และทำนองสำหรับเนื้อเพลงได้
นอกจากนี้ คุณยังสามารถปรับแต่งสไตล์บางอย่างหรือรวมอินพุตที่ผู้ใช้ให้มา มันหมายถึงการผลิตเพลงที่สอดคล้องกันและเป็นจังหวะ มาดูกันดีกว่าว่า MusicLM นั้นเกี่ยวกับอะไร
ความพยายามครั้งก่อน
MusicLM ไม่ใช่ระบบเพลงที่สร้างโดย AI ระบบแรก Riffusion, Dance Diffusion, AudioML ของ Google และ OpenAI ตู้เพลง เป็นตัวอย่างแนวทางเทียบเคียง อย่างไรก็ตาม ระบบก่อนหน้านี้ถูกจำกัดด้วยข้อจำกัดทางเทคโนโลยี
นอกจากนี้ การขาดข้อมูลการฝึกอบรมทำให้ยากต่อการแต่งเพลงคุณภาพสูง อย่างไรก็ตาม MusicLM มีความสามารถในการสร้างเพลงที่มีระดับความซับซ้อนและความสมจริงมากขึ้น
ภาพรวม MusicLM
MusicLM เรียนรู้โครงสร้างและสไตล์ของดนตรี ดังนั้นจึงได้รับการฝึกฝนเกี่ยวกับชุดข้อมูล MIDI และไฟล์เพลงสัญลักษณ์มากมาย เช่นเดียวกับโปรแกรมที่คล้ายกัน MusicLM สร้างขึ้นจากสถาปัตยกรรม Transformer
การใช้เทคนิคการควบคุมตนเองเพื่อจดจ่อกับส่วนประกอบอินพุตเฉพาะ สถาปัตยกรรมทรานส์ฟอร์มเมอร์ของ MusicLM ใช้เพื่อแยกโครงสร้างและสไตล์ของเพลงจากชุดข้อมูลขนาดใหญ่ ด้วยเหตุนี้ คุณจึงสามารถสร้างเพลงที่ประสานกันได้อย่างกลมกลืนและเป็นจังหวะ
และเพลงนี้สามารถเลียนแบบการจัดระเบียบของการป้อนข้อมูลของผู้ใช้ ดังนั้น คุณจะได้ผลลัพธ์ทางดนตรีที่คุณอธิบายไว้ในโปรแกรมโดยเฉพาะ
ความสำเร็จของก่อนหน้านี้ โมเดลภาษาMusicLM เป็นแรงบันดาลใจให้ MusicLM เช่น GPT-2 และ GPT-3 ซึ่งพิสูจน์ความสามารถในการสร้างงานเขียนที่สอดคล้องกันและลื่นไหล ในทางกลับกัน MusicLM เป็นรูปแบบภาษาแรกที่สร้างขึ้นสำหรับยุคเพลงโดยเฉพาะ
และเราคิดว่ามันจะถูกมองว่าเป็นหนึ่งในโมเดลที่ซับซ้อนที่สุด
มันทำงานอย่างไร?
DALL-E 2 และ MusicLM ของ Google ปัญญาประดิษฐ์ แบ่งปันความคล้ายคลึงกันทางโครงสร้างมากมาย ครั้งนี้ งานเขียนของคุณถ่ายทอดทางดนตรีมากกว่าภาพ ณ จุดนี้ คุณสามารถสร้างชิ้นส่วนทั้งหมดได้อย่างสมบูรณ์ นอกจากนี้ คุณสามารถสร้างจังหวะโดยใช้เครื่องดนตรีเพียงชิ้นเดียว
คุณสามารถดูการศึกษาตัวอย่างหลายชิ้นที่สร้างโดยทีม Google AI ในหน้า Github ของ MusicLM แม้ว่า AI จะยังอยู่ในขั้นตอนการวิจัยและพัฒนา แต่เสียงที่ AI ทำได้นั้นมีความละเอียดสูง นอกจากนี้ยังมีข้อเสนอแนะ เช่น การรวม AI นี้เข้ากับ ChatGPT การผสานรวมนี้อาจนำไปสู่เพลงที่ซับซ้อนและสร้างสรรค์ยิ่งขึ้น
ตั้งแต่การฮัมเพลงไปจนถึงท่วงทำนองเพลงฮิต
MusicLM รวมสี่โมเดล AI ที่แตกต่างกัน: MuLan, AudioLM, w2v-BERT และ Soundstream แม้ว่าแต่ละรุ่นเหล่านี้จะมีความสามารถที่โดดเด่น อย่างไรก็ตาม เมื่อรวมเข้าด้วยกันแล้ว ทำให้เกิดเป็น MusicLM!
นักดนตรีและผู้เชี่ยวชาญด้านอุตสาหกรรมสังเกตเห็นความสามารถของ MusicLM ในการแปลงแม้แต่เสียงฮัมและเสียงพึมพำพื้นฐานที่สุดให้เป็นเพลงทั้งหมด ด้วยการรวมเข้ากับ ChatGPT ทำให้สามารถสร้างเพลงที่ไม่เหมือนใครได้
คุณสามารถฟังและสำรวจเพลงและเสียงที่สร้างโดย MusicLM ได้ เว็บไซต์. แต่โปรดทราบว่าขณะนี้อยู่ในขั้นตอนการทดสอบ เห็นได้ชัดว่า MusicLM มีความสามารถที่จะเปลี่ยนแปลงธุรกิจเพลงได้อย่างสมบูรณ์เมื่อเทคโนโลยีพัฒนาขึ้น
เพลงที่สร้างโดย AI ที่มีความแตกต่างเหมือนมนุษย์
ในการผลิตเพลงที่เหมาะสมตามคำอธิบายอย่างละเอียด MusicLM ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลขนาดใหญ่ของเพลง 280,000 ชั่วโมง ตัวอย่างเช่น คุณสามารถสร้าง "เพลง dubstep ที่ไพเราะพร้อมเสียงเบสที่หนักแน่นและจังหวะกลองที่ซับซ้อน" หรือคุณสามารถขอให้สร้าง "เพลงป๊อปที่น่าหลงใหลพร้อมริฟฟ์กีตาร์ที่มีเสน่ห์และนักร้องที่ทรงพลัง" จินตนาการของคุณคือขีดจำกัดในกรณีนี้
เพลงที่สร้างขึ้นคล้ายกับเพลงที่แต่งโดยนักดนตรีมนุษย์ ตัวอย่างของ MusicLM นั้นน่าทึ่งมาก เป็นเรื่องจริงโดยเฉพาะอย่างยิ่งเนื่องจากไม่มีมนุษย์เข้ามาเกี่ยวข้องในกระบวนการแต่งเพลง MusicLM สามารถเล่นซ้ำแง่มุมต่างๆ เช่น ริฟฟ์ดนตรี ท่วงทำนอง และอารมณ์ นอกจากนี้ มันยังทำงานได้แม้ว่าจะมีข้อกำหนดที่ซับซ้อนและชัดเจน
คุณลักษณะที่สำคัญ
การปรับคำบรรยายภาพจิตรกรรม
การปรับสภาพคำบรรยายภาพเป็นฟังก์ชัน MusicLM คุณสามารถสร้างเพลงตามคำอธิบายที่เป็นข้อความหรือ "คำบรรยาย" ของภาพวาด นี่หมายความว่า MusicLM สามารถสร้างเพลงที่จับอารมณ์ อารมณ์ และความคิดที่แสดงออกมาในภาพได้ ความสามารถนี้มีประโยชน์มากสำหรับการสร้างเพลงสำหรับภาพยนตร์ วิดีโอเกมและสื่อโสตทัศน์ทุกชนิด
โหมดเนื้อเรื่อง
คุณสมบัติโหมดเนื้อเรื่องใช้ข้อความเรื่องราวเป็นอินพุต ดังนั้นจึงสร้างเพลงพื้นหลังประกอบ ผู้ใช้สามารถใช้ฟังก์ชันนี้เพื่อสร้างเพลงประกอบสำหรับนิทาน วิดีโอเกม หรือภาพยนตร์โดยบรรยายสถานการณ์หรือโทนอารมณ์
Story Mode เป็นเครื่องมือที่มีประโยชน์สำหรับศิลปินสื่อ ดังนั้นจึงสามารถสร้างสไตล์ดนตรีและเครื่องดนตรีได้หลากหลาย โหมดนิทานของ MusicLM ช่วยเพิ่มผลกระทบทางอารมณ์ของฉาก ดังนั้น ผู้ชมสามารถดื่มด่ำกับเรื่องราวได้มากขึ้น
ระดับประสบการณ์นักดนตรี
คุณสามารถปรับแต่งความยากของเพลงที่สร้างขึ้นได้ ผู้ใช้สามารถเลือกระหว่างสามระดับตามระดับทักษะของพวกเขา นอกจากนี้ยังสามารถระบุระดับความซับซ้อนที่ต้องการได้: ระดับเริ่มต้น ระดับกลาง หรือระดับสูง
คุณสมบัตินี้ช่วยคุณได้หากคุณมีความเชี่ยวชาญทางดนตรีเล็กน้อยและต้องการทดลองการเรียบเรียงใหม่ อย่างไรก็ตาม หากคุณเป็นนักดนตรีที่มีประสบการณ์ คุณจะสามารถสร้างดนตรีที่ละเอียดอ่อนและซับซ้อนได้ เป้าหมายของ MusicLM ในฟีเจอร์นี้คือมอบประสบการณ์ที่เข้าถึงได้สำหรับผู้ใช้ทุกคน
ความหลากหลายของเจนเนอเรชั่น
ด้วยฟังก์ชัน Generation Diversity คุณสามารถสร้างเพลงได้หลายเวอร์ชันจากอินพุตเดียวกัน และคุณสามารถมีเอาต์พุตได้หลากหลาย นี่หมายความว่า AI อาจสร้างเพลงหลายเวอร์ชัน
นอกจากนั้นยังมีการสลับทำนองหรือการขึ้นคอร์ดโดยยังคงรูปแบบและโครงสร้างของเพลงเป็นหลัก คุณสมบัตินี้ช่วยให้การสร้างสรรค์เพลงของ AI มีความสร้างสรรค์มากขึ้น ดังนั้นจึงทำให้การสร้างสรรค์ดนตรีมีความคล้ายคลึงกับการแต่งเพลงของมนุษย์
ข้อจำกัดที่เป็นไปได้ของ MusicLM
Google ยังไม่ได้ให้บริการ MusicLM แก่บุคคลทั่วไปเนื่องจากยังอยู่ในระหว่างการพัฒนา ดังนั้น คุณจึงยังไม่สามารถให้ตัวอย่างเฉพาะของประเภทเพลงที่ MusicLM สามารถผลิตได้ นอกจากนี้ยังไม่ทราบว่า MusicLM จะมีข้อจำกัดอะไรบ้าง
เนื่องจากเทคโนโลยียังอยู่ในช่วงเริ่มต้น จึงอาจมีข้อจำกัดบางประการเกี่ยวกับความสามารถของเพลงที่ผลิตหรือความสามารถในการรองรับอินพุตเฉพาะ
คุณภาพที่บิดเบี้ยวของตัวอย่างที่ผลิตได้เป็นหนึ่งในข้อบกพร่องที่สำคัญ นี่เป็นผลพลอยได้ที่จำเป็นของขั้นตอนการฝึกอบรมที่ใช้ในการพัฒนา MusicLM
ข้อเสียอีกประการหนึ่งคือ แม้ว่า MusicLM จะมีความสามารถทางเทคนิคในการผลิตเสียงร้องก็ตาม ซึ่งรวมถึงเพลงประสานเสียง “เนื้อเพลง” ที่ผลิตโดย MusicLM บางครั้งดูเหมือนพูดพล่อยๆ นอกจากนี้ยังสามารถเข้าใจได้ยาก อย่างไรก็ตาม MusicLM ยังอยู่ในระหว่างการพัฒนาและปัญหาเหล่านี้สามารถปรับปรุงได้
หมายเหตุครั้งสุดท้าย
สุดท้ายนี้ เราเชื่อว่าเทคโนโลยีที่เป็นพื้นฐานของ Google MusicLM นั้นทั้งน่าสนใจและน่าทึ่ง น่าประหลาดใจที่ AI สามารถสร้างเพลงได้หลากหลายสไตล์โดยมีความสมจริงในระดับที่สูงขึ้น MusicLM มีศักยภาพในการเปลี่ยนแปลงธุรกิจเพลง และเราตื่นเต้นที่จะได้เห็นวิวัฒนาการของเทคโนโลยีนี้
เขียนความเห็น