谷歌发布了 MusicLM,这是一种人工智能,可以根据您输入的文字创作音乐,例如 DALL-E 2。它是由谷歌研究院创建的一种语言模型。 此外,他们专为音乐创作而设计。
而且,它已经过大量音乐文件数据集的训练,可以制作各种风格和形式的音乐。 如果您对音乐感兴趣; 那么您应该检查 MusicLM 将提供什么。
使用 MusicLM,您可以以某些技术和形式制作音乐。 例如,您可以为歌词创作钢琴曲、鼓点和旋律。
此外,您可以微调某些样式或包括用户提供的输入。 它旨在产生和谐和有节奏的凝聚力的音乐。 那么,让我们深入了解一下 MusicLM 的全部内容。
以前的尝试
MusicLM 并不是第一个人工智能生成的音乐系统。 Riffusion、Dance Diffusion、Google 的 AudioML 和 OpenAI 的 点唱机 是可比方法的例子。 然而,这些现有系统受到技术限制。
此外,他们缺乏训练数据,因此很难创作出高质量的曲子。 然而,MusicLM 有能力创作出更复杂、更真实的音乐。
概述 MusicLM
MusicLM 学习音乐的结构和风格。 因此,它在大量 MIDI 和符号音乐文件数据集上接受训练。 与其类似程序一样,MusicLM 建立在 Transformer 架构之上。
MusicLM 的转换器架构利用自注意力技术专注于特定的输入组件,用于从大数据集中提取音乐的结构和风格。 因此,您可以创作和谐且有节奏感的音乐。
而且,这种音乐可以模仿用户输入的组织。 因此,您将能够获得您专门向程序描述的音乐结果。
前任的成功 语言模型,例如 GPT-2 和 GPT-3,它们已经证明了自己创造连贯流畅写作的能力,启发了 MusicLM。 另一方面,MusicLM 是第一个专为音乐世代打造的语言模型。
而且,我们认为它将被视为最复杂的模型之一。
它是如何工作的?
DALL-E 2 和谷歌的 MusicLM 人工智能 有很多结构上的相似之处。 不过这一次,你的作品是通过音乐而不是视觉来传达的。 此时,您可以完全构建一个整体。 此外,您可以只使用一种乐器来产生节奏。
您可以在 MusicLM 的 Github 页面上查看由 Google AI 团队创建的多个样本研究。 尽管人工智能还处于研发阶段,但它能发出的声音是高分辨率的。 此外,还有一些建议,例如将此 AI 与 ChatGPT 集成。 这种整合可能会产生更复杂、更有创意的音乐。
从哼唱到热门旋律
MusicLM 结合了四种不同的 AI 模型:MuLan、AudioLM、w2v-BERT 和 Soundstream。 尽管这些模型中的每一个都具有一组独特的功能。 然而,当它们被整合时,它们产生了 MusicLM!
音乐家和行业专业人士已经注意到 MusicLM 将最基本的嗡嗡声和杂音转化为完整曲调的能力。 通过与 ChatGPT 结合,它可以产生独特的音乐。
您可以在其上聆听和探索 MusicLM 创建的音乐和声音 官网. 但是,请记住它目前处于测试阶段。 很明显,随着技术的发展,MusicLM 有能力彻底改变音乐业务。
人工智能生成的音乐具有类似人类的细微差别
为了根据详尽的描述制作有意义的歌曲,MusicLM 在包含 280,000 小时音乐的大型数据集上进行了训练。 例如,您可以创建“具有深沉低音和复杂鼓节奏的旋律 dubstep 曲调”。 或者,您可以要求它创作“一首带有迷人吉他重复段和有力歌手的迷人流行歌曲”。 在这种情况下,您的想象力是极限。
产生的歌曲类似于人类音乐家创作的歌曲。 MusicLM 的样本非常惊人。 这是真的,尤其是考虑到没有人参与合成过程。 MusicLM 可以重复细微的方面,例如音乐即兴重复段、旋律和情感。 此外,即使给出复杂而明确的规范,它也能正常工作。
重要特征
绘画字幕调理
Painting Caption Conditioning 是一个 MusicLM 函数。 您可以根据文字描述或绘画的“标题”制作音乐。 这意味着 MusicLM 能够创作出能够捕捉图片中表达的情感、心情和想法的音乐。 这种能力对制作电影音乐非常有帮助, 视频游戏, 以及各种视觉媒体。
故事模式
故事模式功能将故事文本作为输入。 因此,它会创建伴随的背景音乐。 用户可以利用此功能通过描述场景或情感基调来为故事、视频游戏或电影制作配乐。
故事模式是媒体艺术家的便捷工具。 因此,它可以产生范围广泛的音乐风格和乐器。 MusicLM 的故事模式可以增加场景的情感影响。 因此,观众可以更加沉浸在故事中。
音乐家经验水平
您可以自定义创作音乐的难度。 用户可以根据自己的技能水平在三个级别之间进行选择。 此外,他们还可以指定首选的复杂程度:初级、中级或高级。
如果您有一点音乐专业知识并想尝试新的作品,此功能将对您有所帮助。 但是,如果您是一位经验丰富的音乐家,则可以创作复杂而微妙的音乐。 MusicLM 使用此功能的目标是为所有用户提供可访问的体验。
世代多样性
使用 Generation Diversity 功能,您可以从同一输入生成一首歌曲的多个版本。 而且,您可以拥有多种输出。 这意味着 AI 可能会生成一首歌曲的多个版本。
此外,还有交替的旋律或和弦进行,同时仍保持歌曲的基本风格和结构。 此功能有助于 AI 的音乐创作更具创意。 因此,它使音乐创作更类似于人类的歌曲创作。
MusicLM 的可能限制
谷歌尚未向公众提供 MusicLM,因为它仍在开发中。 因此,您还不能给出 MusicLM 可以制作的音乐种类的特定样本。 此外,MusicLM 可能有什么限制仍然有点未知。
由于该技术仍处于早期阶段,它可能会对制作的音乐的质量或处理特定输入的能力有一定的限制。
所生产样品的质量失真是主要缺点之一。 这是用于开发 MusicLM 的培训程序的必要副产品。
另一个缺点是,尽管 MusicLM 有制造人声的技术能力。 这包括合唱团歌曲。 MusicLM 制作的“歌词”有时看起来像胡言乱语。 此外,它们可能很难理解。 但是,MusicLM 仍在开发中,这些问题可以得到改善。
最后的评论
最后,我们相信作为 Google MusicLM 基础的技术既有趣又引人入胜。 令人惊讶的是,人工智能可以制作出多种风格的音乐,具有更高的真实感。 MusicLM 有可能改变音乐行业。 而且,我们很高兴看到这项技术如何发展。
发表评论