MetaのMusicGenで AI 音楽を作成する方法

Metaは、テキストの説明を音楽の曲に変換できる別の AI 音楽ジェネレーターであるMusicGenのコードをリリースしました。デモはオンラインで見つけることができ、試すにはブラウザだけで済みます。結果は悪くないですが、それ以上に AI 音楽モデルがどれほど進歩しているかを示しています。

MusicGenと音楽を生成する方法について知っておくべきことを紹介します。

MusicGenとは何ですか?

2023年6月、MetaはMusicGenと呼ばれる AI 音楽生成モデルをリリースしました。単純なテキストの説明から生の音楽を合成するという複雑な問題に取り組んだのは、これが初めてではありません。これまで、OpenAIのジュークボックスで音楽を作成したり、MusicLMで曲のスニペットを生成したりできました。

しかし、コードをオープンソースにしたのはこれが初めてで、メモリが16GB以上のGPUがあれば、コンピューターでソフトウェアをローカルに実行することができます。ただし、11GBで動作させることができました。

ハードウェアがない場合は心配しないでください。ブラウザを使用してMusicGenのウェブアプリを無料で試すことができます。オンラインデモでは、約12秒間のオーディオスニペットを生成するのに1分以上かかります。

MusicGenのサウンドはどのようなものですか?

Metaによると、MusicGenは高品質の音楽サンプルを生成できますが、関与した研究者が高品質を32kHzと定義していることがわかりました。これは、音声合成の要件(16kHz)とデジタル音楽の標準(44.1kHz)の中間あたりにあります。

実際には、オーディオはラジオやストリーミングプラットフォームで聞くのに慣れている最低品質基準を満たしていません。しかし、他の AI 音楽ジェネレーターと比較すると、執筆時点のテクノロジーを考慮すると、オーディオ品質はかなり良く、ファイルのノイズレベルは低いです。

音楽はプロンプトとどのくらい一致していますか?以下に生成した例を聴くと、すぐにわかります。概して、以前のバージョンと比較して、より一貫性のある音楽構造を維持しながら、一般的な音楽ジャンルに準拠しています。

MusicGenを使用して音楽を生成する方法

MusicGenは使いやすく、サインアップは必要ありません。インターフェースもわかりやすく、気軽に試すことができます。

MusicGenで音楽を生成する方法を説明します。

  1. MusicGenのウェブアプリを開きます。
  2. 音楽の説明というタイトルのテキストボックスに、プロンプトを入力します。「アイリッシュフォークの曲」のようにシンプルなものや、楽器、テンポ、ジャンル、感情などを含めて詳細にすることもできます。
  3. 生成ボタンを押してプロセスを開始します。1、2分後、右側の生成された音楽モジュールにオーディオプレーヤーが表示されます。
  4. モジュールにカーソルを合わせてプレーヤーコントロールを表示し、ファイルを聴くか、右上隅のダウンロードアイコンを押してファイルをコンピューターに保存します。.mp4ファイルとしてのみダウンロードできることに注意してください。
  5. 既存のメロディを使用して結果を調整したい場合は、テキストボックスの横にあるモジュールに録音物をアップロードできます。または、マイクを選択してマイクを使用してメロディを録音することもできます。

メロディを条件にすると、テキストの説明と参照として提供したメロディの両方を使用します。これは、MusicGenから得られる結果を形作るために役立つツールです。

MusicGenのオーディオを使用することの制限は何ですか?

MusicGenのコードは、いくつかの制限があるものの、MITライセンスに基づいて自由に配布されています。モデルを使用して生成したオーディオについては、法的ガイドラインがあるかどうかは不明です。代わりに、MetaのMusicGenの使用に関する警告に従うことをお勧めします。

「このモデルは、人々にとって敵対的または疎外的な環境を作り出す音楽作品を意図的に作成または配布するために使用しないでください。これには、人々が不快、苦痛、または不快に思うと予想される音楽を生成すること、または歴史的または現在の固定観念を広めるコンテンツが含まれます。」

Metaはさらに、MusicGenは AI 音楽の生成を探求したい研究者を対象としており、ストリーミングプラットフォームでの AI 音楽のアップロードや配布などの「ダウンストリームの使用」を目的としていないと説明しています。

倫理的な賛否両論は AI アートの生成を反映しています。適切な場合に AI モデルをトレーニングするためにデータを使用する同意を得ることと、アーティストに補償/クレジットを与えるという問題は、Metaが安全策を講じる理由です。

つまり、楽しみのためにモデルを探求することは害を及ぼす可能性は低いですが、商用音楽にオーディオを使用する場合にはより厄介な問題になる可能性があります。多くの人は、 AI を用いたポップミュージックの未来がどうなるのか疑問に思っています。

Metaが別の AI 音楽ジェネレーターを追加

Metaは、そこに存在する音楽生成モデルにさらに別のモデルを追加し、MusicGenをリリースしました。MusicGenは、単純なテキストの説明から生の音楽を生成できるオープンソースの AI モデルです。このテクノロジーを試してみたい場合は、ウェブブラウザだけでデモを試すことができます。