本記事では、MusicGenと呼ばれる機械学習手法を用いて、テキストから音楽を生成する方法をご紹介します。
MusicGen
概要
MusicGenは、Meta社が公開したText to Musicモデルです。テキストプロンプトに即した音楽を生成します。
AudioCraftと呼ばれるオーディオ生成スイートの一機能に属しており、MusicGenの他に、テキストで指定したオーディオを生成するAudioGenが存在します。
詳細はこちらのAudioCraftの公式サイトをご参照ください。
本記事では上記手法を用いて、テキストから音楽を生成していきます。
デモ(Colaboratory)
それでは、実際に動かしながらText to Musicを動かしていきます。
ソースコードは本記事にも記載していますが、下記のGitHubでも取得可能です。
GitHub - Colaboratory demo
また、下記から直接Google Colaboratoryで開くこともできます。
なお、このデモはPythonで実装しています。
Pythonの実装に不安がある方、Pythonを使った機械学習について詳しく勉強したい方は、以下の書籍やオンライン講座などがおすすめです。
おすすめの書籍
[初心者向け] Pythonで機械学習を始めるまでに読んだおすすめ書籍一覧
本記事では、現役機械学習エンジニアとして働く筆者が実際に読んだ書籍の中でおすすめの書籍をレベル別に紹介しています。
おすすめのオンライン講座
[初心者向け] 機械学習がゼロから分かるおすすめオンライン講座
本記事では、機械学習エンジニアとして働く筆者が、AI・機械学習をまったく知らない方でも取り組みやすいおすすめのオンライン講座をご紹介しています。
環境セットアップ
それではセットアップしていきます。 Colaboratoryを開いたら下記を設定しGPUを使用するようにしてください。
初めににライブラリをインストールします。
最後にライブラリをインポートします。
以上で環境セットアップは完了です。
学習済みモデルのセットアップ
ここでは、HuggingFaceからモデルをダウンロードし、メモリにロードします。
Text to Music
それでは、テキストから音楽を生成をします。
初めに生成する音楽の時間を設定します。
続いて、テキストプロンプトを設定します。
Text to musicを実行します。
生成結果は以下の通りです。
#MusicGen を用いて、テキストから音楽を生成いてみました。
— 12kaz (@12_technology) September 11, 2023
以下は
「Solid sound that makes you feel Japanese tradition」
から生成した音楽です
Google Colabでお試しいただけますhttps://t.co/1mIH8O8O5n pic.twitter.com/GSdzMzUhKZ
#MusicGen を用いて
— 12kaz (@12_technology) September 11, 2023
Text to Musicを試してみました。
以下は
「crazy piano jazz」から生成した音楽です。
Google Colabでお試しいただけますhttps://t.co/1mIH8O8O5n#Python #GenerativeAI #AIart pic.twitter.com/WlIHfW4PSG
まとめ
本記事では、MusicGenを用いてテキストから音楽を生成する方法をご紹介しました。
また本記事では、機械学習を動かすことにフォーカスしてご紹介しました。
もう少し学術的に体系立てて学びたいという方には以下の書籍などがお勧めです。ぜひご一読下さい。
また動かせるだけから理解して応用できるエンジニアの足掛かりに下記のUdemyなどもお勧めです。
0 件のコメント :
コメントを投稿