PLUS

生成AIコラム

一覧に戻る

うさぎでもわかる Google Lyria 3 Pro

はじめに

「AIが音楽を作る」と聞いて、あなたはどんなイメージを持っていますか?

ほんの1年前まで、AI音楽生成といえばせいぜい30秒のジングルや単調なループが限界でした。ところが2026年3月、AI作曲の世界に大きな転換点が訪れました。Google DeepMindが「Lyria 3 Pro」を発表し、テキストの指示だけで最大3分のボーカル付きフル楽曲を生成できるようになったのです。

しかも同じ週に、AI作曲の先駆者であるSunoもv5.5をリリース。自分の声を歌わせる「Voices」機能を搭載するなど、AI作曲ツール同士の競争がかつてないほど激化しています。

以前、noteでACE-Step 1.5についての記事を書き、ローカルで動くオープンソースのAI音楽生成を紹介しました。今回はその対極にあるGoogleのクラウドベースの本格AIツールを深掘りしていきます。

AI音楽生成ツールは「得意分野」がツールごとにはっきり分かれています。万能なツールはまだ存在しないので、使い分けが大事うさよ🐰

生成AIの社内利用をお考えの企業様へ 
ナレフルチャットは初心者でも使いやすい設計で、組織全体への生成AI浸透を支援するツールです。プロンプト自動生成機能や社内共有機能により、AIリテラシーに差があっても全員が活用できます。企業のAI導入を検討している方は、こちらをご覧ください。

Lyria 3 Proとは

Google DeepMindが開発した最新のAI音楽生成モデルで、テキストプロンプトから最大3分のフル楽曲を生成できるうさよ🐰

Lyriaモデルファミリーの全体像

Lyria 3 Proは単体のモデルではなく、Lyriaファミリーの一員です。全体像を把握しておきましょう。

モデルモデルIDトラック長出力形式用途
Lyria 2lyria-002約33秒WAV旧世代(Vertex AI経由)
Lyria 3 Cliplyria-3-clip-preview30秒MP3BGM・ループ素材・プロトタイプ
Lyria 3 Prolyria-3-pro-preview最大約3分MP3 / WAVフルレングス楽曲生成
Lyria RealTimeリアルタイムインタラクティブ音楽生成

Lyria 3が30秒のクリップ生成だったのに対し、Lyria 3 Proでは一気に6倍の3分まで伸びました。これは「サンプル」から「作品」に近づく大きな一歩です。

公式ドキュメント – Lyria 3 モデルファミリー

主な特徴

1. 楽曲構造の理解と制御

Lyria 3 Proの最大の特徴は「構造を理解している」ことです。プロンプトでイントロ・ヴァース・コーラス・ブリッジ・アウトロを指定すると、各セクションに合った音楽的特徴を自動で反映してくれます。たとえばコーラスはよりエネルギッシュでフックのある展開に、ブリッジはハーモニーに変化をつけた展開になります。

2. マルチモーダル入力

テキストプロンプトだけでなく、画像を入力してその雰囲気に合った楽曲を生成することもできます。旅行先の写真を渡せば、その風景にマッチしたBGMが出てくるイメージです。

3. 48kHzステレオの高音質出力

出力は48kHzのステレオ音声。公式ドキュメントでは「high-fidelity stereo audio」と表現されており、複数のレビューでも楽器の分離感やダイナミクスの表現力に高い評価がつけられています。

4. 複数言語のボーカル・歌詞対応

複数言語のボーカルに対応しています。公式ドキュメントでは「Lyria 3 generates lyrics in the language of your prompt」と案内されており、プロンプトの言語に合わせてボーカルスタイルと発音を自動で適応してくれます。フランス語のプロンプト例なども公式に掲載されています。

5. SynthID電子透かし

生成されたすべての楽曲にはGoogleの「SynthID」が自動埋め込みされます。人間の耳には聞こえませんが、AI生成コンテンツであることを技術的に検出できる仕組みです(公式ブログ)。

利用可能なプラットフォーム

Lyria 3 Proは1つのアプリだけでなく、Google全体のエコシステムに組み込まれています。

プラットフォーム対象ユーザー特徴
GeminiアプリGoogle AI有料プラン加入者最も手軽。思考モードで高品質生成
Google AI Studio開発者プレイグラウンドで試せる。APIテストに最適
Gemini API開発者自アプリに音楽生成を組み込める
Vertex AIエンタープライズVPC制御・IAM統合などセキュリティ充実
Google VidsWorkspace / AI Pro・Ultraユーザー動画にカスタムBGMを直接追加
ProducerAI全ユーザー(無料・有料)Agent型の対話式音楽制作。元Riffusion

まず試してみたいだけならProducerAIが無料で使えるのでおすすめです。がっつり使いこなしたいなら、GeminiアプリのPro以上がいい感じうさよ🐰

できること・できないこと

強みと制限をセットで知っておくのが大事うさよ🐰 万能なツールは存在しないので、「これは得意」「これは苦手」を把握した上で活用しましょう。

できること

楽曲構造を指定したフルソング生成
イントロ → Aメロ → Bメロ → サビ → 間奏 → サビ → アウトロ、のように具体的な構成をプロンプトに書くと、その通りの展開で曲が生成されます。これは他のAI作曲ツールと比べても際立った強みです。

ジャンル・楽器・ボーカルの詳細指定
「80年代シンセポップで、歪んだベースラインとサックスソロ、しわがれたロッカーの男性ボーカル」のように具体的に書けば書くほど、プロンプトの意図が反映されやすくなります。Google公式は「5つの要素」を推奨しています。

  1. ジャンルと時代
  2. テンポとリズム
  3. 楽器
  4. ボーカル
  5. 歌詞

画像からのBGM生成
風景写真やイラストを添付すると、その雰囲気を読み取ってBGMを生成します。中国メディア「智東西」の実測レポートでは、海辺の写真から海鳥の鳴き声や波音をホワイトノイズとして取り入れたトラックが生成されたとのこと。

高速な生成スピード
3分の楽曲が3分以下で完成します。AIが「じっくり考える」思考モードでも、数分で結果が返ってきます。

Googleエコシステムとの深い連携
Google Vidsで動画のBGMを直接生成したり、Gemini APIでアプリに音楽生成機能を組み込んだりと、Googleサービスとの統合がスムーズです。

できないこと

「ここから先は注意ポイントうさよ。知らずに使うとがっかりするかもしれないので、先に把握しておいてね🐰」

生成後の部分編集ができない
シングルターン処理のみ対応しています(公式ドキュメント – Limitations)。「サビだけやり直して」「ギターソロをもう少し長く」といった部分修正はできません。気に入らなかったら、プロンプトを調整して丸ごと再生成する必要があります。

ステム分離・MIDI出力には非対応
生成された楽曲をボーカル/ドラム/ベースなどのトラック別に書き出す機能はありません。DAWで細かく編集したい場合は、出力をAbleton LiveやLogic Proに取り込んで加工する必要があります。

同じプロンプトでも毎回結果が異なる
再現性はありません。同じテキストを入力しても毎回違う曲が出てきます。「さっきの良かったのにもう一度!」は通用しないので、気に入った曲はすぐにダウンロードしておきましょう。

日本語ボーカルの発音精度に課題
複数のレビューで「日本語の発音がまだ不自然」という指摘があります。英語のボーカルと比べると、まだ改善の余地がある段階です。

入力した歌詞が忠実に歌われないケースがある
これは結構大きな問題として報告されています。歌詞を指定しても、Lyria 3 Proが「似たテーマの別の歌詞」に差し替えてしまうことがあるのです。UX Tigersのレビューでは、Jakob Nielsen氏が「自分の歌詞が歌われないのでは使いものにならない」と厳しく評価しています。

歌詞をそのまま歌わせたい場合はSunoの方が忠実度が高いです。Lyria 3 Proは「おまかせ作曲」の方が得意な印象うさよ🐰

歌詞の後入れ・ペルソナ設定は未搭載
Suno v5.5にある「自分の声を登録して歌わせるVoices機能」や「カスタムモデル」に相当する機能はまだありません。

プレビュー版
2026年4月時点でまだプレビュー版です。仕様やAPI料金が変更される可能性があるので、本番環境に組み込む際は注意が必要です。

法人向け生成AIサービス「ナレフルチャット」なら、Geminiをはじめ、ChatGPT・Claudeなど主要AIモデルをひとつのプラットフォームで使い分けることができます。
また、料金プランは企業単位の定額制を採用しており、何人で利用しても追加のコストは発生しないため、コスト管理の手間がかからないスムーズな全社導入を実現できます。
初月無料で生成AIが利用できるトライアル期間も用意しておりますので、生成AIの利活用を検討している企業様は、是非一度導入をご検討ください。

実際に触ってみた

百聞は一聴にしかず! 実際にLyria 3 Proで曲を作ってみたうさよ🐰

例1. 歌詞を考えて3分のフルソングを作る

ProducerAIで、自分で書いた歌詞付きの3分フルソングに挑戦してみました。

使ったプロンプト

春の訪れをテーマにした明るいJ-POPを作って。3分のフルソングで。
アップテンポで、アコースティックギターとピアノ伴奏、爽やかな女性ボーカル。
イントロ→Aメロ→Bメロ→サビ→間奏→サビ→アウトロの構成で。

歌詞:
(Aメロ)
朝の光が窓を叩いて 新しい一日が始まる
カバンに夢を詰め込んで 走り出す坂道の上

(Bメロ)
まだ見ぬ景色の向こうへ 一歩ずつ近づいてく
怖くないよ 隣にいるから

(サビ)
桜が舞う空の下で 手を繋いで歌おう
どんな明日が来ても きっと笑っていられる
桜が舞う空の下で 夢の続きを描こう

生成結果

例2. AIで生成した画像からイメージBGMを作る

ProducerAIは画像入力にも対応しています。今回はGeminiのNano Bananaモデルで画像を生成し、その画像からBGMを作るという「AI×AI」の連携を試してみました。

ステップ1 – Nano Bananaで画像を生成

まずGeminiアプリで以下のプロンプトを使い、BGMのイメージとなる画像を生成します。

夕暮れの東京の裏路地にあるレトロな喫茶店。
窓からオレンジ色の光が漏れていて、
カウンターにはコーヒーカップとレコードプレーヤーが置いてある。
ネオンサインが少しだけ光っている。フィルム写真風。

ステップ2 – 生成した画像からBGMを作成

生成された画像をProducerAIに添付して、BGMを作ります。

[ステップ1で生成した画像を添付]
この画像の雰囲気に合った3分のインストゥルメンタルBGMを作って。
Lo-fiチルホップスタイルで、ゆったりしたビート、
ジャジーなピアノ、温かみのあるベースラインで。
カフェで流れていそうなリラックスした曲にして。

生成結果

AI作曲ツール比較

「結局どれを使えばいいの?」を整理するうさよ🐰

AI音楽生成ツールは2026年に入って急速に進化しています。ここではLyria 3 Proの競合となる主要3ツールを紹介します。

各ツールの個性を深掘り

Suno v5.5 – ボーカルの王様

2026年3月26日にリリースされたSuno v5.5は「最も表現力のあるモデル」を謳っています(公式ブログ)。最大の新機能は3つ。

  • Voices … 自分の声を録音・アップロードして、その声で歌わせることができる(Pro/Premierのみ)
  • Custom Models … 自分のオリジナル曲をアップロードして、自分のスタイルを学習させたモデルを作れる(最大3つ)
  • My Taste … 使い続けるとユーザーの好みを学習し、好みに寄せた生成をしてくれる

ボーカルの自然さとポップス系の完成度ではSunoが頭一つ抜けています。一方で、クラシックやオーケストラ系はv5.5でやや手薄になったという声もあります。

「歌もの」を作りたいならSunoが一番。歌詞の忠実度もLyria 3 Proより高いです🐰

Udio – 音質の職人

48kHzのスタジオグレード出力で、特にジャズ・クラシック・アンビエント系の音質に定評があります。ステム分離機能があるため、生成後にボーカル・ドラム・ベース・その他のトラックを個別に書き出せるのが強み。プロのワークフローに組み込みやすいツールです。1回の生成は最大2分10秒ですが、Extend機能で最大15分まで延長可能です(公式ヘルプ)。

ACE-Step 1.5 – ローカルの自由人

以前の記事で詳しく紹介しましたが、ACE-Step 1.5はローカルPCで動作するオープンソースモデルです。Apache 2.0ライセンスなので商用利用も自由。50言語以上に対応し、LoRAによるスタイルカスタマイズも可能。VRAM 4GB未満のPCでも動作します。クラウドサービスに依存したくない人や、モデルを自分好みにカスタマイズしたい人に最適です。

実は「1つに絞る」より「組み合わせる」のが正解でした。Lyria 3 Proで素早くBGMのプロトタイプを作り、気に入ったものをSunoで歌入りに仕上げる、といった使い分けが効率的です🐰

まとめ

お疲れ様でした! ここまで来れば、Lyria 3 Proの全体像はバッチリ把握できたはずです🐰

Lyria 3 Proの強み

  • 「構造を理解した」音楽生成は、現時点で最も緻密な制御が可能
  • Googleエコシステム(Gemini / Vids / Vertex AI / API)との統合がスムーズ
  • 許諾データでの学習 + SynthID透かしで、著作権面の透明性が業界最高水準
  • Gemini有料プランに加入済みなら追加コストなしで利用可能

まだ発展途上な部分

  • ボーカルの品質・歌詞の忠実度ではSuno v5.5に軍配
  • 日本語ボーカルの発音精度は改善の余地あり
  • 部分編集やステム分離など、プロ向けの編集機能は未搭載
  • プレビュー版のため仕様変更の可能性

結論

AI音楽生成は2026年に入って「おもちゃ」から「実用ツール」へと確実に進化しています。Lyria 3 Proはその中でも「構造制御」と「エコシステム統合」という独自のポジションを確立しました。

ただし、万能なツールはまだ存在しません。ボーカル重視ならSuno、ローカルの自由度ならACE-Step、音質の極みならUdioと、それぞれに得意分野があります。

大事なのは「どのツールが最強か」ではなく「自分の用途に合ったツールをどう組み合わせるか」。AI作曲ツールをクリエイターの新しい武器として、ぜひ活用してみてください🐰

参考リンク

あなたも生成AIの活用、始めてみませんか? 

生成AIを使った業務効率化を、今すぐ始めるなら
「初月基本料0円」「ユーザ数無制限」のナレフルチャット!
生成AIの利用方法を学べる「公式動画」や、「プロンプトの自動生成機能」を使えば
知識ゼロの状態からでも、スムーズに生成AIの活用を始められます。

アバター画像

taku_sid

https://x.com/taku_sid
AIエージェントマネジメント事務所「r488it」を創立し、うさぎエージェントをはじめとする新世代のタレントマネジメント事業を展開。AI技術とクリエイティブ表現の新たな可能性を探求しながら、次世代のエンターテインメント産業の構築に取り組んでいます。
ブログでは一つのテーマから多角的な視点を展開し、読者に新しい発見と気づきを提供するアプローチで、テックブログやコンテンツ制作に取り組んでいます。「知りたい」という人間の本能的な衝動を大切にし、技術の進歩を身近で親しみやすいものとして伝えることをミッションとしています。

ナレフルチャットアプリアイコン

スマートフォンでもAI活用!

アプリ版「ナレフルチャット」配信中

ナレフル_アプリ使用イメージ

iPhoneはこちら

App Store
iPhone QRコード

Androidはこちら

Google Play
Android QRコード
App Store App Store
Page Top