PLUS

生成AIコラム

一覧に戻る 2026年04月15日

うさぎでもわかる Google Lyria 3 Pro

はじめに
Lyria 3 Proとは
できること・できないこと
実際に触ってみた
AI作曲ツール比較
まとめ

はじめに

「AIが音楽を作る」と聞いて、あなたはどんなイメージを持っていますか？

ほんの1年前まで、AI音楽生成といえばせいぜい30秒のジングルや単調なループが限界でした。ところが2026年3月、AI作曲の世界に大きな転換点が訪れました。Google DeepMindが「Lyria 3 Pro」を発表し、テキストの指示だけで最大3分のボーカル付きフル楽曲を生成できるようになったのです。

しかも同じ週に、AI作曲の先駆者であるSunoもv5.5をリリース。自分の声を歌わせる「Voices」機能を搭載するなど、AI作曲ツール同士の競争がかつてないほど激化しています。

以前、noteでACE-Step 1.5についての記事を書き、ローカルで動くオープンソースのAI音楽生成を紹介しました。今回はその対極にあるGoogleのクラウドベースの本格AIツールを深掘りしていきます。

AI音楽生成ツールは「得意分野」がツールごとにはっきり分かれています。万能なツールはまだ存在しないので、使い分けが大事うさよ🐰

生成AIの社内利用をお考えの企業様へ 
ナレフルチャットは初心者でも使いやすい設計で、組織全体への生成AI浸透を支援するツールです。プロンプト自動生成機能や社内共有機能により、AIリテラシーに差があっても全員が活用できます。企業のAI導入を検討している方は、こちらをご覧ください。

Lyria 3 Proとは

Google DeepMindが開発した最新のAI音楽生成モデルで、テキストプロンプトから最大3分のフル楽曲を生成できるうさよ🐰

Lyriaモデルファミリーの全体像

Lyria 3 Proは単体のモデルではなく、Lyriaファミリーの一員です。全体像を把握しておきましょう。

モデル	モデルID	トラック長	出力形式	用途
Lyria 2	`lyria-002`	約33秒	WAV	旧世代（Vertex AI経由）
Lyria 3 Clip	`lyria-3-clip-preview`	30秒	MP3	BGM・ループ素材・プロトタイプ
Lyria 3 Pro	`lyria-3-pro-preview`	最大約3分	MP3 / WAV	フルレングス楽曲生成
Lyria RealTime	–	リアルタイム	–	インタラクティブ音楽生成

Lyria 3が30秒のクリップ生成だったのに対し、Lyria 3 Proでは一気に6倍の3分まで伸びました。これは「サンプル」から「作品」に近づく大きな一歩です。

公式ドキュメント – Lyria 3 モデルファミリー

主な特徴

1. 楽曲構造の理解と制御

Lyria 3 Proの最大の特徴は「構造を理解している」ことです。プロンプトでイントロ・ヴァース・コーラス・ブリッジ・アウトロを指定すると、各セクションに合った音楽的特徴を自動で反映してくれます。たとえばコーラスはよりエネルギッシュでフックのある展開に、ブリッジはハーモニーに変化をつけた展開になります。

2. マルチモーダル入力

テキストプロンプトだけでなく、画像を入力してその雰囲気に合った楽曲を生成することもできます。旅行先の写真を渡せば、その風景にマッチしたBGMが出てくるイメージです。

3. 48kHzステレオの高音質出力

出力は48kHzのステレオ音声。公式ドキュメントでは「high-fidelity stereo audio」と表現されており、複数のレビューでも楽器の分離感やダイナミクスの表現力に高い評価がつけられています。

4. 複数言語のボーカル・歌詞対応

複数言語のボーカルに対応しています。公式ドキュメントでは「Lyria 3 generates lyrics in the language of your prompt」と案内されており、プロンプトの言語に合わせてボーカルスタイルと発音を自動で適応してくれます。フランス語のプロンプト例なども公式に掲載されています。

5. SynthID電子透かし

生成されたすべての楽曲にはGoogleの「SynthID」が自動埋め込みされます。人間の耳には聞こえませんが、AI生成コンテンツであることを技術的に検出できる仕組みです（公式ブログ）。

利用可能なプラットフォーム

Lyria 3 Proは1つのアプリだけでなく、Google全体のエコシステムに組み込まれています。

プラットフォーム	対象ユーザー	特徴
Geminiアプリ	Google AI有料プラン加入者	最も手軽。思考モードで高品質生成
Google AI Studio	開発者	プレイグラウンドで試せる。APIテストに最適
Gemini API	開発者	自アプリに音楽生成を組み込める
Vertex AI	エンタープライズ	VPC制御・IAM統合などセキュリティ充実
Google Vids	Workspace / AI Pro・Ultraユーザー	動画にカスタムBGMを直接追加
ProducerAI	全ユーザー（無料・有料）	Agent型の対話式音楽制作。元Riffusion

まず試してみたいだけならProducerAIが無料で使えるのでおすすめです。がっつり使いこなしたいなら、GeminiアプリのPro以上がいい感じうさよ🐰

できること・できないこと

強みと制限をセットで知っておくのが大事うさよ🐰 万能なツールは存在しないので、「これは得意」「これは苦手」を把握した上で活用しましょう。

できること

楽曲構造を指定したフルソング生成
イントロ → Aメロ → Bメロ → サビ → 間奏 → サビ → アウトロ、のように具体的な構成をプロンプトに書くと、その通りの展開で曲が生成されます。これは他のAI作曲ツールと比べても際立った強みです。

ジャンル・楽器・ボーカルの詳細指定
「80年代シンセポップで、歪んだベースラインとサックスソロ、しわがれたロッカーの男性ボーカル」のように具体的に書けば書くほど、プロンプトの意図が反映されやすくなります。Google公式は「5つの要素」を推奨しています。

ジャンルと時代
テンポとリズム
楽器
ボーカル
歌詞

画像からのBGM生成
風景写真やイラストを添付すると、その雰囲気を読み取ってBGMを生成します。中国メディア「智東西」の実測レポートでは、海辺の写真から海鳥の鳴き声や波音をホワイトノイズとして取り入れたトラックが生成されたとのこと。

高速な生成スピード
3分の楽曲が3分以下で完成します。AIが「じっくり考える」思考モードでも、数分で結果が返ってきます。

Googleエコシステムとの深い連携
Google Vidsで動画のBGMを直接生成したり、Gemini APIでアプリに音楽生成機能を組み込んだりと、Googleサービスとの統合がスムーズです。

できないこと

「ここから先は注意ポイントうさよ。知らずに使うとがっかりするかもしれないので、先に把握しておいてね🐰」

生成後の部分編集ができない
シングルターン処理のみ対応しています（公式ドキュメント – Limitations）。「サビだけやり直して」「ギターソロをもう少し長く」といった部分修正はできません。気に入らなかったら、プロンプトを調整して丸ごと再生成する必要があります。

ステム分離・MIDI出力には非対応
生成された楽曲をボーカル/ドラム/ベースなどのトラック別に書き出す機能はありません。DAWで細かく編集したい場合は、出力をAbleton LiveやLogic Proに取り込んで加工する必要があります。

同じプロンプトでも毎回結果が異なる
再現性はありません。同じテキストを入力しても毎回違う曲が出てきます。「さっきの良かったのにもう一度！」は通用しないので、気に入った曲はすぐにダウンロードしておきましょう。

日本語ボーカルの発音精度に課題
複数のレビューで「日本語の発音がまだ不自然」という指摘があります。英語のボーカルと比べると、まだ改善の余地がある段階です。

入力した歌詞が忠実に歌われないケースがある
これは結構大きな問題として報告されています。歌詞を指定しても、Lyria 3 Proが「似たテーマの別の歌詞」に差し替えてしまうことがあるのです。UX Tigersのレビューでは、Jakob Nielsen氏が「自分の歌詞が歌われないのでは使いものにならない」と厳しく評価しています。

歌詞をそのまま歌わせたい場合はSunoの方が忠実度が高いです。Lyria 3 Proは「おまかせ作曲」の方が得意な印象うさよ🐰

歌詞の後入れ・ペルソナ設定は未搭載
Suno v5.5にある「自分の声を登録して歌わせるVoices機能」や「カスタムモデル」に相当する機能はまだありません。

プレビュー版
2026年4月時点でまだプレビュー版です。仕様やAPI料金が変更される可能性があるので、本番環境に組み込む際は注意が必要です。

法人向け生成AIサービス「ナレフルチャット」なら、Geminiをはじめ、ChatGPT・Claudeなど主要AIモデルをひとつのプラットフォームで使い分けることができます。
また、料金プランは企業単位の定額制を採用しており、何人で利用しても追加のコストは発生しないため、コスト管理の手間がかからないスムーズな全社導入を実現できます。
初月無料で生成AIが利用できるトライアル期間も用意しておりますので、生成AIの利活用を検討している企業様は、是非一度導入をご検討ください。

色々なAIモデルを使い分けて業務を効率化する！

実際に触ってみた

百聞は一聴にしかず！実際にLyria 3 Proで曲を作ってみたうさよ🐰

例1. 歌詞を考えて3分のフルソングを作る

ProducerAIで、自分で書いた歌詞付きの3分フルソングに挑戦してみました。

使ったプロンプト

春の訪れをテーマにした明るいJ-POPを作って。3分のフルソングで。
アップテンポで、アコースティックギターとピアノ伴奏、爽やかな女性ボーカル。
イントロ→Aメロ→Bメロ→サビ→間奏→サビ→アウトロの構成で。

歌詞:
(Aメロ)
朝の光が窓を叩いて 新しい一日が始まる
カバンに夢を詰め込んで 走り出す坂道の上

(Bメロ)
まだ見ぬ景色の向こうへ 一歩ずつ近づいてく
怖くないよ 隣にいるから

(サビ)
桜が舞う空の下で 手を繋いで歌おう
どんな明日が来ても きっと笑っていられる
桜が舞う空の下で 夢の続きを描こう

生成結果

例2. AIで生成した画像からイメージBGMを作る

ProducerAIは画像入力にも対応しています。今回はGeminiのNano Bananaモデルで画像を生成し、その画像からBGMを作るという「AI×AI」の連携を試してみました。

ステップ1 – Nano Bananaで画像を生成

まずGeminiアプリで以下のプロンプトを使い、BGMのイメージとなる画像を生成します。

夕暮れの東京の裏路地にあるレトロな喫茶店。
窓からオレンジ色の光が漏れていて、
カウンターにはコーヒーカップとレコードプレーヤーが置いてある。
ネオンサインが少しだけ光っている。フィルム写真風。

ステップ2 – 生成した画像からBGMを作成

生成された画像をProducerAIに添付して、BGMを作ります。

[ステップ1で生成した画像を添付]
この画像の雰囲気に合った3分のインストゥルメンタルBGMを作って。
Lo-fiチルホップスタイルで、ゆったりしたビート、
ジャジーなピアノ、温かみのあるベースラインで。
カフェで流れていそうなリラックスした曲にして。

生成結果

AI作曲ツール比較

「結局どれを使えばいいの？」を整理するうさよ🐰

AI音楽生成ツールは2026年に入って急速に進化しています。ここではLyria 3 Proの競合となる主要3ツールを紹介します。

各ツールの個性を深掘り

Suno v5.5 – ボーカルの王様

2026年3月26日にリリースされたSuno v5.5は「最も表現力のあるモデル」を謳っています（公式ブログ）。最大の新機能は3つ。

Voices … 自分の声を録音・アップロードして、その声で歌わせることができる（Pro/Premierのみ）
Custom Models … 自分のオリジナル曲をアップロードして、自分のスタイルを学習させたモデルを作れる（最大3つ）
My Taste … 使い続けるとユーザーの好みを学習し、好みに寄せた生成をしてくれる

ボーカルの自然さとポップス系の完成度ではSunoが頭一つ抜けています。一方で、クラシックやオーケストラ系はv5.5でやや手薄になったという声もあります。

「歌もの」を作りたいならSunoが一番。歌詞の忠実度もLyria 3 Proより高いです🐰

Udio – 音質の職人

48kHzのスタジオグレード出力で、特にジャズ・クラシック・アンビエント系の音質に定評があります。ステム分離機能があるため、生成後にボーカル・ドラム・ベース・その他のトラックを個別に書き出せるのが強み。プロのワークフローに組み込みやすいツールです。1回の生成は最大2分10秒ですが、Extend機能で最大15分まで延長可能です（公式ヘルプ）。

ACE-Step 1.5 – ローカルの自由人

以前の記事で詳しく紹介しましたが、ACE-Step 1.5はローカルPCで動作するオープンソースモデルです。Apache 2.0ライセンスなので商用利用も自由。50言語以上に対応し、LoRAによるスタイルカスタマイズも可能。VRAM 4GB未満のPCでも動作します。クラウドサービスに依存したくない人や、モデルを自分好みにカスタマイズしたい人に最適です。