AWSの新動画生成AI「Amazon Nova Reel」を試してみた

2024年12月15日

ディーメイク Advent Calendar 2024 12/9の記事です。

こんにちは。 mori です。

2024年12月2日から6日にかけて、ラスベガスで開催されたAWS re:Invent 2024では、多くのエンジニアにとって刺激的なアップデートが発表されました。特に生成AI関連の進展が目覚ましく、Amazon QやAmazon Bedrockの新機能が多かったように思いました。

その中でも、Amazonが独自に開発した基盤モデル群「Amazon Nova」の発表がありました。
これらのモデルは、Amazonの生成AIサービスであるAmazon Bedrock上で提供され、企業向けに最適化されています。

Amazon Novaのモデル構成

Amazon Novaは、以下のモデルで構成されています：

Amazon Nova Micro：テキストのみを処理するモデルで、非常に低コストかつ低レイテンシーの応答を提供します。
Amazon Nova Lite：テキスト、画像、動画の入力に対応したマルチモーダルモデルで、低コストかつ高速な処理が可能です。
Amazon Nova Pro：精度、速度、コストのバランスが取れた高性能なマルチモーダルモデルで、幅広いタスクに対応します。
Amazon Nova Premier：最も高度なマルチモーダルモデルで、複雑な推論タスクやカスタムモデルの教師として最適です。※2025年第1四半期に利用可能となる予定です。

さらに、以下のクリエイティブコンテンツ生成モデルも提供されています：

Amazon Nova Canvas：テキストからスタジオ品質の画像を生成するモデルです。
Amazon Nova Reel：テキストからスタジオ品質の動画を生成するモデルです。

Amazon Novaの特徴

Amazon Novaは、200以上の言語に対応し、テキスト生成、画像・動画の理解と生成など、多様な生成AIタスクを高精度かつ高速に実行できます。特に、他のモデルと比較して75%のコスト削減を実現しており、企業が生成AIを活用する際のコスト効率を大幅に向上させます。

Amazon Nova Reelを試してみる

今までのAmazon Brdrockで扱えるモデルに、動画生成はまだなかったと思います。
いよいよAWS が動画生成AIの領域にまで手を出してきたか！と思い、気になったので試してみてみました。

モデルの準備

まずは使う前にモデルを有効化していきます。Amazon Bedrockの左メニューの下部にある [Bedrock configurations] - [モデルアクセス]をクリックします。

[モデルアクセスを変更]をクリックし、モデル一覧の中から[Amazon] - [Nova Reel] を選択します。

確認画面が表示されますので、「送信」を押します。　こちらのモデルはすぐにアクセス権が付与されるのでこれで使うことができます。

モデルのアクティベーションができました。

Amazon Bedrockの画面からプレイグラウンドの[Image / Video] を選択し、モデルを選びます。

下記のように、カテゴリ：Amazon、モデル：Nova Reelを適用します。

初回起動時は、生成されたファイルを格納するためのS3を作成しますので、そのための確認メッセージが表示されました。

これで、準備ができました。

なお、「Action」の設定項目から動画の長さやサイズなどを選択できるようです。ただ、現在作成できる動画の長さは6秒のみのようです。
今後のアップデートに期待したいところですね。

使ってみよう！

それでは、動画を作成していきましょう。

プロンプトに入力して、実行を押します。おおよそ5分ほどで動画が作成されます。

推論イメージに画像をアップロードすれば、その画像をもとに動きをつけた動画を作成してくれます。（余談ですが、このわんちゃんの写真もNova Canvasでサクッと作成しました）

プロンプトでは、走り回る動画としたのですが、残念ながら顔が動くのみでした。（英語にしても同じでした）
かわいいはかわいいのですが、少しぎこちなく感じる動画ですね。

ちなみに、その他にも「ウインクして」などいろいろと試しましたが、なぜか口が横にまがってしまったりや口が二つになるなど、見せられないレベルのちょっとしたホラー動画ができてしまいました。。。

プロンプトの書き方などでコツが必要なのか、サービスが出たばかりなので使い方も踏まえて、品質の向上はこれからなのでしょう。
よくなっていくことを期待したいですね。

おまけ

人の描写はどうなのかなと思って、「美人の日本人女性が笑いかけてくれる」というプロンプトで作成してみました。

今後の展開

Amazon Nova Reelの今後のアップデート予定について、以下の新機能が追加される予定です。

近日公開予定の高度な機能（Coming Soon: Advanced Features）

長尺動画対応: 現在の最大6秒から、最大2分（120秒）までの動画生成が可能になります。
- ストーリーボード機能: 複数のシーンを統合し、シーン間の一貫性を保持する機能が追加されます。
高解像度対応: 1080p（1920x1080）の高解像度動画の生成に対応します。
動画編集機能の強化:
- 高度な編集機能の追加: より洗練された動画編集が可能になります。
- 既存の動画編集ソフトとの連携強化: 他の動画編集ツールとの互換性が向上します。
人物表現の改善:
- 自然な動きの表現: 人物の動きがよりリアルに表現されます。
- 表情やジェスチャーの改善: キャラクターの表情や身振りがより豊かになります。
- 人物の一貫性の向上: 同一人物の特徴が動画全体で統一されます。

これらの新機能により、Amazon Nova Reelはさらに多彩で高品質な動画生成が可能となり、クリエイターや企業のニーズに応えることが期待されています。

さらにAmazonは、2025年に音声入力に対して音声で応答する「Amazon Nova Speech-to-Speech」モデルや、テキスト、音声、画像、動画などのマルチモーダル入力と出力に対応する「Amazon Nova Any-to-Any」モデルのリリースを予定しています。これらの新モデルの登場により、Amazon Novaはさらに多様な生成AIタスクに対応し、企業のニーズに応えることが期待されています。

まとめ

Amazon Bedrockを介して利用できるため、非常にスムーズに試すことができました。手軽にさまざまな機能を試せる点が、Amazon Bedrockの大きな魅力ですね。

6秒程度の動画生成に約5分の待ち時間が発生しましたが、少し長く感じました。しかし、自分がアップロードした画像を基に動画を生成できるのは非常に興味深い体験でした。プロンプトの精度や使い勝手が向上すれば、さらに楽しみが増すことでしょう。これまで触れたことのない動画生成技術に触れることができ、非常に面白かったです。

さいごに、1日いろいろ試してみてかかった料金です。（$9ドル弱でしたが、クレジットで相殺できました）

文具女子博2024レポート

はじめに　みなさんこんにちは。　ディーメイクスタッフのFです。　文具の大展示会。文具女子博2024に行ってきましたので、とても簡単なレポートを掲げさせていただきます。　横浜駅に向かう　ちなみに鎌倉等長距離に行くときは私は少しだけ日常と差別化した感じを出したいので、グリーン車を使っています。今回は平日でしたので、若干割安です。ただ、東京駅に行くまではほぼ満席の状態でした。そこを境にしてガラガラになったのですが。いしのなかにいる　横須賀線で横浜駅に到着。日本のサクラダファミリアを抜けていきます。実 ...

AI AWS 開発者ブログ

2023/11/21

PartyRockを試す

こんにちは、CTOのsakasaiです。先日AWSから以下のサービスがリリースされました PartyRockhttps://partyrock.aws/ AWS公式ブログでも紹介記事が出ています。 PartyRock : 誰でも生成系 AI のアプリケーションを作成し共有できるサービスhttps://aws.amazon.com/jp/blogs/news/create-generative-ai-app-with-partyrock-amazon-bedrock/ この記事によると PartyRock ...

開発者ブログ

2024/8/30

ディーメイクカラオケ部活動報告（第1回）

Webアプリケーションエンジニアの菊池です。ディーメイクには趣味・ナレッジ・愛好会などの自由に参加できるMattermostチャンネルが100程あります。今回はその中で私が所属しているカラオケ部の活動をご紹介します。カラオケ部は最近作った部で、2024年6月18日に第一回目の活動をしました。（部というよりも愛好会な気もしますが、特に制約があるわけでもなく部として発足しました）第一回の参加メンバーは4名で私とMさんは久々のカラオケで、私は5年ぶりでした！それでは、今回の歌唱リストをご紹介しますスマフォ ...

イベント開発者ブログ

2024/12/4

第８回 Web5.0 推進協議会ミニセミナーに参加しました

こんにちは、matsuです。弊社はWeb5.0推進協議会の会員であり、毎月開催されているミニセミナーに参加しています。通常は弊社代表が参加していますが、今回は都合がつかず代理で私が出席しました。簡単ではありますが、当日の内容を皆様に共有したいと思います。はじめに Web2.0、Web3.0は聞いたことがある人も多いかもしれませんがWeb5.0 とは？という方はリンクからHPを参照いただければと思います。会員数も増えてきておりこれからますます活発に活動していくと思われます。１．荏原製作所の AI 戦略 ...

AWS 開発者ブログ

2024/9/19

CodePipelineでCloudFrontのキャッシュを自動クリアする方法

こんにちは、moriです。今回は、CodePipelineを使ってCloudFrontのキャッシュクリアを自動化する方法について、簡単なTIPSを紹介します。最近、CICDのフローをCodePipelineを使ってフロントエンドシステムを構築しました。構成としては、S3をオリジンに、CloudFrontをフロントに据えた典型的なサーバーレスアーキテクチャです。さらに、S3のコンテンツはCodeDeployで自動的に更新されるように設定しています。しかし、ここで1つ問題が発生しました。デプロイのたびにC ...

画像生成 AI Stable Diffusion を使ってみた

メモの蓄積と発展及び電子化

AWSの新動画生成AI「Amazon Nova Reel」を試してみた

Amazon Nova Reelを試してみる

モデルの準備

使ってみよう！

おまけ

今後の展開

まとめ

Recruit

TopVoiceに紹介記事を追加しました（株式会社ホロニック様)

TopVoiceに紹介記事を追加しました（BVEATS株式会社様)

TopVoiceに紹介記事を追加しました（GROOVE X株式会社様)

Slack/Mattermostで使える絵文字を無料でダウンロード - 2025年2月

経営者インタビューサイト「TopVoice」に新たな検索機能が追加！読みたい記事がさらに探しやすく