ディーメイク Advent Calendar 2024 12/9の記事です。
こんにちは。 mori です。
2024年12月2日から6日にかけて、ラスベガスで開催されたAWS re:Invent 2024では、多くのエンジニアにとって刺激的なアップデートが発表されました。特に生成AI関連の進展が目覚ましく、Amazon QやAmazon Bedrockの新機能が多かったように思いました。
その中でも、Amazonが独自に開発した基盤モデル群「Amazon Nova」の発表がありました。
これらのモデルは、Amazonの生成AIサービスであるAmazon Bedrock上で提供され、企業向けに最適化されています。
Amazon Novaのモデル構成
Amazon Novaは、以下のモデルで構成されています:
- Amazon Nova Micro:テキストのみを処理するモデルで、非常に低コストかつ低レイテンシーの応答を提供します。
- Amazon Nova Lite:テキスト、画像、動画の入力に対応したマルチモーダルモデルで、低コストかつ高速な処理が可能です。
- Amazon Nova Pro:精度、速度、コストのバランスが取れた高性能なマルチモーダルモデルで、幅広いタスクに対応します。
- Amazon Nova Premier:最も高度なマルチモーダルモデルで、複雑な推論タスクやカスタムモデルの教師として最適です。※2025年第1四半期に利用可能となる予定です。
さらに、以下のクリエイティブコンテンツ生成モデルも提供されています:
- Amazon Nova Canvas:テキストからスタジオ品質の画像を生成するモデルです。
- Amazon Nova Reel:テキストからスタジオ品質の動画を生成するモデルです。
Amazon Novaの特徴
Amazon Novaは、200以上の言語に対応し、テキスト生成、画像・動画の理解と生成など、多様な生成AIタスクを高精度かつ高速に実行できます。特に、他のモデルと比較して75%のコスト削減を実現しており、企業が生成AIを活用する際のコスト効率を大幅に向上させます。
Amazon Nova Reelを試してみる
今までのAmazon Brdrockで扱えるモデルに、動画生成はまだなかったと思います。
いよいよAWS が動画生成AIの領域にまで手を出してきたか!と思い、気になったので試してみてみました。
モデルの準備
まずは使う前にモデルを有効化していきます。Amazon Bedrockの左メニューの下部にある [Bedrock configurations] - [モデルアクセス]をクリックします。
[モデルアクセスを変更]をクリックし、モデル一覧の中から[Amazon] - [Nova Reel] を選択します。
確認画面が表示されますので、「送信」を押します。 こちらのモデルはすぐにアクセス権が付与されるのでこれで使うことができます。
モデルのアクティベーションができました。
Amazon Bedrockの画面からプレイグラウンドの[Image / Video] を選択し、モデルを選びます。
下記のように、カテゴリ:Amazon、モデル:Nova Reelを適用します。
初回起動時は、生成されたファイルを格納するためのS3を作成しますので、そのための確認メッセージが表示されました。
これで、準備ができました。
なお、「Action」の設定項目から動画の長さやサイズなどを選択できるようです。ただ、現在作成できる動画の長さは6秒のみのようです。
今後のアップデートに期待したいところですね。
使ってみよう!
それでは、動画を作成していきましょう。
プロンプトに入力して、実行を押します。おおよそ5分ほどで動画が作成されます。
推論イメージに画像をアップロードすれば、その画像をもとに動きをつけた動画を作成してくれます。(余談ですが、このわんちゃんの写真もNova Canvasでサクッと作成しました)
プロンプトでは、走り回る動画としたのですが、残念ながら顔が動くのみでした。(英語にしても同じでした)
かわいいはかわいいのですが、少しぎこちなく感じる動画ですね。
ちなみに、その他にも「ウインクして」などいろいろと試しましたが、なぜか口が横にまがってしまったりや口が二つになるなど、見せられないレベルのちょっとしたホラー動画ができてしまいました。。。
プロンプトの書き方などでコツが必要なのか、サービスが出たばかりなので使い方も踏まえて、品質の向上はこれからなのでしょう。
よくなっていくことを期待したいですね。
おまけ
人の描写はどうなのかなと思って、「美人の日本人女性が笑いかけてくれる」というプロンプトで作成してみました。
今後の展開
Amazon Nova Reelの今後のアップデート予定について、以下の新機能が追加される予定です。
近日公開予定の高度な機能(Coming Soon: Advanced Features)
- 長尺動画対応: 現在の最大6秒から、最大2分(120秒)までの動画生成が可能になります。
- ストーリーボード機能: 複数のシーンを統合し、シーン間の一貫性を保持する機能が追加されます。
- 高解像度対応: 1080p(1920x1080)の高解像度動画の生成に対応します。
- 動画編集機能の強化:
- 高度な編集機能の追加: より洗練された動画編集が可能になります。
- 既存の動画編集ソフトとの連携強化: 他の動画編集ツールとの互換性が向上します。
- 人物表現の改善:
- 自然な動きの表現: 人物の動きがよりリアルに表現されます。
- 表情やジェスチャーの改善: キャラクターの表情や身振りがより豊かになります。
- 人物の一貫性の向上: 同一人物の特徴が動画全体で統一されます。
これらの新機能により、Amazon Nova Reelはさらに多彩で高品質な動画生成が可能となり、クリエイターや企業のニーズに応えることが期待されています。
さらにAmazonは、2025年に音声入力に対して音声で応答する「Amazon Nova Speech-to-Speech」モデルや、テキスト、音声、画像、動画などのマルチモーダル入力と出力に対応する「Amazon Nova Any-to-Any」モデルのリリースを予定しています。これらの新モデルの登場により、Amazon Novaはさらに多様な生成AIタスクに対応し、企業のニーズに応えることが期待されています。
まとめ
Amazon Bedrockを介して利用できるため、非常にスムーズに試すことができました。手軽にさまざまな機能を試せる点が、Amazon Bedrockの大きな魅力ですね。
6秒程度の動画生成に約5分の待ち時間が発生しましたが、少し長く感じました。しかし、自分がアップロードした画像を基に動画を生成できるのは非常に興味深い体験でした。プロンプトの精度や使い勝手が向上すれば、さらに楽しみが増すことでしょう。これまで触れたことのない動画生成技術に触れることができ、非常に面白かったです。
さいごに、1日いろいろ試してみてかかった料金です。($9ドル弱でしたが、クレジットで相殺できました)