Googleが「新たな境地」と称するこの最新技術は、人工知能を生きた宇宙の建築家へと変貌させる。Genie 3モデルはもはや単なる画像や動画の生成にとどまらない。ユーザーがリアルタイムで動き回れる、フォトリアリスティックでインタラクティブな世界全体を生成する。壮大なデモンストレーションでは、Genie 3は、キーボード、コントローラー、マウスを使って、AIが生成した設定の中をユーザーが移動することを可能にしている。もはや私たちが見ているのは単なる動画ではなく、インタラクションを行う環境なのだ。このシステムは、画面外の要素を記憶し、リアルな物理的効果を操作し、キャラクターの突然の出現や風景の変化といった動的なイベントを生成することも可能だ。この進歩は、ビデオゲームの枠をはるかに超える、目もくらむような可能性を切り開く。Googleは、没入型トレーニング、科学シミュレーション、自動オーディオビジュアル制作などの分野でGenie 3を活用する予定だ。
限界はどんどん押し広げられている
この技術は素晴らしいものですが、まだ不完全です。デモンストレーションはわずか数分で、生成された世界は視覚的には完成度が高いものの、現実の場所をモデル化しているわけではありません。現状では、現実のパリを訪れることは不可能です。さらに、Googleが急速な開発を約束しているにもかかわらず、シミュレーション可能なイベントの種類は依然として限られています。Genie 3によって、DeepMindチームは新たな境地を開拓しようとしています。画像と動画をマスターした後、彼らは空間とインタラクティブな次元、つまりビデオゲームと仮想世界の基盤となる次元に取り組んでいます。これは、セットの作成だけでなく、完全で活気に満ちたカスタマイズされた体験を提供できるAIへの第一歩です。ビデオゲーム、専門トレーニング、没入型映画などの業界は、まだ初期段階でありながら、すでに大きな可能性を秘めたこの種のツールによって、大きな変革を経験する可能性が高いでしょう。