Представлене компанією як «новий рубіж», останнє досягнення Google перетворює штучний інтелект на архітектора живих всесвітів. Модель Genie 3 більше не просто створює зображення чи відео: вона генерує цілі, фотореалістичні, інтерактивні світи, в яких користувач може переміщатися в режимі реального часу. У вражаючій демонстрації Genie 3 пропонує користувачеві переміщатися по створеному штучним інтелектом середовищу за допомогою клавіш клавіатури, контролера або миші. Це вже не просто відео, яке ми дивимося, а середовище, в якому ми взаємодіємо. Система навіть здатна запам'ятовувати позакадрові елементи, керувати реалістичними фізичними ефектами та створювати динамічні події, такі як раптова поява персонажа або зміна обстановки. Це досягнення відкриває запаморочливі можливості, що виходять далеко за рамки відеоігор. Google планує використовувати Genie 3 у таких сферах, як імерсивне навчання, наукове моделювання та автоматизоване аудіовізуальне виробництво.
Межі, які розширюються все далі й далі
Технологія вражає, але все ще недосконала. Демонстрації тривають лише кілька хвилин, а згенеровані світи, хоча й візуально виконані, не змодельовані за реальними локаціями. Наразі неможливо відвідати Париж, який би відповідав реальності. Крім того, різноманітність подій, що можна моделювати, залишається обмеженою, хоча Google обіцяє швидкий розвиток. З Genie 3 команди DeepMind перетинають новий поріг. Після оволодіння зображенням та відео вони вирішують просторовий та інтерактивний вимір, саме той, який є основою відеоігор та віртуальних світів. Це перший крок до штучного інтелекту, здатного не лише створювати декорації, але й повноцінний, яскравий та персоналізований досвід. Індустрія відеоігор, професійного навчання та захопливого кіно цілком може бути змінена цим типом інструменту, який все ще перебуває на стадії зародження, але вже є надзвичайно перспективним.