Підрозділ Google DeepMind анонсував просунуту версію своєї ШІ-моделі Genie 3, здатної генерувати тривимірні віртуальні світи в реальному часі. У таких світах можуть вільно переміщатися як користувачі, так і ШІ-агенти.
Про це повідомляє американський веб-сайт про комп'ютерну техніку The Verge.
Що таке "світові моделі"?
Це особливий тип ШІ, який створює симульовані простори - для навчання, розваг або тренувань інших ШІ, наприклад, роботів. Раніше такі віртуальні світи розроблялися вручну з використанням 3D-графіки, але тепер усе генерується нейромережею за простим текстовим описом.
У чому відмінність Genie 3 від попередньої версії?
Попередня версія Genie 2 могла підтримувати інтерактивність лише протягом 10-20 секунд. У новій моделі цей показник збільшився до кількох хвилин.
Навіть більше, у Genie 3 з'явилася візуальна пам'ять на рівні однієї хвилини. Це означає, що якщо користувач відвернеться від об'єкта, а потім повернеться до нього, - написи, кольори або предмети залишаться на тих самих місцях. Роздільна здатність згенерованого світу - 720p за частоти 24 кадри на секунду.
Інтерактивність на новому рівні
Genie 3 також підтримує так звані "програмовані події". Користувач може змінювати параметри світу в реальному часі - наприклад, викликати дощ, додати персонажів або змінити атмосферу, використовуючи текстові підказки (промпти).
Контекст
Google активно розвиває напрямок генеративних світів. У грудні компанія показала Genie 2, яка вміла створювати ігрові сцени на основі одного зображення. Команду, що працює над цим проектом, очолює колишній співрозробник Sora - інструменту для генерації відео від OpenAI.
Джерело https://www.rbc.ua/
