Google DeepMind har nu lanserat Genie 3, den tredje generationen av företagets banbrytande AI-modell för generativa miljöer, kallad Generative Interactive Environments. Med realtidsinteraktion, minnesfunktion och förbättrad realism tar modellen ett stort kliv mot världssimulering i AGI-klass (artificiell generell intelligens).
Genie-modellerna bygger på det som DeepMind kallar världsmodeller – AI-system som inte bara förstår sin omgivning, utan kan simulera hur miljöer förändras över tid, och hur en agents handlingar påverkar dem. Målet är att möjliggöra obegränsad träning i simulerade världar, något som anses centralt för att nå AGI.
Med Genie 3 introduceras för första gången realitidsinteraktion i de genererade världarna. Användaren kan lägga till objekt direkt via textkommandon och modellen minns vad som sker i miljöerna över tid. AI:n kan nu även generera 720p-video i 24 bilder per sekund, i upp till flera minuter utan att drabbas av hallucinationer.
Tekniken har tidigare använts inom allt från robotträning och strategi-AI till generativ video (via modellerna Veo 2 och Veo 3), men Genie 3 knyter nu samman många av dessa kapaciteter i ett gemensamt ramverk.
Trots framstegen finns det ännu begränsningar – modellen är inte släppt publikt, men ett mindre antal externa forskare och utvecklare kommer få tillgång för testning.
Bild: Google