Nuestras infancias están a punto de dar un salto cuántico: Genie 2, una IA de DeepMind, es capaz de convertir cualquier dibujo o incluso una descripción en un videojuego jugable.
Por qué es importante. Esta tecnología no solo promete revolucionar la creación de contenido interactivo, sino también democratizar el desarrollo de videojuegos, pasando de ser algo reservado a proyectos de cierta envergadura… a algo sencillo para que cualquiera pueda usarlo como recurso puntual, sin necesidad de conocimientos técnicos.
La panorámica. Genie 2 es un gran avance respecto a su predecesor. Puede generar mundos 3D interactivos a partir de una simple imagen y una descripción de texto. Por ejemplo, «una oveja eléctrica en un establo de neones».
Luego el usuario podrá explorar un entorno ajustado a esa descripción usando su teclado y su ratón con acciones básicas, como saltar o nadar.

Imagen: DeepMind.
En detalle. Estos mundos generados incluyen física realista, con iluminación dinámica, reflejos, etc. Las escenas pueden durar hasta un minuto, aunque la mayoría se mantienen entre los diez y los veinte segundos.
El sistema es capaz de mantener la coherencia visual desde distintas perspectivas, y los entornos responden de forma inteligente a las acciones del usuario.
Entre líneas. La calidad visual de las simulaciones se puede equiparar a videojuegos AAA, lo cual suena muy prometedor… pero también plantea cuestiones sobre el origen de los datos de entrenamiento y las posibles implicaciones de propiedad intelectual.
DeepMind, como subsidiaria de Google, tiene acceso a YouTube. Pero la línea entre inspiración y copia puede ser difusa.
El contraste. Genie 2 se diferencia de modelos similares que sufren problemas de coherencia y ciertas «alucinaciones». Genie 2 es capaz de recordar partes de la escena que no están visibles, y renderizarlas cuando vuelven al campo de visión.
Esta tecnología está siendo posicionada por DeepMind como una herramienta de investigación y creatividad, no como un sistema con el que crear videojuegos completos. Al menos a día de hoy. Su verdadero está en el prototipado rápido de experiencias interactivas.
Imagen destacada | DeepMind
Más historias
Google ya ofrece SynthID para marcar contenidos generados por IA como tales. Ahora nos ayudará a identificarlos
El siguiente hito para las IAs que generan vídeo era hacerlos con audio. Google lo ha conseguido con Veo 3
China está convirtiendo sus tejados en centrales eléctricas. Ha conseguido en tres meses lo que en Europa cuesta tres años