Como se utilizan los modelos de fundación en los videojuegos?

Cómo se utilizan los modelos de maquillaje en los videojuegos

Las tecnologías de inteligencia artificial están teniendo un impacto masivo en diversas industrias, incluyendo los medios de comunicación y el entretenimiento, el sector automotriz, el servicio al cliente y más. Para los desarrolladores de juegos, estos avances están abriendo el camino para crear experiencias de juego más realistas e inmersivas.

Desde la creación de personajes realistas que transmiten emociones hasta transformar texto simple en imágenes cautivadoras, los modelos base se están volviendo esenciales para acelerar los flujos de trabajo de los desarrolladores y reducir costos generales. Estos potentes modelos de inteligencia artificial han desbloqueado un mundo de posibilidades, empoderando a los diseñadores y desarrolladores de juegos para crear experiencias de juego de mayor calidad.

¿Qué son los modelos base?

Un modelo base es una red neuronal que se entrena con grandes cantidades de datos y luego se adapta para abordar una amplia variedad de tareas. Son capaces de realizar una variedad de tareas generales, como la generación de texto, imágenes y audio. En el último año, la popularidad y el uso de los modelos base ha aumentado rápidamente, y ahora hay cientos disponibles.

Por ejemplo, GPT-4 es un modelo multimodal desarrollado por OpenAI que puede generar texto similar al humano basado en el contexto y las conversaciones pasadas. Otro ejemplo es DALL-E 3, que puede crear imágenes realistas y obras de arte a partir de una descripción escrita en lenguaje natural.

Los potentes modelos base, como NVIDIA NeMo y el modelo Edify en NVIDIA Picasso, facilitan a las empresas y desarrolladores incorporar inteligencia artificial en sus flujos de trabajo existentes. Por ejemplo, utilizando el marco de trabajo de NVIDIA NeMo, las organizaciones pueden entrenar, personalizar e implementar rápidamente modelos de inteligencia artificial generativos a gran escala. Y utilizando NVIDIA Picasso, los equipos pueden ajustar los modelos base pre-entrenados con sus propios datos empresariales para crear productos y servicios personalizados en generación de imágenes, videos, activos en 3D, materiales de textura y HDRi en 360 grados.

¿Cómo se construyen los modelos base?

Los modelos base se pueden utilizar como base para sistemas de inteligencia artificial que pueden realizar múltiples tareas. Las organizaciones pueden utilizar fácil y rápidamente una gran cantidad de datos no etiquetados para crear sus propios modelos base.

El conjunto de datos debe ser lo más grande y diverso posible, ya que pocos datos o datos de baja calidad pueden generar inexactitudes, a veces llamadas alucinaciones, o hacer que se pierdan detalles en las salidas generadas.

A continuación, el conjunto de datos debe prepararse. Esto incluye limpiar los datos, eliminar errores y formatearlo de tal manera que el modelo pueda entenderlo. Los sesgos son un problema persistente al preparar un conjunto de datos, por lo que es importante medir, reducir y abordar estas inconsistencias e inexactitudes.

Entrenar un modelo base puede llevar mucho tiempo, especialmente dado el tamaño del modelo y la cantidad de datos requeridos. Hardware como los GPU Tensor Core NVIDIA A100 o H100, junto con sistemas de datos de alto rendimiento como el NVIDIA DGX SuperPOD, pueden acelerar el entrenamiento. Por ejemplo, ChatGPT-3 se entrenó con más de 1.000 GPU NVIDIA A100 en aproximadamente 34 días.

Los tres requisitos de un modelo base exitoso.

Después del entrenamiento, el modelo base se evalúa en cuanto a calidad, diversidad y velocidad. Existen varios métodos para evaluar el rendimiento, por ejemplo:

  • Herramientas y marcos que cuantifican qué tan bien el modelo predice una muestra de texto
  • Métricas que comparan las salidas generadas con una o más referencias y miden las similitudes entre ellas
  • Evaluadores humanos que evalúan la calidad de las salidas generadas en varios criterios

Una vez que el modelo pasa las pruebas y evaluaciones relevantes, se puede implementar para su producción.

Explorando los modelos base en los juegos

Los modelos base pre-entrenados pueden ser aprovechados por middleware, herramientas y desarrolladores de juegos tanto durante la producción como en tiempo de ejecución. Para entrenar un modelo base, se requieren recursos y tiempo, junto con cierto nivel de experiencia. Actualmente, muchos desarrolladores de la industria de los juegos están explorando modelos preexistentes, pero necesitan soluciones personalizadas que se adapten a sus casos de uso específicos. Necesitan modelos que se hayan entrenado con datos comercialmente seguros y optimizados para un rendimiento en tiempo real, sin los costos exorbitantes de implementación. La dificultad de cumplir con estos requisitos ha frenado la adopción de los modelos base.

Sin embargo, la innovación dentro del espacio de la IA generativa es rápida y una vez que se abordan los principales obstáculos, los desarrolladores de todos los tamaños, desde startups hasta estudios AAA, utilizarán modelos de base para obtener nuevas eficiencias en el desarrollo de juegos y acelerar la creación de contenido. Además, estos modelos pueden ayudar a crear experiencias de juego completamente nuevas.

Los casos de uso más importantes de la industria se centran en agentes inteligentes y animación potenciada por IA y creación de activos. Por ejemplo, muchos creadores hoy en día están explorando modelos para crear personajes no jugables inteligentes o NPCs.

Los LLM personalizados, ajustados con el argot y la historia de juegos específicos, pueden generar texto similar al humano, comprender el contexto y responder de manera coherente a las indicaciones. Están diseñados para aprender patrones y estructuras de lenguaje y comprender los cambios en el estado del juego, evolucionando y progresando junto con el jugador en el juego.

A medida que los NPCs se vuelven cada vez más dinámicos, se necesitará animación y audio en tiempo real que se sincronicen con sus respuestas. Los desarrolladores están utilizando NVIDIA Riva para crear voces de personajes expresivas utilizando IA de reconocimiento de voz y traducción. Y los diseñadores están utilizando NVIDIA Audio2Face para animaciones faciales potenciadas por IA.

Los modelos de base también se utilizan para la generación de activos y animaciones. La creación de activos durante las fases de preproducción y producción del desarrollo de juegos puede ser lenta, tediosa y costosa.

Con modelos de difusión de última generación, los desarrolladores pueden iterar más rápidamente, liberando tiempo para centrarse en los aspectos más importantes del proceso de contenido, como el desarrollo de activos de mayor calidad y la iteración. La capacidad de ajustar estos modelos a partir del repositorio de datos propio de un estudio asegura que los resultados generados sean similares a los estilos artísticos y diseños de sus juegos anteriores.

Los modelos de base están fácilmente disponibles y la industria del juego está solo en las fases iniciales para comprender todas sus capacidades. Se han desarrollado varias soluciones para experiencias en tiempo real, pero los casos de uso son limitados. Afortunadamente, los desarrolladores pueden acceder fácilmente a modelos y microservicios a través de APIs en la nube hoy en día y explorar cómo la IA puede afectar a sus juegos y ampliar sus soluciones a más clientes y dispositivos que nunca antes.

El Futuro de los Modelos de Base en los Videojuegos

Los modelos de base están preparados para ayudar a los desarrolladores a concretar el futuro de los videojuegos. Los modelos de difusión y los modelos de lenguaje grandes están volviéndose mucho más livianos a medida que los desarrolladores buscan ejecutarlos de forma nativa en una variedad de perfiles de hardware, incluyendo PC, consolas y dispositivos móviles.

La precisión y calidad de estos modelos solo seguirán mejorando a medida que los desarrolladores busquen generar activos de alta calidad que requieran poco o ningún retoque antes de ser incorporados en una experiencia de juego AAA.

Los modelos de base también se utilizarán en áreas que han sido desafiantes para los desarrolladores con la tecnología tradicional. Por ejemplo, los agentes autónomos pueden ayudar a analizar y detectar el espacio del mundo durante el desarrollo del juego, lo que acelerará los procesos de aseguramiento de calidad.

El surgimiento de modelos de base multimodales, que pueden procesar simultáneamente una mezcla de texto, imagen, audio y otros datos, mejorará aún más las interacciones de los jugadores con NPCs inteligentes y otros sistemas de juego. Además, los desarrolladores pueden utilizar diferentes tipos de entrada para mejorar la creatividad y la calidad de los activos generados durante la producción.

Los modelos multimodales también muestran una gran promesa para mejorar la animación de personajes en tiempo real, uno de los procesos más intensivos en tiempo y costosos del desarrollo de juegos. Podrían ayudar a que la locomoción de los personajes sea idéntica a la de los actores reales, infundir estilo y sensación a partir de una variedad de entradas y facilitar el proceso de rigging.

Aprende más sobre los Modelos de Base en los Videojuegos

Desde mejorar el diálogo y generar contenido 3D hasta crear jugabilidad interactiva, los modelos de base han abierto nuevas oportunidades para que los desarrolladores forjen el futuro de las experiencias de juego.

Aprende más sobre los modelos de base y otras tecnologías que potencian los flujos de trabajo en el desarrollo de juegos.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Accenture crea una solución Knowledge Assist utilizando servicios de inteligencia artificial generativa en AWS

Esta publicación está coescrita con Ilan Geller y Shuyu Yang de Accenture. Las empresas hoy en día se enfrentan a gra...

Inteligencia Artificial

Diez años de revisión de la Inteligencia Artificial.

Desde la clasificación de imágenes hasta la terapia de chatbot.

Inteligencia Artificial

Descubriendo el impacto de la IA generativa en la narración de datos y el análisis

Introducción En el amplio campo de la analítica de datos, uno de los desarrollos más profundos que cambia el juego es...

Inteligencia Artificial

Dentro del acalorado centro del pesimismo de la IA

Anthropic, una start-up de inteligencia artificial centrada en la seguridad, está tratando de competir con ChatGPT mi...