Conoce ClimSim un innovador conjunto de datos de simulación climática a múltiples escalas para combinar el aprendizaje automático y la física en la investigación climática.

Explorando ClimSim el revolucionario conjunto de datos de simulación climática a múltiples escalas fusionando el poder del aprendizaje automático y la física en la investigación climática.

Las predicciones de simulación física numérica son la principal fuente de información utilizada para guiar la política de cambio climático. Aunque están empujando los límites de las supercomputadoras más potentes, los simuladores climáticos existentes necesitan simular la física de las nubes y las precipitaciones intensas. La complejidad del sistema terrestre limita severamente la resolución espacial que el equipo de investigación puede emplear en estas simulaciones. Las “parametrizaciones” son representaciones matemáticas empíricas de la física que sucede a escalas inferiores a las resoluciones temporales y geográficas de las simulaciones climáticas. Lamentablemente, las suposiciones utilizadas en estas parametrizaciones con frecuencia resultan en errores que podrían empeorar el clima proyectado en el futuro. 

Un método convincente para simular procesos físicos sub-resolución no lineales y complicados que ocurren a escalas más pequeñas que la resolución del simulador climático con una menor complejidad informática es el aprendizaje automático (ML). Lo interesante de su aplicación es que conducirá a simulaciones climáticas más precisas y menos costosas que las actuales. La escala más pequeña resoluble de las simulaciones climáticas actuales es típicamente de 80 a 200 km, o el tamaño de un condado promedio de los Estados Unidos. Sin embargo, se necesita una resolución de 100 m o más fina para describir eficazmente la formación de nubes, lo que requiere un aumento de órdenes de magnitud en la potencia informática. 

El uso del aprendizaje automático (ML) para superar las limitaciones de la computación clásica sigue siendo una opción viable. Los simuladores climáticos hybridML resultantes combinan emuladores de ML de los efectos macroescala de la física a pequeña escala con métodos numéricos convencionales para resolver las ecuaciones que rigen los movimientos fluidos a gran escala de la atmósfera terrestre. Los emuladores aprenden directamente de los datos producidos por simulaciones de alta resolución y corta duración en lugar de depender de suposiciones heurísticas sobre estos procesos a pequeña escala. En esencia, esto es un problema de regresión: dadas entradas resueltas a gran escala, un emulador de parametrización de ML en la simulación climática devuelve las salidas a gran escala (como cambios en el viento, la humedad o la temperatura) que surgen de la física no resuelta a pequeña escala (sub-resolución). 

Aunque se han desarrollado varias pruebas de concepto recientemente, las simulaciones climáticas híbridas de ML aún necesitan ser implementadas operativamente. Uno de los principales obstáculos que impiden que la comunidad de ML esté interesada es la obtención de suficientes datos de entrenamiento. Todos los factores de macroescala que controlan el comportamiento de la física a sub-resolución deben incluirse en estos datos para que funcionen con las simulaciones climáticas híbridas de ML subsiguientes. Se ha demostrado que abordar esto utilizando datos de entrenamiento de simulaciones de alta resolución y consistentes es muy costoso y puede causar problemas al combinarse con una simulación climática principal. El uso de técnicas de simulación climática multi-escala para producir datos de entrenamiento es un enfoque viable. Lo más importante es que ofrecen una interfaz clara entre la dinámica a escala planetaria del simulador climático principal y la física de alta resolución imitada. Esto teóricamente hace que la simulación acoplada híbrida subsiguiente sea manejable y accesible. Debido a la falta de conjuntos de datos disponibles y la necesidad de experiencia en el dominio al seleccionar variables, la complejidad del código de simulación operativa y la escasez de conjuntos de datos disponibles han obstaculizado la aplicación práctica de enfoques multi-escala. 

Para su uso en simulaciones climáticas híbridas de ML, el equipo de investigación compuesto por investigadores de más de 20 instituciones de investigación inminentes presenta ClimSim, el conjunto de datos más grande y completo físicamente para entrenar simuladores de aprendizaje automático de tormentas de aire, nubes, turbulencia, precipitación y radiación. ClimSim es un conjunto completo de entradas y salidas de simulaciones climáticas físicas multi-escala. Para reducir los obstáculos de participación para los especialistas en ML en este problema importante, los desarrolladores de simuladores climáticos y los científicos atmosféricos crearon ClimSim. Su conjunto de datos de referencia proporciona una base sólida para construir marcos robustos que modelen parametrizaciones de física de nubes y lluvias intensas y cómo interactúan con otros fenómenos a sub-resolución. Al facilitar el acoplamiento en línea dentro del simulador climático de baja resolución principal, estos marcos ayudan a que los simuladores climáticos utilizados para pronósticos a largo plazo operen de manera más precisa y tengan un mejor rendimiento en general.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

OpenAI revela ChatGPT Enterprise con el poder de GPT-4

OpenAI, la organización pionera en investigación de IA, acaba de presentar un nuevo capítulo emocionante en el mundo ...

Inteligencia Artificial

Samet honrado con el Premio ACM SIGSPATIAL al Impacto de por Vida

Hanan Samet fue honrado con el Premio Inaugural al Impacto de toda la Vida de ACM's Special Interest Group on Spatial...

Inteligencia Artificial

Automatizando la Cadena del Pensamiento Cómo la IA puede impulsarse a sí misma a razonar

El método de generación automática de Auto-CoT permite que los modelos de lenguaje generen automáticamente sus propia...

Inteligencia Artificial

Entendiendo Flash-Atención y Flash-Atención-2 El camino para ampliar la longitud del contexto de los modelos de lenguaje

Escalar el contexto de los grandes modelos de lenguaje (LLMs) sigue siendo uno de los mayores desafíos para ampliar e...

Inteligencia Artificial

6 Comandos Mágicos para Jupyter Notebooks en Ciencia de Datos con Python

En el campo de los proyectos de Ciencia de Datos basados en Python, la utilización de los Cuadernos de Jupyter es omn...

Inteligencia Artificial

Científicos secuencian la última pieza del genoma humano el cromosoma Y

El consorcio Telomere-to-Telomere ha completado la secuenciación del genoma humano al agregar el cromosoma Y completa...