El método mundial de pronóstico del tiempo se llama cálculo numérico. Después de recopilar suficientes y ricos datos meteorológicos, se sustituyen en ecuaciones complejas, y el resultado es el llamado pronóstico. Repitiendo este proceso, el pronóstico es continuo.
Detrás de estas ecuaciones hay algunas teorías sólidas, como ecuaciones de movimiento de fluidos, ecuaciones termodinámicas y diferentes interfaces, ecuaciones de intercambio de energía de material de aire, agua, hielo terrestre, etc. Las leyes físicas y químicas que representan han sido rigurosamente calculadas y verificadas.
Pero el pronóstico del tiempo todavía no es absolutamente exacto. Este tipo de predicción numérica sirve para predecir la tendencia futura a través de los cambios de elementos meteorológicos que han ocurrido, y su precisión se ve seriamente afectada por la precisión de los datos de observación.
Además, con el cambio de escalas temporales y espaciales, la complejidad del sistema meteorológico aumentará drásticamente, por un lado, al analizar las causas del clima, habrá muchas cosas que faltan, y por otro lado, habrá más errores en los datos, lo que a su vez afecta la predicción.
Y cuando la escala sea lo suficientemente grande, el clima entrará en un estado caótico. Esto no es una metáfora. El sistema meteorológico es un sistema caótico típico. La teoría del caos fue propuesta por primera vez por meteorólogos en 1963.
Un sistema caótico significa que perturbaciones muy pequeñas en el sistema pueden tener consecuencias muy diferentes; otro nombre para esto es el efecto mariposa, donde una mariposa bate sus alas en California y se levanta una tormenta en Texas y el Golfo de México.
Esto requiere que el cálculo inicial del valor debe ser muy preciso, pero todos sabemos que la precisión absoluta no existe, sin mencionar que ante movimientos meteorológicos tan complejos, hay demasiados tipos y cantidades de datos para recolectar. .
La predicción humana del clima es como tratar de aprender la relación entre las alas de una mariposa y la trayectoria del ojo de una tormenta: es magnífico, a veces imposible e incluso esotérico.
Por un lado, se construyen ecuaciones de funciones cada vez más complejas en términos de precisión y se recopila la mayor cantidad de datos posible en intervalos más cortos; por otro lado, se confía en una experiencia casi "intuitiva".
Hasta el día de hoy, todos los resultados del pronóstico del tiempo todavía están determinados por dos partes: el resultado del cálculo numérico, más el juicio del pronosticador. El pronóstico del tiempo todavía depende en gran medida de la experiencia humana.
En cierta medida, los seres humanos están utilizando sus propios sentimientos para luchar contra el caos de la naturaleza.
supercomputadora
Por lo tanto, el pronóstico meteorológico presenta una característica extraña, porque mientras uno confíe en la experiencia y el sentimiento humanos, siempre habrá fallas, especialmente en algunos climas extremos, porque los datos sobre climas extremos son demasiado escasos, lo que hace que los humanos no tengan una experiencia coherente. de eso
Sin embargo, dado que la precisión de la predicción numérica ha mejorado en las últimas décadas, el pronóstico del tiempo actual puede alcanzar un nivel bastante preciso en muchos casos. El pronóstico de usabilidad a mediano plazo es de cerca de 10 días, y el pronóstico a corto plazo, para Por ejemplo, cuándo llegará el aire frío y cuánto bajará la temperatura, los humanos han podido juzgar con mucha precisión. Esto se debe a que, si bien los cambios en el entorno climático global general son caóticos, en muchos niveles microscópicos, como la formación de masas de aire, los cambios en la presión del aire y la trayectoria de los movimientos de las nubes, se describen de manera vívida y precisa mediante más y más funciones y fórmulas
Por ejemplo, las recientes lluvias torrenciales en Beijing, Tianjin y Hebei.
Del 29 de julio al 1 de agosto, el tifón Dusurui se desplazó hacia el norte con abundante vapor de agua y fue interceptado por altas presiones en el norte de China. Tormentas de lluvia extremas pocas veces vistas en la historia ocurrieron en la región de Beijing-Tianjin-Hebei.
El extremo se refleja en varios aspectos, el primero es la gran cantidad. La precipitación en el condado de Lincheng, Xingtai, provincia de Hebei supera los 1.000 milímetros, o 1 metro, lo que equivale a la cantidad total de precipitación en los dos años originales aquí. En segundo lugar, duró casi cuatro días a partir del 29 de julio y llovió continuamente durante 83 horas incluso en Beijing. Hebei, Shaanxi, Henan y otros lugares también experimentaron fuertes lluvias durante dos días consecutivos. Finalmente, tiene una amplia gama de influencia, y todo el norte de China está cubierto de lluvia.
Los meteorólogos predijeron esta lluvia extrema con casi total precisión. Detrás de esto está el gran progreso del pronóstico del tiempo en las últimas décadas: el cálculo numérico se ha desarrollado desde un simple conjunto de ecuaciones hasta uno de los algoritmos más complejos del mundo. weather Bueno, y para manejar esta enorme cantidad de datos y algoritmos complejos, se introdujeron las supercomputadoras.
Es posible que muchas personas no tengan idea de la enorme cantidad de datos meteorológicos, pero aquí hay una cifra: todos los días, los datos meteorológicos de China crecen hasta 40 TB. mi país ha establecido un conjunto completo de red de observación meteorológica tridimensional, con más de 70.000 estaciones de observación meteorológica que cubren el 99,6 % de las ciudades y pueblos del país. El tiempo de transmisión de datos se ha reducido de 1 hora en el pasado a 1 minuto en los últimos años.
Es bastante difícil manejar una cantidad tan grande de datos en sí, pero es casi imposible combinarlos con ecuaciones de cálculo numérico: las ecuaciones diferenciales parciales complejas y los cálculos de punto flotante requieren muchos cálculos. requiere una puntualidad extremadamente alta Bajo varias limitaciones, solo las supercomputadoras pueden satisfacer la demanda.
Afortunadamente, China está a la vanguardia del mundo en este sentido.
La supercomputación siempre ha sido una tarjeta de presentación de China. Por ejemplo, China tiene 162 de las 500 supercomputadoras más rápidas del mundo. Otro ejemplo es que he ganado el premio más alto para aplicaciones internacionales de supercomputación: el Premio Gordon Bell tres veces. Dos de ellas son The dos contenidos premiados "Marco de Dinámica Atmosférica" y "Simulación de Terremotos" están relacionados con la meteorología.
La supercomputadora que se usa actualmente en China se llama "Pai-Dawn". Su velocidad máxima de cómputo alcanza los 8189,5 billones de veces por segundo y su capacidad de almacenamiento alcanza los 23088 TB. La escala saltó al tercer lugar en el mundo en el campo de la meteorología.
Esto no ha terminado. Con el rápido crecimiento del volumen de datos y el desgaste del hardware, la vida útil de las supercomputadoras es principalmente de 6 a 8 años. Por lo tanto, después de "Pai-Dawn", también se lanzan nuevas supercomputadoras una tras otra. Se instaló y construyó el primer lote de un nuevo subsistema de computación de alto rendimiento (HPC) 1 de nivel estatal de este año. 76PB.
Más supercomputadoras están en camino.
El mapa conceptual del sistema informático nacional de alto rendimiento "Pai-Shuguang". La imagen proviene del Centro Nacional de Información Meteorológica.
** "Estancamiento" y el Nuevo Camino**
En general, la supercomputación compuesta por cientos o miles de CPU constituye una base sólida para el pronóstico del tiempo, pero todavía hay cosas que no se pueden hacer o son difíciles de hacer.
Como tifón. Nuestra predicción del tifón Dusurui está lejos de la precisión de la predicción de fuertes lluvias. Todos los principales métodos de predicción de tifones en el mundo utilizan modelos dinámicos, que simulan el movimiento atmosférico en función de las leyes de la física atmosférica, incluidas la dinámica de fluidos y la termodinámica, y luego predicen los cambios en los tifones.
Hay muchas imprecisiones en el modelo dinámico, lo que hizo que todos predijeran el camino de Du Surui en una variedad de formas al principio. Surui iría directamente al delta del río Pearl.
De hecho, el pronóstico de tifones siempre ha sido un problema mundial, porque un tifón puede sufrir cambios drásticos de intensidad en un corto período de tiempo y su trayectoria es impredecible debido a la influencia de muchos factores en una escala espacio-temporal muy grande.
Es un sistema caótico típico.
Por lo tanto, el pronóstico del tiempo basado en la predicción numérica se ha convertido en un complejo de contradicciones, lo que hace que tenga un gran margen de mejora, pero es muy limitado: la única forma en que las personas se acercan a la precisión es acumulando experiencia. Recopilando datos y construyendo más y más. funciones más complejas, pero sus beneficios marginales son cada vez más fuertes Más datos no pueden mejorar en gran medida y de manera integral la precisión de los pronósticos meteorológicos en las escalas macro y micro, mientras que el costo general de la computación continúa creciendo.
En este punto, la situación parece haber llegado a un punto muerto. Los datos masivos, los algoritmos complejos y los requisitos de alta potencia informática hacen que los cálculos numéricos se conviertan en un cuello de botella hasta cierto punto, pero ¿le resultan familiares estas tres condiciones?
¿Se parece un poco a los tres elementos de un gran modelo?
De hecho, en el material de un seminario interno sobre tecnología meteorológica visto por Pinwan, algunos expertos declararon directamente que la inteligencia artificial y el trabajo meteorológico son similares en metodología.
Dado que las fórmulas de cálculo numérico en realidad no pueden agotar todas las causas y efectos en todo el sistema caótico, ¿por qué no usar el método de red neuronal para importar datos masivos y dejar que la computadora encuentre y aprenda las leyes por sí misma?
Esta parece ser una explicación indescriptible, pero extremadamente misteriosa y razonable.
ENIAC, la primera computadora electrónica de la humanidad, y EDSAC, la primera computadora construida según la estructura de von Neumann, se usaron en realidad para realizar cálculos científicos relacionados con la meteorología. El desarrollo de la meteorología siempre ha estado en línea con el desarrollo de la informática. El progreso está estrechamente relacionado: la informática de alto rendimiento ha promovido la solución de problemas complejos en la ciencia meteorológica y, después de saltar del pensamiento informático general, las redes neuronales y los modelos grandes parecen ser una dirección muy interesante y razonable para la meteorología y el pronóstico del tiempo. .
De hecho, el Observatorio Meteorológico Central se refirió a los resultados del modelo a gran escala de inteligencia artificial para la predicción de la trayectoria del tifón Dusurui.
De otra manera
Los grandes modelos meteorológicos no aparecieron con la popularidad de la IA generativa a finales del año pasado. Ha habido muchos modelos grandes que utilizan una potente potencia informática, enormes cantidades de datos y varias arquitecturas de aprendizaje profundo para predecir el tiempo. Los más famosos en el extranjero se encuentran Nvidia FourCastNet, DeepMind, GraphCast de Google y ClimaX de Microsoft, los últimos modelos nacionales son el modelo Huawei Pangu y el modelo Shanghai Fengwu, este último del Laboratorio de Inteligencia Artificial de Shanghai.
Tanto Pangu como Fengwu utilizaron el conjunto de datos de reanálisis meteorológico del Centro Meteorológico Europeo llamado ERA5, que proporcionó un total de 2000 TB de varios datos meteorológicos que cubren 37 superficies isobáricas en la superficie terrestre durante los últimos 60 años.
Estos datos brindan un espacio para que los modelos grandes jueguen: en lugar de usar cálculos numéricos precisos y correspondientes, la IA puede extraer de manera más flexible varias relaciones complejas entre los datos.
Pangu construyó una estructura de transformador 3D para integrar los complejos procesos físicos interactivos del océano, la atmósfera y la tierra. En el pasado, los grandes modelos climáticos, como FourCastNet de Nvidia, usaban una estructura 2D: cada superficie isobárica es una capa, obviamente, hay No hay forma de que el plano 2D refleje mejor el proceso de cambios meteorológicos.
Según los materiales vistos por Pinwan, Huawei usó codificación de posición absoluta en esta estructura 3D, lo que aceleró significativamente la convergencia del modelo.Además, Huawei entrenó cuatro modelos básicos correspondientes a 1 hora, 3 horas, 6 horas y 24 horas respectivamente. Predicción horaria, el método de fusión en el dominio del tiempo reduce significativamente el error causado por el tamaño de paso pequeño y las iteraciones múltiples en el modelo anterior.
Para la predicción del antiguo y difícil tifón, Pangu utilizó la presión media a nivel del mar como referencia de predicción y el resultado fue mejor que el de la Agencia Meteorológica Europea.
La idea del modelo grande de Fengwu es usar 6 codificadores independientes para codificar y decodificar diferentes parámetros meteorológicos (humedad, viento, temperatura, etc.), y usar redes de transformadores independientes para aprender entre diferentes variables.
A diferencia del método de fusión de dominio de tiempo de Huawei para reducir errores, Fengwu diseñó un espacio de caché para almacenar y reproducir los resultados del proceso de entrenamiento, de modo que la red neuronal pueda adaptarse a sus errores, logrando así mejores resultados de predicción.
Aunque los resultados de estos nuevos modelos de predicción meteorológica a gran escala aún son preliminares, y los resultados publicados son mejores que los métodos tradicionales de predicción numérica en algunos indicadores específicos, todavía se necesitan pruebas exhaustivas y optimización, pero no hay duda de que representan un tipo de Un nuevo paradigma radicalmente diferente a la previsión meteorológica tradicional.
En la actualidad, el modelo a gran escala Pangu de Huawei ha logrado una operación comercial preliminar en el centro europeo de pronóstico del tiempo de mediano alcance, mientras que Fengwu afirma ser el modelo de pronóstico del tiempo de IA de alta resolución global más preciso 38,7 kilómetros, mejor que los 54,11 kilómetros de el Centro Europeo de Pronósticos Meteorológicos a Medio Plazo.
Largo camino por delante
El cambio esta en camino. Los grandes modelos meteorológicos tienen el potencial de cambiar los paradigmas de pronóstico del tiempo de muchas maneras, como la velocidad. Fengwu utiliza una GPU para generar 37 niveles de resultados de pronóstico del tiempo de alta precisión y alta resolución para todas las regiones del mundo en los próximos 14 días en 1 minuto, mientras que el pronóstico del tiempo de 7 días de Pangu tarda solo 9,8 segundos en generarse.
Por lo tanto, cambiará el sistema de transmisión de datos meteorológicos en tiempo real y la infraestructura de potencia informática general establecida para los cálculos numéricos. Según supo Pinwan desde dentro del Buró Meteorológico, aunque solo se utiliza como referencia de previsión a corto plazo, a medio y largo plazo, el potencial de los grandes modelos meteorológicos es sin duda enorme.
Ahora bien, puede haber dos problemas principales a los que se enfrentan estos grandes modelos meteorológicos: el primero es el ajuste. Cómo etiquetar correctamente datos como el clima extremo en el modelo grande es un problema. El modelo de IA tiene una fuerte capacidad de ajuste, por lo que pueden ocurrir errores en el pronóstico a largo plazo. Esto puede llamarse la "ilusión" del gran modelo. modelo meteorológico.
Además, los modelos actuales a gran escala no tienen una reserva de conocimientos técnicos más profundos de la industria, y la construcción de los modelos la realizan científicos informáticos en lugar de expertos en meteorología, lo que significa que estos modelos verticales a gran escala aún carecen de "retroalimentación humana". Afinación.
Otro problema es la potencia informática común. Aunque mi país se encuentra entre los primeros del mundo en términos de desarrollo de supercomputadoras, el modelo grande no utiliza la potencia informática general de las supercomputadoras tradicionales. El funcionamiento de redes profundas requiere computación paralela a gran escala. Es la GPU de alto rendimiento, y seguimos estancados en este aspecto.
Afortunadamente, el costo de la potencia de cómputo directamente involucrada en el modelo grande del clima no es alto.Según la situación aprendida por Pinwan, docenas de tarjetas gráficas Nvidia (ni siquiera los modelos más avanzados) pueden completarse en unas pocas semanas, como máximo 2 meses Entrenamiento modelo. Esto también se ha convertido en una ventaja sobre los modelos tradicionales de predicción numérica.
Con la bendición de los grandes modelos meteorológicos, la frase "impredecible" pronto puede convertirse en una proposición falsa, y un día, tal vez podamos realmente predecir de dónde vienen las mariposas que revolotean y los huracanes violentos al mismo tiempo.
Con supercomputadoras y modelos grandes, ¿se puede predecir cualquier desastre meteorológico?
La mariposa escurridiza
El método mundial de pronóstico del tiempo se llama cálculo numérico. Después de recopilar suficientes y ricos datos meteorológicos, se sustituyen en ecuaciones complejas, y el resultado es el llamado pronóstico. Repitiendo este proceso, el pronóstico es continuo.
Detrás de estas ecuaciones hay algunas teorías sólidas, como ecuaciones de movimiento de fluidos, ecuaciones termodinámicas y diferentes interfaces, ecuaciones de intercambio de energía de material de aire, agua, hielo terrestre, etc. Las leyes físicas y químicas que representan han sido rigurosamente calculadas y verificadas.
Pero el pronóstico del tiempo todavía no es absolutamente exacto. Este tipo de predicción numérica sirve para predecir la tendencia futura a través de los cambios de elementos meteorológicos que han ocurrido, y su precisión se ve seriamente afectada por la precisión de los datos de observación.
Además, con el cambio de escalas temporales y espaciales, la complejidad del sistema meteorológico aumentará drásticamente, por un lado, al analizar las causas del clima, habrá muchas cosas que faltan, y por otro lado, habrá más errores en los datos, lo que a su vez afecta la predicción.
Y cuando la escala sea lo suficientemente grande, el clima entrará en un estado caótico. Esto no es una metáfora. El sistema meteorológico es un sistema caótico típico. La teoría del caos fue propuesta por primera vez por meteorólogos en 1963.
Un sistema caótico significa que perturbaciones muy pequeñas en el sistema pueden tener consecuencias muy diferentes; otro nombre para esto es el efecto mariposa, donde una mariposa bate sus alas en California y se levanta una tormenta en Texas y el Golfo de México.
Esto requiere que el cálculo inicial del valor debe ser muy preciso, pero todos sabemos que la precisión absoluta no existe, sin mencionar que ante movimientos meteorológicos tan complejos, hay demasiados tipos y cantidades de datos para recolectar. .
La predicción humana del clima es como tratar de aprender la relación entre las alas de una mariposa y la trayectoria del ojo de una tormenta: es magnífico, a veces imposible e incluso esotérico.
Por un lado, se construyen ecuaciones de funciones cada vez más complejas en términos de precisión y se recopila la mayor cantidad de datos posible en intervalos más cortos; por otro lado, se confía en una experiencia casi "intuitiva".
Hasta el día de hoy, todos los resultados del pronóstico del tiempo todavía están determinados por dos partes: el resultado del cálculo numérico, más el juicio del pronosticador. El pronóstico del tiempo todavía depende en gran medida de la experiencia humana.
En cierta medida, los seres humanos están utilizando sus propios sentimientos para luchar contra el caos de la naturaleza.
supercomputadora
Por lo tanto, el pronóstico meteorológico presenta una característica extraña, porque mientras uno confíe en la experiencia y el sentimiento humanos, siempre habrá fallas, especialmente en algunos climas extremos, porque los datos sobre climas extremos son demasiado escasos, lo que hace que los humanos no tengan una experiencia coherente. de eso
Sin embargo, dado que la precisión de la predicción numérica ha mejorado en las últimas décadas, el pronóstico del tiempo actual puede alcanzar un nivel bastante preciso en muchos casos. El pronóstico de usabilidad a mediano plazo es de cerca de 10 días, y el pronóstico a corto plazo, para Por ejemplo, cuándo llegará el aire frío y cuánto bajará la temperatura, los humanos han podido juzgar con mucha precisión. Esto se debe a que, si bien los cambios en el entorno climático global general son caóticos, en muchos niveles microscópicos, como la formación de masas de aire, los cambios en la presión del aire y la trayectoria de los movimientos de las nubes, se describen de manera vívida y precisa mediante más y más funciones y fórmulas
Por ejemplo, las recientes lluvias torrenciales en Beijing, Tianjin y Hebei.
Del 29 de julio al 1 de agosto, el tifón Dusurui se desplazó hacia el norte con abundante vapor de agua y fue interceptado por altas presiones en el norte de China. Tormentas de lluvia extremas pocas veces vistas en la historia ocurrieron en la región de Beijing-Tianjin-Hebei.
El extremo se refleja en varios aspectos, el primero es la gran cantidad. La precipitación en el condado de Lincheng, Xingtai, provincia de Hebei supera los 1.000 milímetros, o 1 metro, lo que equivale a la cantidad total de precipitación en los dos años originales aquí. En segundo lugar, duró casi cuatro días a partir del 29 de julio y llovió continuamente durante 83 horas incluso en Beijing. Hebei, Shaanxi, Henan y otros lugares también experimentaron fuertes lluvias durante dos días consecutivos. Finalmente, tiene una amplia gama de influencia, y todo el norte de China está cubierto de lluvia.
Los meteorólogos predijeron esta lluvia extrema con casi total precisión. Detrás de esto está el gran progreso del pronóstico del tiempo en las últimas décadas: el cálculo numérico se ha desarrollado desde un simple conjunto de ecuaciones hasta uno de los algoritmos más complejos del mundo. weather Bueno, y para manejar esta enorme cantidad de datos y algoritmos complejos, se introdujeron las supercomputadoras.
Es posible que muchas personas no tengan idea de la enorme cantidad de datos meteorológicos, pero aquí hay una cifra: todos los días, los datos meteorológicos de China crecen hasta 40 TB. mi país ha establecido un conjunto completo de red de observación meteorológica tridimensional, con más de 70.000 estaciones de observación meteorológica que cubren el 99,6 % de las ciudades y pueblos del país. El tiempo de transmisión de datos se ha reducido de 1 hora en el pasado a 1 minuto en los últimos años.
Es bastante difícil manejar una cantidad tan grande de datos en sí, pero es casi imposible combinarlos con ecuaciones de cálculo numérico: las ecuaciones diferenciales parciales complejas y los cálculos de punto flotante requieren muchos cálculos. requiere una puntualidad extremadamente alta Bajo varias limitaciones, solo las supercomputadoras pueden satisfacer la demanda.
Afortunadamente, China está a la vanguardia del mundo en este sentido.
La supercomputación siempre ha sido una tarjeta de presentación de China. Por ejemplo, China tiene 162 de las 500 supercomputadoras más rápidas del mundo. Otro ejemplo es que he ganado el premio más alto para aplicaciones internacionales de supercomputación: el Premio Gordon Bell tres veces. Dos de ellas son The dos contenidos premiados "Marco de Dinámica Atmosférica" y "Simulación de Terremotos" están relacionados con la meteorología.
La supercomputadora que se usa actualmente en China se llama "Pai-Dawn". Su velocidad máxima de cómputo alcanza los 8189,5 billones de veces por segundo y su capacidad de almacenamiento alcanza los 23088 TB. La escala saltó al tercer lugar en el mundo en el campo de la meteorología.
Esto no ha terminado. Con el rápido crecimiento del volumen de datos y el desgaste del hardware, la vida útil de las supercomputadoras es principalmente de 6 a 8 años. Por lo tanto, después de "Pai-Dawn", también se lanzan nuevas supercomputadoras una tras otra. Se instaló y construyó el primer lote de un nuevo subsistema de computación de alto rendimiento (HPC) 1 de nivel estatal de este año. 76PB.
Más supercomputadoras están en camino.
El mapa conceptual del sistema informático nacional de alto rendimiento "Pai-Shuguang". La imagen proviene del Centro Nacional de Información Meteorológica.
** "Estancamiento" y el Nuevo Camino**
En general, la supercomputación compuesta por cientos o miles de CPU constituye una base sólida para el pronóstico del tiempo, pero todavía hay cosas que no se pueden hacer o son difíciles de hacer.
Como tifón. Nuestra predicción del tifón Dusurui está lejos de la precisión de la predicción de fuertes lluvias. Todos los principales métodos de predicción de tifones en el mundo utilizan modelos dinámicos, que simulan el movimiento atmosférico en función de las leyes de la física atmosférica, incluidas la dinámica de fluidos y la termodinámica, y luego predicen los cambios en los tifones.
Hay muchas imprecisiones en el modelo dinámico, lo que hizo que todos predijeran el camino de Du Surui en una variedad de formas al principio. Surui iría directamente al delta del río Pearl.
De hecho, el pronóstico de tifones siempre ha sido un problema mundial, porque un tifón puede sufrir cambios drásticos de intensidad en un corto período de tiempo y su trayectoria es impredecible debido a la influencia de muchos factores en una escala espacio-temporal muy grande.
Es un sistema caótico típico.
Por lo tanto, el pronóstico del tiempo basado en la predicción numérica se ha convertido en un complejo de contradicciones, lo que hace que tenga un gran margen de mejora, pero es muy limitado: la única forma en que las personas se acercan a la precisión es acumulando experiencia. Recopilando datos y construyendo más y más. funciones más complejas, pero sus beneficios marginales son cada vez más fuertes Más datos no pueden mejorar en gran medida y de manera integral la precisión de los pronósticos meteorológicos en las escalas macro y micro, mientras que el costo general de la computación continúa creciendo.
En este punto, la situación parece haber llegado a un punto muerto. Los datos masivos, los algoritmos complejos y los requisitos de alta potencia informática hacen que los cálculos numéricos se conviertan en un cuello de botella hasta cierto punto, pero ¿le resultan familiares estas tres condiciones?
¿Se parece un poco a los tres elementos de un gran modelo?
De hecho, en el material de un seminario interno sobre tecnología meteorológica visto por Pinwan, algunos expertos declararon directamente que la inteligencia artificial y el trabajo meteorológico son similares en metodología.
Dado que las fórmulas de cálculo numérico en realidad no pueden agotar todas las causas y efectos en todo el sistema caótico, ¿por qué no usar el método de red neuronal para importar datos masivos y dejar que la computadora encuentre y aprenda las leyes por sí misma?
Esta parece ser una explicación indescriptible, pero extremadamente misteriosa y razonable.
ENIAC, la primera computadora electrónica de la humanidad, y EDSAC, la primera computadora construida según la estructura de von Neumann, se usaron en realidad para realizar cálculos científicos relacionados con la meteorología. El desarrollo de la meteorología siempre ha estado en línea con el desarrollo de la informática. El progreso está estrechamente relacionado: la informática de alto rendimiento ha promovido la solución de problemas complejos en la ciencia meteorológica y, después de saltar del pensamiento informático general, las redes neuronales y los modelos grandes parecen ser una dirección muy interesante y razonable para la meteorología y el pronóstico del tiempo. .
De hecho, el Observatorio Meteorológico Central se refirió a los resultados del modelo a gran escala de inteligencia artificial para la predicción de la trayectoria del tifón Dusurui.
De otra manera
Los grandes modelos meteorológicos no aparecieron con la popularidad de la IA generativa a finales del año pasado. Ha habido muchos modelos grandes que utilizan una potente potencia informática, enormes cantidades de datos y varias arquitecturas de aprendizaje profundo para predecir el tiempo. Los más famosos en el extranjero se encuentran Nvidia FourCastNet, DeepMind, GraphCast de Google y ClimaX de Microsoft, los últimos modelos nacionales son el modelo Huawei Pangu y el modelo Shanghai Fengwu, este último del Laboratorio de Inteligencia Artificial de Shanghai.
Tanto Pangu como Fengwu utilizaron el conjunto de datos de reanálisis meteorológico del Centro Meteorológico Europeo llamado ERA5, que proporcionó un total de 2000 TB de varios datos meteorológicos que cubren 37 superficies isobáricas en la superficie terrestre durante los últimos 60 años.
Estos datos brindan un espacio para que los modelos grandes jueguen: en lugar de usar cálculos numéricos precisos y correspondientes, la IA puede extraer de manera más flexible varias relaciones complejas entre los datos.
Pangu construyó una estructura de transformador 3D para integrar los complejos procesos físicos interactivos del océano, la atmósfera y la tierra. En el pasado, los grandes modelos climáticos, como FourCastNet de Nvidia, usaban una estructura 2D: cada superficie isobárica es una capa, obviamente, hay No hay forma de que el plano 2D refleje mejor el proceso de cambios meteorológicos.
Según los materiales vistos por Pinwan, Huawei usó codificación de posición absoluta en esta estructura 3D, lo que aceleró significativamente la convergencia del modelo.Además, Huawei entrenó cuatro modelos básicos correspondientes a 1 hora, 3 horas, 6 horas y 24 horas respectivamente. Predicción horaria, el método de fusión en el dominio del tiempo reduce significativamente el error causado por el tamaño de paso pequeño y las iteraciones múltiples en el modelo anterior.
Para la predicción del antiguo y difícil tifón, Pangu utilizó la presión media a nivel del mar como referencia de predicción y el resultado fue mejor que el de la Agencia Meteorológica Europea.
La idea del modelo grande de Fengwu es usar 6 codificadores independientes para codificar y decodificar diferentes parámetros meteorológicos (humedad, viento, temperatura, etc.), y usar redes de transformadores independientes para aprender entre diferentes variables.
A diferencia del método de fusión de dominio de tiempo de Huawei para reducir errores, Fengwu diseñó un espacio de caché para almacenar y reproducir los resultados del proceso de entrenamiento, de modo que la red neuronal pueda adaptarse a sus errores, logrando así mejores resultados de predicción.
Aunque los resultados de estos nuevos modelos de predicción meteorológica a gran escala aún son preliminares, y los resultados publicados son mejores que los métodos tradicionales de predicción numérica en algunos indicadores específicos, todavía se necesitan pruebas exhaustivas y optimización, pero no hay duda de que representan un tipo de Un nuevo paradigma radicalmente diferente a la previsión meteorológica tradicional.
En la actualidad, el modelo a gran escala Pangu de Huawei ha logrado una operación comercial preliminar en el centro europeo de pronóstico del tiempo de mediano alcance, mientras que Fengwu afirma ser el modelo de pronóstico del tiempo de IA de alta resolución global más preciso 38,7 kilómetros, mejor que los 54,11 kilómetros de el Centro Europeo de Pronósticos Meteorológicos a Medio Plazo.
Largo camino por delante
El cambio esta en camino. Los grandes modelos meteorológicos tienen el potencial de cambiar los paradigmas de pronóstico del tiempo de muchas maneras, como la velocidad. Fengwu utiliza una GPU para generar 37 niveles de resultados de pronóstico del tiempo de alta precisión y alta resolución para todas las regiones del mundo en los próximos 14 días en 1 minuto, mientras que el pronóstico del tiempo de 7 días de Pangu tarda solo 9,8 segundos en generarse.
Por lo tanto, cambiará el sistema de transmisión de datos meteorológicos en tiempo real y la infraestructura de potencia informática general establecida para los cálculos numéricos. Según supo Pinwan desde dentro del Buró Meteorológico, aunque solo se utiliza como referencia de previsión a corto plazo, a medio y largo plazo, el potencial de los grandes modelos meteorológicos es sin duda enorme.
Ahora bien, puede haber dos problemas principales a los que se enfrentan estos grandes modelos meteorológicos: el primero es el ajuste. Cómo etiquetar correctamente datos como el clima extremo en el modelo grande es un problema. El modelo de IA tiene una fuerte capacidad de ajuste, por lo que pueden ocurrir errores en el pronóstico a largo plazo. Esto puede llamarse la "ilusión" del gran modelo. modelo meteorológico.
Además, los modelos actuales a gran escala no tienen una reserva de conocimientos técnicos más profundos de la industria, y la construcción de los modelos la realizan científicos informáticos en lugar de expertos en meteorología, lo que significa que estos modelos verticales a gran escala aún carecen de "retroalimentación humana". Afinación.
Otro problema es la potencia informática común. Aunque mi país se encuentra entre los primeros del mundo en términos de desarrollo de supercomputadoras, el modelo grande no utiliza la potencia informática general de las supercomputadoras tradicionales. El funcionamiento de redes profundas requiere computación paralela a gran escala. Es la GPU de alto rendimiento, y seguimos estancados en este aspecto.
Afortunadamente, el costo de la potencia de cómputo directamente involucrada en el modelo grande del clima no es alto.Según la situación aprendida por Pinwan, docenas de tarjetas gráficas Nvidia (ni siquiera los modelos más avanzados) pueden completarse en unas pocas semanas, como máximo 2 meses Entrenamiento modelo. Esto también se ha convertido en una ventaja sobre los modelos tradicionales de predicción numérica.
Con la bendición de los grandes modelos meteorológicos, la frase "impredecible" pronto puede convertirse en una proposición falsa, y un día, tal vez podamos realmente predecir de dónde vienen las mariposas que revolotean y los huracanes violentos al mismo tiempo.