Aurora : Un Nouveau Modèle de Fondation de l’Atmosphère

by in Actualité 2 septembre 2024

Les modèles de fondation en apprentissage profond (Deep Learning) ont révolutionné, ces dernières années, divers domaines scientifiques tels que la prédiction de la structure des protéines, la découverte de médicaments, la vision par ordinateur ou encore le traitement du langage naturel. Ces modèles constituent des technologies capables d’accomplir un large éventail de tâches générales et se distinguent des systèmes d’Intelligence Artificielle (IA) restreints, qui se concentrent sur une tâche spécifique ou limitée.

Les modèles de fondation reposent sur deux grandes phases :

  • un pré-entraînement, où un réseau neuronal apprend à capturer des configurations et des structures complexes à partir de vastes ensembles de données diversifiées ;
  • et un fine-tuning, qui permet au modèle d’exploiter au mieux les représentations acquises pour les appliquer, avec de très bons résultats, à de nouvelles tâches sur lesquelles il dispose de données d’entraînement limitées.

Plusieurs initiatives ont déjà vu le jour visant l’application de l’IA à la modélisation du temps ou du climat : Pangu-weather et son prolongement Zhiji, développés par Huawei, GraphCast mis en place par Google, FourCastNet, développé par Nvidia, ou encore une collaboration entre IBM et la NASA annoncée fin 2023.

Le système Terre constitue un réseau complexe et interconnecté de sous-systèmes (atmosphère, océans, terres, glace) en étroite interaction. Dans un contexte de changement climatique où la compréhension précise de ces sous-systèmes prend une importance croissante, les modèles de fondation pourraient profondément transformer notre capacité à modéliser ceux-ci et la Terre dans son ensemble. D’autant plus que l’atmosphère, sur laquelle on dispose de très nombreuses données, est particulièrement propice au pré-entraînement de ce type de modèle.

C’est sur la base de ces constats que l’équipe de recherche de Microsoft a développé Aurora, un modèle de fondation à grande échelle pour l’atmosphère. Aurora génère des prévisions de pollution de l’air à 5 jours et des prévisions météorologiques mondiales à 10 jours, et ce à résolution spatiale élevée (jusqu’à 0,4° et 0,1°, respectivement ; 0,1° ~ 11 km à l’équateur), surpassant les outils de simulation classiques et les autres approches d’apprentissage profond actuelles. En somme, c’est un modèle composé de 1,3 milliard de paramètres pré-entraîné sur plus d’un million d’heures de données atmosphériques diversifiées, principalement constituées de simulations de modèles météorologiques et climatiques.

 

Aurora par APPA