Thierry Castel

Regional climate, Variability, Climate Change Impacts

R2D2C : remise à niveau R

Environnement et outils de traitement des données

L’outils logiciel préconisé est R qui permet le traitement avancé des données numériques et leur analyse statistique. Outre qu’il implémente l’état de l’art des méthododes statistiques, R offre la possibilité de tracer les données et de produire des figures de qualité. La mise en oeuvre de ces fonctionnalités est délicate à partir de l’éditeur natif de R. Pour cela différent environnement de développement intégré encore appelés IDE (Interactive Development Environment) ont été développés afin d’améliorer la prise en main, l’efficacité et les échanges. Parmis les IDE utilisés avec R nous pouvons vous en conseiller deux :

  • RStudio qui est un IDE spécifique à R et qui offre une version opensource pour Windows assez facilement installable;
  • Jupyter un IDE ‘universel’ s’appuyant sur le concept de notebook qui facilite la publication, les échanges et la ré-utilisation du code. L’installalation sous Windows n’est pas directe et nécessite d’installer la plateforme Anaconda;

Installation de R + RStudio ou R + Jupyter via Anaconda

R + RStudio

Pour Windows :

  1. récupérer les exécutables (i.e. .exe) de R et RStudio via les liens ci-dessus;
  2. installer R en utilisant les options proposées par défaut;
  3. installer RStudio en double cliquant sur l’exécutable et suivre les étapes.

Anaconda

L’installation est quasi identique pour windows, linux et macOS. Nous présentons ci-dessous les principales étapes de la récupération à l’intallation. Nous montrons comment créer un nouvel environnement avec R et Jupyterlab.

  • Récupération d’Anaconda

Anaconda

  • Installation d’Anaconda

Une fois le fichier exécutable (‘Anaconda3-2021.05-Windows-x86_64.exe’) cliquer deux fois dessus pour lancer l’installation

install1 install2 install3
  • Anaconda Navigator -> menu démarrer

Anaconda apparaît après l’installation dans votre menu démarrer. Il faut lancer Anaconda Navigator pour gérer les environnements et l’intallation des packages. install1

Anaconda propose un environnement isolé afin de gérer les dépendances et la version des logiciels. C’est pour cela qu’il nécessite à minima 3Go d’espace disque.

  • Anaconda Navigator -> Interface

L’interface anaconda de base propose par défaut une séries de logiciel installés ou à installer en fonction des besoins. install1

Cet environnement de base est très stable. En contrepartie ce ne sont pas les versions les plus récentes des logiciels qui sont proposées. Pour avoir des versions plus récentes il faudra ajouter un liens (Channels).

  • Anaconda Navigator -> Channels

On vous propose d’ajouter le Channel ou lien conda-forge qui pointe sur les versions plus récentes et propose plus de logiciels install1

Ce Channel est maintenu par une large communauté issue du monde open-source permet de créer de nouveaux environnements opérationnels pour vos besoins. Dans notre cas on vous propose une fois le Channel ajouter de créer un nouvel environnement avec un version plus récente de R, Jupyterlab et le noyau (kernel) de R pour jupyterlab.

  • Anaconda Navigator -> Création d’un nouvel environnement

On vous propose d’ajouter le Channel ou lien conda-forge qui pointe sur les versions plus récentes et propose plus de logiciels. Ici on active l’intallation de R et python. Anaconda va se baser sur le Channel conda-forge pour les versions des logiciels. install1

Après sa création on va pouvoir ajouter les logiciels et packages dont on a besoin et notamment jupyterlab et les libraries spécifiques en plus des librairies de base.

  • Anaconda Navigator -> Installation de logiciel et librairies

Sélectionner votre nouvel environnement recherche dans les logiciels et librairies non installés jupyterlab et les libraries R listées plus bas dans la page. install1

Après cette opération vous pouvez retourner sous Home et à partir de votre nouvel environnement vous pouvez lancer Jupyterlab. Jupyterlab vous permet d’ouvrir le notebook et lancer bloc de code. Pour cela il vous faudra récupérer les données via le lien ci dessous et modifier dans le notebook le chemin d’accès aux données .

Les librairies à installer pour le TP sont :

  • sf, leaps, relaimpo

Script et données

docs, données et scripts sont à récupérer ici : data

Le notebook vous permet de prendre connaissance des différentes étapes, de commencer à tester le code sur votre machine.

Nous reviendrons au cours de la séance sur les différentes étapes.