04.07.2026

Étude de cas : annotation d’images Sentinel-2 pour la surveillance des cultures par IA

L’imagerie Sentinel-2 permet d’analyser la santé des cultures, les sols et l’évolution des parcelles à grande échelle. Cette étude de cas explique comment transformer des images satellite brutes en datasets annotés exploitables pour des modèles IA de surveillance agricole.

Étude de cas sur l’annotation d’images Sentinel-2 pour entraîner des modèles IA de surveillance des cultures et d’agriculture de précision.

Pourquoi l’imagerie Sentinel-2 est importante pour la surveillance des cultures

Sentinel-2, qui fait partie du programme Copernicus de l’Agence spatiale européenne, est l’un des systèmes satellitaires en libre accès les plus puissants pour l’analyse agricole. Avec une résolution spatiale allant jusqu’à 10 mètres et des cycles de revisite fréquents (tous les 5 jours à l’équateur), il est particulièrement adapté pour suivre l’évolution de la végétation au fil du temps.

Les principaux avantages de Sentinel-2 pour l’agriculture sont les suivants :

  • Imagerie multispectrale sur 13 bandes (visible, proche infrarouge et infrarouge à ondes courtes)
  • Fréquence temporelle élevée pour observer les stades phénologiques
  • Données gratuites et open source disponibles via des plateformes telles que Centre d’accès ouvert Copernicus ou Sentinel Hub

Ces fonctionnalités permettent aux équipes d’IA de surveiller le développement des cultures, de prévoir le moment des récoltes, de détecter le stress des ravageurs et d’évaluer les besoins en irrigation sans déployer de capteurs physiques sur le terrain.

L’enjeu de l’annotation : transformer les données brutes en informations terrain

L’imagerie Sentinel-2, bien que riche en informations spectrales, est dépourvue d’un élément essentiel pour la formation de modèles d’apprentissage automatique supervisé : signification sémantique. Chaque pixel réfléchit la lumière, mais sans étiquettes, l’IA ne peut pas distinguer un champ de blé d’une parcelle de soja, ni distinguer une végétation stressée d’une culture saine. C’est là qu’intervient l’annotation.

Dans le contexte de l’IA agricole, l’annotation consiste à associer des pixels à des classes de cultures réelles, dans le temps et dans l’espace. Elle comble le fossé entre données brutes de télédétection et informations agricoles exploitables, en convertissant d’énormes volumes d’images d’observation de la Terre en jeux de données d’entraînement annotés.

Des données spectrales aux étiquettes exploitables

Pour transformer les données Sentinel-2 en échantillons d’entraînement utilisables, l’équipe a entrepris un processus d’annotation à plusieurs niveaux qui allait bien au-delà de la simple classification :

  • Segmentation sémantique: une étiquette de culture spécifique a été attribuée à chaque pixel d’une vignette satellite. Cela a été réalisé grâce à la conversion vectorielle en raster de cartes géospatiales des cultures, produisant des masques à haute résolution.
  • Synchronisation temporelle: Étant donné que la croissance des cultures évolue au fil du temps, l’imagerie statique entraîne souvent une mauvaise classification. Les annotateurs ont aligné chaque image sur les phases de développement des cultures à l’aide de données phénologiques locales et de stratégies d’acquisition multidates.
  • Cartographie de l’indice spectral: Des indices tels que NDVI, NDWI et EVI ont été calculés et empilés le long de bandes brutes, améliorant ainsi la distinction spectrale. Ces bandes calculées ont été intégrées à l’annotation, en particulier lorsque de subtiles différences de classe (par exemple, maïs par rapport au sorgho) étaient impliquées.
  • Assurance qualité des étiquettes: La cohérence de chaque annotation a été évaluée à l’aide de rapports de terrain, de courbes phénologiques connues et d’une détection automatique des valeurs aberrantes (par exemple, si le NDVI baisse à la mi-saison, cela peut indiquer une erreur d’annotation ou un impact sur le ravageur).

Équilibrer précision et évolutivité

L’une des tâches les plus difficiles de ce projet a été de concilier besoin d’une haute résolution et d’une précision au niveau des pixels avec le énorme volume de données de Sentinel-2. L’équipe a dû annoter des dizaines de milliers de kilomètres carrés tout en préservant la précision spatiale.

Ce problème a été résolu en introduisant un flux de travail d’annotation hybride, combinant validation manuelle et processus SIG automatisés :

  • Pour les régions bien documentées comme la France ou l’Allemagne, les données LPIS nationales ont fourni des cartes des cultures très fiables, faciles à pixelliser.
  • Dans les zones peu documentées, comme certaines parties de l’Argentine ou du Brésil, les annotateurs se sont appuyés sur une combinaison de classification basée sur MODIS, de séries chronologiques Sentinel-2 NDVI et d’évaluations d’experts locaux.
  • Les cas extrêmes et les incohérences ont été signalés pour examen par des agronomes ou signalés à un niveau supérieur par le biais d’un pipeline d’assurance qualité semi-automatisé.

En fin de compte, chaque patch étiqueté n’était pas qu’une image, c’était un instantané riche en données, annotés avec le type de culture, la date, le stade de la saison, les métadonnées spectrales et les coordonnées géographiques. Ces attributs étaient essentiels pour garantir généralisation du modèle et transférabilité temporelle.

Construire le pipeline d’annotation : des pixels aux motifs agricoles

Créer un système d’annotation évolutif pour l’imagerie satellite ne revient pas à étiqueter des cadres de délimitation sur les images de rue. Cela nécessite un pipeline bien pensé comportant plusieurs étapes de prétraitement, de validation et d’harmonisation.

Voici comment le flux de travail d’annotation a été structuré :

1. Curation des données Sentinel-2

Le processus a commencé par le téléchargement d’images Sentinel-2 de niveau 2A, corrigées pour tenir compte des distorsions atmosphériques, pour certaines zones agricoles. L’équipe a classé les scènes par ordre de priorité pendant les principales phases de croissance des cultures : début de saison (émergence), mi-saison (pic de croissance) et pré-récolte.

Pour garantir la qualité des données, seules les images présentant une couverture nuageuse inférieure à 5 % ont été conservées. Le masquage des nuages a été encore amélioré à l’aide du SCL (couche de classification des scènes) et supplémentaires Sen2Cor prétraitement.

2. Aligner les cartes de vérité terrain

Cartes des cultures faisant autorité issues de bases de données agricoles nationales et d’enquêtes menées par des ONG (telles que LPIS) ont été superposées sur des tuiles Sentinel-2 à l’aide d’outils SIG.

Ces fichiers de formes ont été pixellisés pour correspondre à la résolution Sentinel-2. Chaque pixel recevait un identifiant de type de culture s’il croisait des polygones de base, ce qui a permis d’obtenir des masques de segmentation sémantique compatibles avec l’apprentissage des modèles.

3. Étalonnage de l’indice spectral

Plutôt que de travailler uniquement avec des bandes brutes (B2 à B12), l’équipe a calculé des indices de végétation tels que :

  • NDVI (Indice de végétation différentielle normalisé)
  • EVI (Indice de végétation amélioré)
  • NDWI (Indice de différence d’eau normalisé)

Ces indices ont été empilés sous forme de canaux supplémentaires dans les fichiers d’annotations, améliorant ainsi la séparabilité des classes pendant l’entraînement.

4. Agrégation temporelle

Compte tenu des fréquentes revisites de Sentinel-2, l’équipe a mis en place un stratégie d’empilement temporel — combinaison d’images multidates dans des tenseurs composites. Chaque patch annoté ne représentait pas un horodatage unique mais une série chronologique (par exemple, 5 dates sur une saison).

Cela a amélioré la capacité du modèle à détecter de subtiles différences phénologiques entre les cultures.

Relever les défis propres à l’annotation satellite

L’annotation en télédétection comporte un ensemble d’obstacles spécifiques, chacun nécessitant des solutions adaptées :

Interférences entre les nuages et les ombres

Malgré le filtrage des images nuageuses, de fins cirrus et des ombres projetées peuvent altérer les lectures spectrales. Pour pallier ce problème :

  • Un masque de probabilité de nuages personnalisé (basé sur Algorithme FMask) a été appliqué.
  • Les patchs présentant une couverture nuageuse persistante (> 40 %) ont été automatiquement supprimés de l’ensemble de données d’entraînement.

Bruit d’étiquetage dans la vérité terrain

Les cartes agricoles fiables sur le terrain, en particulier dans les régions en développement, étaient souvent périmées ou grossièrement dessinées. L’équipe a utilisé inspection visuelle sur les courbes NDVI et rapports de terrain pour valider les polygones douteux.

Dans les cas limites, les pixels ambigus étaient étiquetés comme « Inconnus » et exclus de l’entraînement.

Variabilité géographique

Le blé en France pousse différemment du blé en Argentine. Pour garantir la robustesse géographique, l’ensemble de données a été scindé en :

  • Formation et tests dans la région (au sein d’un même pays)
  • Validation hors région (modèle formé dans un pays, testé dans un autre)

Cette approche de validation croisée a permis d’évaluer la capacité de généralisation — un KPI essentiel pour une IA agricole évolutive.

Des résultats concrets : la surveillance des cultures assistée par l’IA en action

L’ensemble de données Sentinel-2 annoté a jeté les bases de la formation de modèles robustes de classification des cultures multisaisons capables de soutenir la prise de décisions en temps réel sur tous les continents. Une fois l’annotation terminée et le pipeline d’entraînement optimisé, les résultats étaient à la fois impressionnants sur le plan technique et avaient un impact sur l’agriculture.

Principaux résultats de performance

À l’aide d’un réseau neuronal convolutif profond avec une dorsale U-Net et des couches d’attention temporelle, le modèle a obtenu les résultats suivants :

  • 92,3 % Intersection moyenne au-dessus de l’Union (MiOu) pour la classification régionale du blé, du maïs et du soja, ce qui signifie que l’IA a cartographié avec précision les champs de culture à une résolution au pixel près dans les zones d’entraînement.
  • Précision de 84,1 % sur des tests totalement hors région (formés en Europe, testés en Amérique du Sud), témoignant d’une forte généralisation.
  • Taux de rappel élevés (> 90 %) pour la détection précoce de la croissance, essentielle pour les systèmes d’alerte précoce en cas d’épidémie de ravageurs ou de stress hydrique.
  • Temps d’inférence rapide, permettant le déploiement du modèle dans des provinces ou des pays entiers en quelques heures au lieu de plusieurs jours.

Ces résultats ont surpassé les méthodes traditionnelles de classification par télédétection, qui reposaient souvent sur un clustering non supervisé ou des indices phénologiques limités sans supervision au niveau des pixels.

Déploiements en conditions réelles

Plusieurs déploiements ont suivi dans différentes zones géographiques, institutions et cas d’usage :

  • En Argentine, le ministère de l’Agriculture a utilisé le système pour suivre le développement du soja à Cordoue. Le modèle a détecté avec précision une émergence retardée dans les zones touchées par la sécheresse des semaines avant les chercheurs humains.
  • En France, une coopérative régionale d’Occitanie a utilisé le système pour surveiller le stress azoté du blé à l’aide des tendances NDVI, réduisant ainsi l’utilisation d’engrais de 12 % sans affecter le rendement.
  • En Inde, le modèle a été intégré à une plateforme d’ONG qui soutient les petits agriculteurs. En cartographiant les modèles de culture au Pendjab et au Telangana, il a permis de prévoir les rendements avec plus de précision et d’éclairer les politiques d’approvisionnement au niveau de l’État.

Chaque cas a démontré non seulement sa précision, mais utilité pratique — l’ensemble de données annoté a rendu les modèles d’IA plus transparents, plus adaptables et bien plus utiles dans des contextes agricoles réels.

Cartes de vérification visuelle et de confiance

Pour renforcer la confiance des agriculteurs et des décideurs politiques, le système comprenait cartes thermiques de confiance parallèlement à ses prévisions. Ces cartes ont été dérivées des résultats de softmax et comparées à des zones annotées manuellement pour des vérifications ponctuelles.

Les prévisions à haut niveau de confiance ont permis de hiérarchiser les alertes auxquelles il fallait donner suite, tandis que les zones à faible niveau de confiance ont signalé des données incertaines, souvent en raison de l’ombre des nuages, de la rotation des cultures ou de limites mixtes d’usage des sols.

Cette boucle de rétroaction visuelle a encouragé IA collaborative, où des agronomes humains et des agriculteurs pourraient valider et améliorer les prévisions des modèles sur le terrain, selon un cercle vertueux d’annotation → entraînement → retour → réannotation.

Impact sur les prévisions de rendement et la durabilité

L’impact le plus convaincant a peut-être été prévisions agricoles et rapports sur la durabilité:

  • Le système d’IA a réduit le besoin de visites mensuelles sur le terrain de 60 à 70 %, réduisant ainsi les émissions de carbone provenant des enquêtes effectuées sur des véhicules.
  • Les prévisions utilisant les résultats de l’IA se sont alignées à ± 5 % près des rapports de rendement réels pour le blé et le maïs sur trois saisons.
  • La plateforme a activé détection précoce des pertes de rendement en raison du stress hydrique, en aidant les coopératives et les assureurs à planifier une meilleure distribution des ressources.

En résumé, l’ensemble de données Sentinel-2 soigneusement annoté a permis à l’IA non seulement de reconnaître les cultures, mais aussi d’anticiper les risques, faisant passer la surveillance agricole d’une observation passive à intelligence prédictive.

Leçons apprises et points à retenir pour les projets futurs

Cette étude de cas met en lumière plusieurs enseignements importants pour toute équipe qui envisage d’annoter des images Sentinel-2 pour l’IA agricole :

Priorisez les fenêtres temporelles sans nuages

Les composites saisonniers réduisent les erreurs d’annotation et enrichissent l’apprentissage des modèles. Un filtrage intelligent permet d’éliminer les horodatages non pertinents.

Validez la vérité terrain avec diligence

Ne vous fiez pas aveuglément à tous les shapefiles, en particulier dans les régions émergentes. Combinez des cartes officielles avec des rapports de terrain ou des indicateurs visuels.

Adoptez un contexte multidate

Le développement des cultures est un processus et non un cadre. L’annotation de séries chronologiques permet de créer des modèles d’IA plus robustes.

Équilibrez quantité et diversité

Un plus grand nombre de patchs est utile, mais la diversité spatiale est plus importante. Annotez les climats, les types de sols et les pratiques agricoles.

Complément : intégrer les calendriers culturaux

Pour affiner à la fois la qualité des annotations et les performances de l’IA, l’équipe a utilisé des calendriers agricoles régionaux provenant de sources telles que calendrier cultural de la FAO pour chronométrer la curation de leur ensemble de données.

Cela a permis d’éviter les erreurs d’étiquetage pendant lesquelles plusieurs cultures pourraient partager des signatures spectrales similaires et de se concentrer sur les phases de pointe phénologiques lorsque les différences sont plus claires.

Quelle est la prochaine étape ? Passage à l’échelle grâce à des pipelines d’annotation automatisés

L’annotation manuelle des images Sentinel-2 est puissante mais prend beaucoup de temps. La prochaine frontière consiste à utiliser supervision faible et apprentissage autosupervisé pour aller plus loin.

Des techniques telles que :

  • Utilisation de modèles pré-entraînés pour pseudo-étiqueter des régions non étiquetées
  • Entraîner l’IA à reconnaître les modèles temporels de végétation sans surveillance
  • Combiner Sentinel-2 avec PlanetScope ou imagerie par drone pour le transfert hybride d’annotations

... peut accélérer considérablement la création de systèmes de surveillance des cultures robustes et sensibles à la géospatiale.

Parlons de votre cas d’usage

Vous travaillez sur une solution d’agriculture de précision ou sur l’intégration de l’IA par satellite ? Que vous développiez des modèles d’IA ou que vous créiez des plateformes agricoles intelligentes, l’imagerie annotée Sentinel-2 peut changer la donne dont vous avez besoin.

Vous souhaitez améliorer votre pipeline d’IA avec des données satellite annotées par des experts ? Contactez DataVLab pour démarrer votre projet.

Sujets Principaux
Améliorez vos modèles IA avec des données annotées de qualité

Nos équipes vous accompagnent dans la création de données annotées fiables, prêtes à entraîner, évaluer et améliorer vos modèles IA.

Abstract blue gradient background with a subtle grid pattern.

Découvrez nos différents
Applications industrielles

Nos services d'étiquetage des données s'adressent à divers secteurs d'activité, garantissant des annotations de haute qualité adaptées à vos besoins spécifiques.

Services d'annotation de données

Exploitez tout le potentiel de vos applications d'IA grâce à notre technologie experte d'étiquetage des données. Nous garantissons des annotations de haute qualité qui accélèrent les délais de vos projets.