Résumé
L’inventaire forestier a opéré en 2004 une réforme d’ampleur, visant à donner une unité nationale au plan de sondage, tout autant qu’à l’annualiser pour une réactivité accrue. Ces changements sont toutefois restés peu documentés, limitant l’évolution de la méthode, tout autant que son appréhension par la communauté forestière large. L’objet de cette contribution est de présenter ces principes d’échantillonnage et d’estimation, et de les discuter au regard des éclairages récemment apportés par les recherches conduites au Laboratoire d’inventaire forestier et des évolutions futures que l’on peut pressentir et visant à en renforcer la robustesse tout en répondant aux impératifs accrus en matière de monitoring forestier.
Messages clés :
- L’IFN a changé fondamentalement de méthode en 2004 pour permettre de produire une couverture nationale tous les ans.
- Cette méthode est complexe et fait appel tant à la stratification qu’à la post-stratification, grâce à une allocation plus efficace de l’effort de sondage.
- Cette contribution présente les grands principes de l’échantillonnage et de l’estimation qui lui est associée, aux fins d’une meilleure connaissance au sein de la communauté forestière.
Abstract
The forest inventory underwent a major reform in 2004 with the aim of giving national unity to the sampling design, as well as to annualise it for increased responsiveness. These changes have not been well-documented, however, limiting the development of the method and its acceptance by the wider forestry community. The aim of this article is to present the principals of forest inventory sampling and estimation. These are then discussed in the light of both the recent findings of research carried out at the Laboratory of Forest Inventory and future developments that can be anticipated, thereby enhancing its robustness while meeting increased forest monitoring requirements.
Highlights:
- The NFI fundamentally changed its method in 2004 to one that can be applied nationally every year.
- This method is complex and uses both stratification and post-stratification through a more efficient allocation of survey effort.
- This article presents the major principals of sampling and associated estimation with the aim of increasing knowledge within the forestry community.
Introduction
Dès sa création en 1958, l’Inventaire forestier national (IFN) a fonctionné essentiellement à l’échelle départementale, dans le cadre de cycles nationaux ayant eu une durée variant en pratique de dix à quatorze ans (Dereix, Lafitte et Puig, 2011). Les estimations nationales émanaient de la concaténation d’estimations départementales issues de plans d’échantillonnage décidés au niveau d’échelons régionaux. Ce mode de fonctionnement par département provoquait des chevauchements temporels importants dans les cycles nationaux, certains départements entrant dans un cycle national nouveau tandis que d’autres n’étaient toujours pas inventoriés dans le cadre du cycle passé. L’insuffisance de réactivité dans des circonstances exceptionnelles, telles que la tempête de 1999 pour laquelle une évaluation des conséquences ne put être immédiate, a provoqué une réforme de la méthode d’inventaire. L’accélération des perturbations, et globalement celle des changements dans les forêts (Bontemps, 2021), donnent a posteriori toute légitimité à ces objectifs d’alors, et au désir de transformer l’IFN en un instrument à même de suivre ces évolutions.
L’IFN a procédé au changement de sa méthode en 2004, opérant une rupture très importante avec la méthode précédente. Par méthode, on doit entendre à la fois la méthode d’échantillonnage et celle d’estimation, la deuxième découlant de la première. La « nouvelle méthode » (on continue de la nommer ainsi) a été proposée comme un moyen de répondre à ces besoins nouveaux, en particulier celui de mettre l’accent sur l’objectif de production de statistiques synchrones à l’échelle nationale ou régionale, et la possibilité de produire des estimations à un pas de temps beaucoup plus court qu’avant. Elle a été inspirée par celle de l’inventaire forestier américain (Forest Inventory and Analysis, FIA), réformé lui aussi en 1998.
Pour répondre à des ambitions aussi marquées, il a fallu créer et mettre en œuvre un plan d’échantillonnage radicalement différent de l’ancien. Les deux personnes responsables des fondements statistiques de l’IFN, et ayant contribué de manière très importante à la préfiguration de la nouvelle méthode, nous ont quittés (Jean Wolsack en 2012, et Jean-Christophe Hervé en 2017), laissant peu d’écrits, de sorte que plusieurs aspects de la méthode ne sont pas directement explicités ni justifiés. Une partie substantielle de ce qui est présenté dans cet article a fait l’objet de déductions a posteriori, notamment au plan de l’estimation.
Les méthodes employées tant pour l’échantillonnage que pour l’estimation ne sont pas des méthodes simples. Elles ont évolué et ont gagné en complexité pour permettre de répondre aux contraintes très fortes que représentent le besoin de précision, l’observation d’un très grand nombre d’attributs, la capacité à faire varier l’effort d’inventaire dans le temps et dans l’espace, selon les moyens financiers et humains à disposition. Les décrire dans le détail serait fastidieux (voir Bouriaud, 2020 ; Duong et al., 2024 ; et Bouriaud et al., 2023) et requiert des compétences en sondage statistique. La présentation faite ici tente plutôt d’offrir une vue d’ensemble des principes, accessible à tout lecteur, pour éclairer le fonctionnement de cette enquête.
Les méthodes d’estimation sont fortement conditionnées par l’échantillonnage réalisé. Dans le cas de l’IFN, le plan d’échantillonnage est complexe, étant constitué de plusieurs étapes successives. Il convient donc de présenter en détail ce plan d’échantillonnage, avant d’aborder l’estimation.
L’échantillonnage et son support fondé sur des grilles
Orientations
Le cahier des charges du plan de sondage comportait plusieurs objectifs qui ont conduit à des choix que l’on ne retrouve pas dans d’autres pays, dont l’inventaire est pourtant annualisé. Un des points essentiels est le fait que l’IFN crée un échantillon nouveau tous les ans (on verra par la suite pourquoi il vaut mieux faire référence à deux échantillons qu’un seul). La plupart des pays européens utilisent une grille comme support de l’échantillonnage, mais ne changent pas la position des points dans le temps (on peut parler de réseau permanent d’observation). Même s’ils mesurent une fraction des points tous les ans, ces points sont toujours les mêmes d’un cycle à un autre (par exemple en Pologne, en Roumanie, en Norvège, ou aux États-Unis dont l’inventaire français s’est inspiré : Vidal et al., 2005 ; Bontemps et Bouriaud, 2024), ce qui n’est pas du tout le cas en France. En ce sens ils ne produisent pas un nouvel échantillon tous les ans, mais remesurent un échantillon constitué lors de cycles précédents. Si ce type de plan offre un avantage certain dans une optique de suivi temporel (ou de monitoring), il n’assure cependant pas de renouvellement au regard d’une forêt au périmètre pourtant généralement en extension (Bontemps, 2021) – et c’est ici l’un des atouts de l’échantillonnage déployé en France.
Une grille globale structurant des sous-échantillons annuels
La grille d’échantillonnage est une grille kilométrique carrée qui couvre l’ensemble du territoire métropolitain (et en dépasse même les limites), Corse incluse. La grille permet de réaliser une tessellation de la surface du territoire en cellules de 1 x 1 km.
Un algorithme basé sur des propriétés algébriques fixes permet d’assigner à chaque cellule une année d’échantillonnage, selon une séquence de 1 à 10, qui permet de sous-échantillonner (extraire) une fraction dite annuelle. Cet algorithme a pour objet de créer des motifs géométriques réguliers, tels que chacun des sous-ensembles annuels représente aussi une grille carrée de densité moindre. Cette propriété est désirée : il s’agit de s’assurer que la distance entre cellules est constante au sein d’une fraction, et qu’elles sont distribuées à travers tout le territoire. Cette propriété renvoie à la notion d’équilibre spatial : les sous-ensembles (appelés fractions annuelles) formant un motif lui-même carré, la grille est dite emboîtée (voir dans le détail Bouriaud et al., 2023).
En pratique, la grille utilisée par l’IFN n’est pas une grille fractionnée en sous-ensembles numérotés de 1 à 10, mais plutôt construite comme deux grilles de cinq années juxtaposées et interpénétrantes (translation unitaire horizontale) et dont le fractionnement en années assure que les mailles assignées aux années n + 5 sont toujours à côté de celles assignées aux années n (figure 1).

Figure 1. Schéma de grille d’échantillonnage de l’inventaire forestier national depuis 2005. a) Exemple de grille fractionnée en dix années de manière aléatoire ; b) Schéma de la grille utilisée par l’IFN résultant de l’interpénétration de deux grilles quinquennales.
On notera que la grille définit une périodicité implicite dans l’échantillonnage, selon laquelle l’ensemble des cellules de la grille aura été inclus dans un des dix échantillons annuels successifs qu’elle définit. Cette propriété n’est toutefois pas utilisée en pratique.
Le tirage aléatoire du point dans la cellule
La première étape de l’échantillonnage annuel de l’IFN consiste dans le sous-échantillonnage des cellules d’une fraction annuelle donnée. Ce tirage est celui imposé par la grille et son fractionnement annuel décrit plus haut. L’étape suivante de l’échantillonnage consiste dans le tirage, selon un procédé uniformément aléatoire, d’un point dans chacune des mailles appartenant à la fraction annuelle en cours. Ce tirage compte plus qu’il peut en avoir l’air : en ne se basant pas simplement sur les nœuds de la grille ou sur le centre des cellules, c’est-à-dire sur des positions fixes, ce tirage fait basculer l’échantillonnage dans la famille des échantillonnages dits spatialement non alignés, qui s’oppose aux plans d’échantillonnage purement systématiques dans l’espace. Outre le fait d’introduire de l’aléa dans l’échantillonnage (un point essentiel pour la production d’estimations statistiques), cette étape permet d’éviter, ou au moins d’atténuer, les effets d’une coïncidence entre les motifs géométriques de la grille et des formes de relief.
Échantillonnage stratifié en deux phases
Notion d’échantillonnage à deux phases
L’IFN fait partie des inventaires forestiers nationaux utilisant deux phases d’échantillonnage. Les deux phases sont :
1/ Le tirage d’un échantillon de première phase, sur lequel est réalisée une photo-interprétation (et notamment le classement des unités selon leur appartenance à la forêt ou non) ;
2/ L’extraction d’un sous-échantillon de deuxième phase, dont les placettes feront l’objet de plus amples mesures sur le terrain.
L’échantillon de première phase est un échantillon de grande taille (de l’ordre de 55 000 points par an), permettant d’estimer les proportions surfaciques des couvertures au sol. Dans cette étape, on associe un type de couverture et d’utilisation du sol à chacun des points de l’échantillon grâce à la photo-interprétation d’images aériennes (visible et proche-infrarouge). Il s’agit essentiellement de quantifier les proportions que représentent les formations végétales arborées : forêts, bosquets, landes et autres. La grande taille de cet échantillon est possible grâce au moindre coût des mesures réalisées (la photo-interprétation), et est nécessaire à l’obtention d’une précision suffisante dans l’estimation des proportions des catégories distinguées.
L’échantillon de seconde phase est l’échantillon de points qui seront associés à des placettes de mesure sur le terrain. Cet échantillon est produit par sous-échantillonnage du premier, et est de taille beaucoup plus petite, de l’ordre de 8 000 points. On notera que le taux de couverture forestière du territoire national étant d’environ 30 %, le nombre de points de première phase tombant en forêt est de l’ordre du tiers de 55 000 soit environ 16 500 points. Si le taux d’échantillonnage des points de deuxième phase dans la première était de 50 % lorsqu’ils sont en forêt, il y aurait de l’ordre de 8 000 points d’échantillonnage sur le terrain par an. Ce chiffre est en pratique inférieur, du fait de la mise en œuvre récurrente d’un « allègement », qui est une réduction contrôlée du taux d’échantillonnage (décrite en détail dans Bouriaud et al., 2023) pour en maîtriser le coût. Ce type de contrainte se matérialisant dans le temps n’est pas rare, et peut limiter la bonne conduite d’un inventaire dit panélisé (Van Deusen, 2000).
Notion de stratification à taux d’échantillonnage variable
La plupart des inventaires se basant sur une grille pour produire leurs échantillons réalisent un sous-échantillonnage systématique dans l’espace, c’est-à-dire basé sur un motif géométrique créant une grille carrée de moindre densité, exactement à la manière de la séparation en fractions annuelles. Ces inventaires implémentent donc un tirage selon un taux d’échantillonnage fixe (figure 2).

Figure 2. Représentation d’un sous-échantillonnage systématique de mailles permettant de passer de la première à la deuxième phase. La figure représente un sous-ensemble de mailles formant une fraction annuelle dans laquelle les mailles portant le nombre 1 font toutes partie de l’échantillon de première phase, les mailles colorées forment un sous-échantillon pris selon un motif géométrique (carré), systématique au sens d’uniforme.
En France, en revanche, l’échantillonnage dépend non seulement d’un taux d’échantillonnage maximal prédéterminé et inhérent à la grille (figure 3), mais aussi du type de couverture du sol. L’objectif est de diminuer l’intensité d’échantillonnage dans les formations végétales telles que les landes, pour lesquelles un niveau de précision moindre est permis. L’information propre à chaque maille est un taux maximal assigné à chaque cellule lors de la création de la grille : 0, le point dans la cellule ne peut être sélectionné ; 1/2, le point ne peut être sélectionné que si la couverture est de type forêt mais pas s’il est de type landes ; 1/4, le point est sélectionné quelle que soit la couverture arborée (forêts ou landes). Les points pour lequel le taux n’est pas 0 et qui tombent sur une couverture du sol certainement hors forêt et hors landes fera d’emblée partie de l’échantillon de phase 2 et comptera dans les calculs, mais en apportant une surface de forêt nulle et un volume nul (figure 4). La raison à cette utilisation des points hors forêt vient du fait que l’on calcule une moyenne des valeurs observées sur tous les points de l’échantillon dans un domaine géographique donné, comme expliqué plus en détail dans la section « Principe d’estimation sur plan d’échantillonnage stratifié ». Sur ces points hors forêt, tant la surface que le volume de bois sont nuls. Ne pas en tenir compte supposerait que l’on connaisse la surface occupée par la forêt avant l’inventaire, et que l’on puisse filtrer les points d’un échantillon en lui superposant une carte des forêts. La surface de forêt étant évolutive, on ne peut pas faire cette hypothèse.

Figure 3. Représentation d’une fraction annuelle de mailles et leur taux maximal de tirage individuel. Les points contenus dans les mailles ayant une valeur 0 ne seront jamais des points transformés en placettes de terrain, seuls les points ayant une valeur 1 ou 2 et tombant en forêt deviendront des points d’échantillonnage sur le terrain. Les points ayant une valeur 2 peuvent devenir des points de terrain s’ils tombent dans les landes.

Figure 4. Le croisement du taux de tirage avec la photo-interprétation définit les points qui seront conservés pour le deuxième échantillon. Seul un point sur deux est conservé en forêt (les points encerclés en vert), et un point sur quatre dans les landes. Tous les points hors forêt et hors landes feront partie de l’échantillon final de deuxième phase mais ne peuvent contribuer qu’avec une surface et un volume nuls.
Cette particularité est très importante car elle différencie nettement les inventaires dont l’échantillon de deuxième phase est uniformément tiré depuis l’échantillon de première phase selon un procédé spatialement systématique (figure 2) mais que l’on peut associer à un tirage aléatoire simple. Un taux fixe conduirait à échantillonner au sol toutes les formations végétales, dont celles hors forêt, avec le même niveau d’intensité que la forêt elle-même. Ici, il s’agit d’un échantillonnage stratifié, puisque d’intensité variable selon des strates. Le principe de l’échantillonnage de la deuxième phase se construit donc sur deux informations différentes : l’une est propre à la cellule dans laquelle a été tiré le point de première phase, l’autre est le type de couverture du sol observé sur l’unité d’échantillonnage, qui est révélé lors de la photo-interprétation.
En plus de ces caractéristiques, l’échantillonnage est rendu complexe par l’existence de zones géographiques plus homogènes dans lesquelles l’intensité du tirage est réduite. Il s’agit ici aussi d’une stratification, cette fois à base d’informations géographiques, qui définissent le périmètre géographique de tirage.
L’estimation statistique
Principe général des méthodes d’estimation en inventaire forestier : un échantillonnage indirect de positions géographiques
Les IFN sont par essence des enquêtes basées sur des méthodes de sondage indirectes, car les arbres ne sont pas connus individuellement et ne peuvent être recensés (en cela, le terme historique « d’inventaire » prête à lui seul confusion). Ceci complique les méthodes d’échantillonnage et d’estimation. Par exemple, dans une enquête d’opinion, il est possible d’échantillonner directement des personnes (la population cible) selon une base de sondage ou liste exhaustive, fondée sur leur numéro de téléphone ou leur adresse électronique. Les arbres sont, par contraste, en nombre et de position géographique inconnus. Il est donc impossible de les enquêter par tirage direct. Compte tenu de leur distribution dans l’espace, une telle méthode serait aussi très inefficace.
Le principe des inventaires forestiers consiste donc à tirer des points dans l’espace, puis à enquêter un petit nombre d’arbres dans un voisinage prédéfini de ces points, à compter de leur classement au sein de la couverture forestière (l’IFN a adopté la définition internationale FAO
Liaison entre arbres et points géographiques pour l’estimation
Conséquence du sondage indirect pratiqué par les inventaires forestiers, relier les attributs des arbres aux points passe par une transformation. Dans le cas du volume par exemple, cette transformation consiste à rapporter le volume des arbres à la surface de la placette dans laquelle ils ont été échantillonnés. Lorsque les placettes sont concentriques, comme c’est le cas dans l’IFN (Chevrou, 1993, selon un protocole standard en inventaire forestier, et qui a été maintenu depuis sa mise en œuvre pour la raison de continuité), la surface de la placette variera selon la classe de diamètre dans laquelle s’inscrit l’arbre. En calculant le rapport entre le volume des arbres et la surface de la placette dans laquelle ils ont été inventoriés, on calcule de fait une densité spatiale de volume, qui s’exprime en m3 ha-1. Cette information devient non plus un attribut de niveau arbre mais un attribut de niveau point. L’échantillon de points tirés va ainsi permettre de calculer une moyenne des densités spatiales observées sur chaque point, toujours exprimée en m3 ha-1.
Lorsque l’échantillonnage des points repose sur un procédé qui assure l’égalité des densités de probabilité de sélection des points, ils sont dits avoir un « poids égal ». C’est le cas lorsque l’on utilise une grille régulière pour déterminer la position des points. Un tirage uniformément aléatoire va aussi conférer cette propriété (il n’est toutefois jamais utilisé en pratique).
Dans ce cas, on peut alors voir que l’estimation du volume total va s’appuyer sur un calcul très simple qui consiste à multiplier la surface du domaine géographique (de surface connue A) dans lequel est réalisé l’inventaire par la densité moyenne arithmétique de la variable cible (), et on vérifie alors :
Total (m3) = Surface (ha) densité moyenne (m3 ha-1)
qu’on note encore :
Totaly (m3) = A (ha) × (m3 ha-1)
où A est la surface totale du domaine considéré et la moyenne de densité surfacique de volume.
De façon générale, le calcul d’une moyenne sur un domaine s’opère de façon similaire, sans faire intervenir la surface A. D’une certaine manière on peut considérer que l’inventaire offre un procédé par lequel on échantillonne des valeurs de densité spatiale d’attributs d’intérêt, au sein d’un domaine géographique défini.
Principe d’estimation sur plan d’échantillonnage stratifié
Dans le cas de l’IFN, l’échantillonnage se base sur une tessellation du territoire créant un ensemble de mailles, puis du tirage d’un point dans le sous-ensemble de mailles qui constitue la fraction annuelle de la grille pour une année donnée. Ces étapes permettent de passer d’une population continue (la surface du domaine étudié) à une population discrète de mailles puis de points. Ces points forment l’échantillon de première phase. Ils sont classés par la photo-interprétation selon la catégorie de couverture et d’utilisation du sol. Le tirage de la deuxième phase conduit à l’échantillon de points d’inventaire au sol, dit de deuxième phase. Là, on parlera bien de probabilité de sélection des points de deuxième phase, car la population de départ est finie : celle des points de l’échantillon de première phase.
Lorsque l’on applique la stratification (fondée sur la couverture au sol ou des zonages géographiques, voir première partie), on obtient des groupes de points ayant des probabilités de sélection différentes entre strates, mais uniformes à l’intérieur des strates. On pourrait donc utiliser la même formule de calcul qui ne tient pas compte des poids des points (qui sont l’inverse de la densité de probabilité d’inclusion) et calculer une moyenne arithmétique des densités observées aux points dans chaque strate (, avec h un indice de strate). Le total associé à la strate sera estimé par :
Et pour calculer le total, les strates étant définies de manière à ce qu’elles forment une partition exacte du domaine :
De même, l’estimation de moyenne (M) s’obtient par :
Principe d’estimation sur plan d’échantillonnage post-stratifié
L’IFN utilise cependant un processus de post-stratification en sus de la stratification, qui consiste à redécouper les échantillons de points en groupes formés après leur mesure (d’où le terme de post-stratification). Ce redécoupage repose sur des catégories telles que le département, le type de propriété et l’appartenance à la forêt telle que renseignée par la base de données cartographique BD Forêt
Inconvénient de ces découpages, les post-strates finissent par produire des ensembles très petits de points. Pour y pallier, un algorithme regroupe les post-strates pour leur assurer un nombre minimal de points. Mais ce regroupement conduit aussi à un assemblage de points dont les probabilités d’inclusion diffèrent, étant issus de strates différentes (par exemple, forêt et landes). En conséquence, on se retrouve avec un ensemble de post-strates dans lesquelles les points de deuxième phase n’ont plus des poids égaux. Les calculs doivent donc en tenir compte, et ils reposent alors sur l’utilisation d’une moyenne arithmétique pondérée. En notant g l’indice de post-strate, w le poids des points i situés dans la post-strate, et en redéfinissant désormais le total comme une somme sur l’ensemble des post-strates g, on a :
Et pour la moyenne :
où correspond à la précédente moyenne pondérée, au niveau de la post-strate.
La détermination de Ag est cette fois plus complexe. Le principe de l’estimation en deux phases est de découper le domaine en post-strates que l’on espère homogènes et dont la proportion est estimée à partir du premier échantillon, puis d’estimer la densité moyenne d’un attribut donné dans ces post-strates à base du deuxième échantillon. En conséquence, la taille des post-strates n’est pas connue, mais estimée à partir de l’échantillon de première phase. Partant de la taille (qu’on exprime en surface, donc en ha) des strates (), en notant celle des post-strates, enfin la proportion de la post-strate g dans la strate h, et i les points de deuxième phase dans g et h, avec leurs poids associés wh,g, on a :
L’analyse de la contribution des post-strates aux strates mène par ailleurs et enfin à l’estimateur de total suivant :
La moyenne de l’attribut y dans son sous-domaine sera alors estimée selon le ratio suivant, qui est le rapport entre le total et l’estimation de la surface :
On notera que l’implémentation de cet estimateur s’appuie sur un découpage géographique très fin, de niveau départemental et utilisant les données cartographiques issues de la BD Forêt. L’estimation de niveau France métropolitaine est obtenu par sommation des estimations produites au niveau des départements. Ce découpage permet de fournir des estimations à une échelle géographique très fine et de s’appuyer sur des propriétés simples d’additivité pour obtenir une estimation au niveau du territoire national.
On ne fait pas de différence ici entre des estimations de volume, de production, ou de surfaces. L’approche présentée est en effet tout à fait similaire pour toutes ces estimations malgré leur nature très différente (dans le cas de la surface, la variable y est une indicatrice d’appartenance de la placette à l’occupation forestière au sol). La raison de l’universalité vient du fait que l’estimateur combine des informations provenant des deux phases d’échantillonnage, l’une propre à la première phase sous forme de proportions, l’autre sous forme d’une moyenne de valeurs quantitatives observées au niveau des points sur l’échantillon de deuxième phase. Rien n’interdit donc que l’attribut y de deuxième phase soit lui-même très simplement une proportion (exprimée en ha ha-1, cas où on estimera une surface), un volume moyen sur pieds (m3 ha-1, volume de bois sur pieds) ou une production (m3 ha-1 an-1).
L’échantillonnage en deux phases est un grand classique dans le monde des inventaires forestiers. Il repose sur une base théorique solide et bien connue (Rao, 1973 ; Cochran, 1977). L’objet est d’utiliser des informations de nature différentes, l’une étant issue d’un échantillon peu coûteux mais n’atteignant pas directement les attributs d’intérêt, l’autre étant un échantillon plus petit mais beaucoup plus riche en information. Le premier est ici utilisé pour couvrir le territoire étudié dans son ensemble et porte donc des informations géographiques utilisées pour le stratifier. En ce sens, le plan d’échantillonnage de l’IFN s’inscrit dans la lignée des inventaires basés sur l’échantillonnage double pour stratification, auxquels se rattache aussi l’inventaire forestier des États-Unis (Chojnacky et al., 1998 ; Williams, 2001). L’utilisation d’une post-stratification complexe créant des post-strates dans lesquelles les points sont tirés avec des probabilités variables est beaucoup plus original.
Les estimations consolidées de total fournies par l’IFN
Ces estimateurs sont ceux permettant de réaliser une estimation à base des échantillons annuels. Toutefois, l’estimation officielle de l’IFN ne consiste pas dans une estimation annuelle, mais dans l’emploi d’une moyenne arithmétique mobile des estimations obtenues lors des cinq dernières années, selon une procédure très courante au sein des inventaires forestiers nationaux annualisés (Bontemps et Bouriaud, 2024). Une année de publication n, la moyenne dite glissante comprend les estimations des années n-6 à n-1.
La raison essentielle à ce lissage tient au fait que l’annualisation de l’inventaire en 2004 s’est opérée au prix d’une réduction d’un facteur 10 de l’effort d’échantillonnage initialement mis en œuvre au niveau départemental (puisque chaque département était approximativement inventorié tous les dix ans), le lissage permettant de le réduire à 2, au prix d’une perte de sensibilité initiale voulue par l’annualisation. Ce compromis bien identifié entre précision et actualisation est une difficulté réelle lorsque la forêt connaît une dynamique avérée (Van Deusen, 2002). De ce point de vue, l’évolution des plans de sondage d’inventaire se poursuivra, constituant un enjeu de recherche grandissant avec ceux relatifs aux forêts, et aux efforts d’intégration de l’information sur les forêts à l’échelle européenne.
Discussion
Regard sur la méthode annuelle, 20 ans après sa mise en œuvre
La nouvelle méthode avait pour objet de fournir des estimations portant sur l’ensemble du territoire sur un pas de temps court. Les faits ont montré que ses concepteurs avaient vu juste, car elle a assuré depuis la production de très nombreuses estimations. La délivrance de résultats annuels a de plus suscité une attente renforcée de la communauté, accroissant l’utilité de cette enquête. De façon emblématique, l’intérêt de l’annualisation de l’enquête a été démontré dès 2009, avec l’évaluation des dégâts de la tempête Klaus ayant frappé l’Aquitaine, l’année même de sa survenue (IFN, 2009), et dans le contexte même qui avait été déclencheur de la réforme de 2004 (tempêtes Lothar et Martin de 1999).
En continuité avec les constats opérés depuis les débuts de l’inventaire (Bontemps et al., 2020), la forêt française a aussi vu une augmentation forte de sa surface lors des deux dernières décennies, de l’ordre de 70 000 ha par an, augmentation qui pourrait s’amenuiser dans l’avenir mais a d’emblée résulté dans l’augmentation de la surface d’intérêt de l’IFN. Compte tenu du principe de l’échantillonnage à base d’une grille, toute augmentation de la surface des forêts se traduit par une augmentation du nombre de points appartenant au domaine forestier. Le nombre de points de deuxième phase (qui deviennent des placettes de mesure sur le terrain) aurait dû augmenter lui aussi, si les moyens alloués à l’IFN l’avaient permis, posant de façon récurrente la question de la satisfaction de précisions cibles sur des quantités stratégiques (surface et stock de bois notamment). Cette tension est à prendre au sérieux, car la méthode annuelle sur échantillons interpénétrants exige de la continuité, sans laquelle il faudrait se résoudre à des systèmes d’échantillonnage moins structurés temporellement (De Gruijter et al., 2006).
Par ailleurs, le défaut de documentation initial a longtemps conduit à une attitude prudente et conservatrice à l’égard d’une méthode d’emblée opérationnalisée, et dont la continuité était attendue. Toutefois, la décision de création du Laboratoire d’inventaire forestier en 2013 pour opérer des recherches dans ce domaine (voir Bontemps et al., 2025), puis la demande de reconnaissance de l’inventaire forestier comme enquête statistique publique par le CNIS
1/ Formaliser la cadre d’échantillonnage par grille spatiale (Bouriaud et al., 2023) ;
2/ Formaliser le cadre inférentiel ici présenté, qui a d’ailleurs permis de rattacher les méthodes envisagées par ses précurseurs au cadre canonique de l’échantillonnage à deux degrés pour post-stratification (Cochran, 1977 ; Bouriaud, 2020), apportant en soi une première caution sur la méthode ;
3/ Pour ce faire, formaliser le lien existant entre le territoire échantillonné de façon continue et la population discrète des arbres forestier, lien dénommé en sondage méthode de partage des poids, dont il a fallu étendre le paradigme aux populations continues (Bouriaud et al., 2024), démontrant au passage que recherche fondamentale en théorie des sondages et recherche appliquée aux fins d’appui à une enquête ne sont pas exclusives (Bontemps et al., 2025).
Une fois ce cadre posé, il est progressivement devenu possible d’explorer la performance du cadre d’échantillonnage et des estimateurs associés par simulation sur maquette numérique (Duong et al., 2024), démarche qui est venu donner des facilités nouvelles et originales pour l’analyse de futurs plans de sondage, et la qualification des estimateurs.
Évolutions à venir et pressenties
Les estimations de niveau département s’appuient sur des informations cartographiques fines permettant leur calage. En revanche, ce découpage très fin a le défaut de résulter dans la production de post-strates très fines et comprenant très peu de points, pouvant compromettre ce gain de granularité par la fragilité que confère un nombre trop faible de points pour les calculs et leur stabilité d’une année à une autre. Ces faiblesses sont bien identifiées et feront l’objet de travaux spécifiques qui pourraient conduire à un changement assez profond de la post-stratification, à la fois en termes de pertinence des systèmes de partition (on peut, pour l’illustrer, faire observer par exemple que le nombre de sylvoécorégions (SER : IFN 2009
D’autres techniques pourraient alors être déployées pour revenir à cette échelle spatiale non native à l’IFN, se basant sur les principes des inventaires multisources (voir Renaud et al., 2024, dans la Revue). Ces inventaires, sans sacrifier au principe de l’estimation sur plan de sondage, y adjoignent une information auxiliaire de haute résolution sur le territoire cible (par exemple satellitaire ou lidar), permettant de caler les poids statistiques des unités primaires selon leur meilleure représentativité du territoire forestier. Pour cette raison, ce champ de développement est également un thème de recherche du Laboratoire d’inventaire forestier, dont les premières explorations ont ciblé des territoires de plaine et de moyenne montagne. Il n’est à ce jour pas encore permis de se prononcer sur son déploiement systématique (comme il est par exemple opéré en Finlande, à côté de l’inventaire national classique), ou à façon selon le caractère vocationnel des territoires.
Enfin, le plan de sondage lui-même peut être mis en question, puisque d’une part la précision des estimations réduit la fréquence opérationnelle des estimations (moyenne glissante sur cinq ans) et que, par ailleurs, le principe des échantillons annuels interpénétrants, s’il assure une représentativité constante du territoire, est aussi la cause de leur « évitement » mutuel, une propriété connue sous le terme de coordination spatiale négative dans le domaine des sondages (Bontemps et Bouriaud, 2024). Or, avec l’émergence de perturbations plus régulières et multi-causales, et avec elle le renforcement de la priorité du monitoring temporel, il ne fait pas de doute que cette propriété devra être réinterrogée, ouvrant la voie à la recherche de plans de sondage permettant de satisfaire ces différents impératifs, et sur laquelle le laboratoire s’investira.
Les estimateurs de variance
Comme le lecteur pourra l’avoir constaté, le présent article s’est borné à exposer les principes de l’estimation de quantités totales ou moyennes (on parle d’estimateurs ponctuels). Or, dans le domaine de l’estimation statistique, la production de telles quantités est indissociable d’une mesure de leur incertitude, associée au plan de sondage, et qui se traduit dans les estimateurs de variance des estimations des totaux. Ces estimateurs ont ainsi pour objet de représenter la variabilité des estimations que l’on pourrait obtenir si l’on répétait un grand nombre de fois les tirages des échantillons et les mesures, une année donnée (ce qu’on ne peut par définition pas se permettre). Ils ont été construits pour intégrer et refléter les différentes étapes de l’échantillonnage, chacune faisant entrer des éléments d’aléa qui sont reflétés dans l’estimation finale de la variance. Par construction, ces estimateurs rendent donc compte des phases d’échantillonnage, de la contribution de chacune dans l’incertitude des estimations. Les récents travaux de recherche ont permis de formaliser les estimateurs de variance au plus proche du plan de sondage (Duong et al., 2024), et ces derniers diffèrent légèrement de ceux mis en œuvre initialement. Toutefois, ils ont en commun de majorer la variance réelle des estimations de l’inventaire (ce qui est une mesure conservative généralement pratiquée), ainsi qu’il est classique en échantillonnage fondé sur des grilles.
La complexité de ces estimateurs rend aussi l’étude de leurs propriétés (convergence, biais, efficacité) délicates. C’est pourquoi le recours théorique à des approches par simulation a été envisagé de longue date dans le domaine (Roesch et al., 1993). Ce type d’analyses commence à être mis en œuvre au laboratoire, notamment grâce au développement d’outils informatiques de simulation et d’estimation spécifiques s’appuyant sur la création de maquettes ou jumeaux numériques de forêts, actuellement avec un jumeau numérique de grande ampleur sur la forêt des Vosges (100 x 60 km), avec une cartographie continue d’arbres et de leurs attributs. Le délai de montée en maturité de ce type de technologie est donc en réalité substantiel, et tient au besoin d’une capacité de calcul intensif, à la fois pour le développement des maquettes elles-mêmes, et pour la simulation des plans de sondage. Ce type d’étude émerge aussi à un moment où les travaux théoriques en sondage ne sont soutenus que par une petite communauté mondiale, et où des nouvelles méthodes telles que le bootstrap (méthode de rééchantillonnage se basant sur la puissance de calcul) devraient permettre d’apporter des solutions efficaces, en particulier pour réduire les biais d’estimation de la variance inhérents aux plans d’échantillonnage systématiques, tout en restant plus accessibles à une communauté plus large.
Conclusions
La nouvelle méthode de l’IFN, mise en place il y a vingt ans et comprenant à la fois une nouvelle méthode d’échantillonnage et d’estimation, s’est révélée être une méthode flexible et efficace, adaptée aux objectifs de suivi à grande échelle des forêts. Comme développé ici, tant l’échantillonnage que l’estimation mobilisent une quantité importante d’informations géographiques pour la stratification et la post-stratification, dans un effort d’augmentation de la précision des estimations. Elle a offert à l’IFN la réactivité qui manquait à la méthode passée, sans trop concéder à la précision des estimations. Cette réactivité est ce qui lui a permis de s’enrichir par de nouvelles mesures et de répondre aux sollicitations constantes d’ouverture vers des problématiques plus larges que celles des seules ressources en bois, et notamment les questions de mesure robuste des flux, d’évaluation de la biomasse et du carbone aérien des forêts, ou encore du renouvellement ligneux en forêt. Elle a donc su conférer à l’IFN les capacités souhaitées de temporalité, bien qu’en réduisant la résolution spatiale. Toutefois, certaines limites actuelles du plan de sondage, ainsi que les enjeux environnementaux appelant à renforcer la dimension du monitoring de tendance ou des perturbations, laissent apercevoir des évolutions substantielles à l’avenir et qui, parce qu’elles seront cette fois étayées par la capacité de recherche dont on célèbre avec cet opus la décennie, laissent augurer d’une anticipation renforcée pour aborder ces réformes.
Notes
- 1. Cette définition adoptée en début de siècle définit la forêt comme un territoire d’au moins 0,5 ha, d’au moins 20 m de large, avec un taux de couvert ligneux d’au moins 10 %, lesquels ligneux doivent pouvoir excéder 5 m de haut à maturité, et où un rien ne s’oppose à une valorisation forestière. Pour cette dernière raison, on parle en France de « forêt de production », bien que la forêt en question puisse ne pas donner lieu à l’exploitation de matériel ligneux.
- 2. https://geoservices.ign.fr/
- 3. https://www.cnis.fr/enquetes/inventaire-forestier-national/
- 4. https://inventaire-forestier.ign.fr/IMG/pdf/Part1_rapport_ser.pdf
Références
- Bontemps, J.D. (2021). Les temps des forêts et de leur observation. Revue Forestière Française, 73(5), 557-565.
- Bontemps, J.D., Bouriaud, O. (2024). Take five: about the beat and the bar of annual and 5-year periodic national forest inventories. Annals of Forest Science, 81(1), 53.
- Bontemps, J.D. Denardou, A., Hervé, J.C., Bir, J., Dupouey, J.-L. (2020). Unprecedented pluti-decennial increase in the growing stock of French forests is persistent and dominated by private broadleaved forests. Annals of Forest Science 77, 98. https://doi.org/10.1007/s13595-020-01003-6
- Bouriaud, O. (2020). Échantillonnage et estimation dans l’Inventaire Forestier National. Essai de reconstruction et formalisation (Doctoral dissertation, Institut National de l’Information Géographique et Forestière ; Laboratoire d’Inventaire Forestier). https://hal.science/hal-03039886/
- Bouriaud, O., Morneau, F., et Bontemps, J.D. (2023). Square-grid sampling support to reconcile systematicity and adaptivity in periodic spatial surveys of natural populations. Journal of Vegetation Science, 34(3), e13195.
- Bouriaud O., Brion P., Chauvet, G., Duong, T.H.K., Pulkkinen M. (2024). The weight-share method in forest inventories: refining the relation between points and trees. Canadian Journal of Forest Research, 54(10), 1129-1141.
- Chevrou, R.B. (1993). La placette sol d’inventaire formée de plusieurs cercles concentriques. Forêt Méditerranéenne, 14(3), 244-255. https://hal.science/hal-03557150/
- Chojnacky, D.C. (1998). Double sampling for stratification: a forest inventory application in the Interior West. Res. Pap. RMRS-RP-7. Ogden, UT: US Department of Agriculture, Forest Service, Rocky Mountain Research Station. 15 p., 7.
- Cochran, W.G. (1977). Sampling techniques. John Wiley & Sons.
- Dereix, C., Lafitte, J.J., et Puig, J.P. (2011). Mission d'expertise sur les méthodes de l’Inventaire forestier national (IFN). https://www.vie-publique.fr/rapport/32084-mission-dexpertise-sur-les-methodes-de-linventaire-forestier-national
- Duong, T.H.K., Chauvet, G., & Bouriaud, O. (2024). A new sampling framework for spatial surveys with application to the French National Forest Inventory. Journal of Survey Statistics and Methodology, 13(1), 197-222.
- Gruijter (de), J.J., Bierkens, M.F., Brus, D.J., Knotters, M. (2006). Sampling for natural resource monitoring (pp. xiii+-332). Springer-Verlag Berlin Heidelberg.
- Rao, J.N.K. (1973). On double sampling for stratification. Biometrika, vol. 60(3), 669–682.
- Renaud, J.P., Cordonnier, T., Vega, C., Pulkkinen, M., et Bastick, C. (2024). Un inventaire forestier multisource, vous connaissez ? Revue forestière française, 75(3), 233-241. https://doi.org/10.20870/revforfr.2024.8338
- Roesch, F.A. (2008). An alternative view of continuous forest inventories. Forest Science, 54(4), 455-464.
- Van Deusen, P.C. (2000). Pros and cons of the interpenetrating panel design. In: McRoberts, Ronald E.; Reams, Gregory A.; Van Deusen, Paul C., eds. Proceedings of the First Annual Forest Inventory and Analysis Symposium; Gen. Tech. Rep. NC-213. St. Paul, MN: US Department of Agriculture, Forest Service, North Central Research Station: 14-19, vol. 213. 2000.
- Van Deusen, P.C. (2002). Comparison of some annual forest inventory estimators. Canadian Journal of Forest Research, 32(11): 1992-1995.https://doi.org/10.1139/x02-115
- Vidal, C., Bélouard, T., Hervé, J.C., Robert, N., Wolsack, J. (2007). A new flexible forest inventory in France. In: McRoberts, Ronald E.; Reams, Gregory A.; Van Deusen, Paul C.; McWilliams, William H., eds. Proceedings of the seventh annual forest inventory and analysis symposium; October 3-6, 2005; Portland, ME. Gen. Tech. Rep. WO-77. Washington, DC: US Department of Agriculture, Forest Service, 67-73. (Vol. 77).
- Williams, M.S. (2001). Comparison of estimation techniques for a forest inventory in which double sampling for stratification is used. Forest Science, 47(4), 563-576.

Vues: 716
PDF: 203
XML: 21