Résumé
Les données de télédétection permettent de produire des cartes d’attributs forestiers à partir de modèles calibrés sur des placettes issues d’inventaires ou de réseaux de monitoring. Cependant, leur applicabilité locale est rarement évaluée. Cette étude examine l’applicabilité locale de modèles prédictifs établis sur de vastes territoires en utilisant des données lidar, Sentinel-2 et la BD Forêt de l’IGN. Les modèles ont été testés sur des forêts vosgiennes et des placettes en lisière. Les résultats montrent que les biais locaux sont liés à l’extrapolation et à la précision des modèles, améliorables par un effort d’échantillonnage. L’étude souligne l’importance de considérer le domaine de validité des modèles et de quantifier les incertitudes.
Messages clés :
Les modèles calibrés à partir de données de télédétection sur de vastes territoires forestiers ne garantissent pas leur applicabilité locale.
Des outils de diagnostic doivent être utilisés pour identifier ces situations et corriger si nécessaire les biais observés, surtout pour les forêts à enjeux.
Abstract
Remote sensing data can be used to produce maps of forest attributes using models calibrated on plots from inventories or monitoring networks. However, their local applicability is rarely assessed. This study examines the local applicability of the predictive models established over large areas using lidar data, Sentinel-2 and BD Forêt of the IGN. The models have been tested on the Vosges forests and forest edge plots. The results show that local biases are linked to the extrapolation and precision of the models, which can be improved via a sampling effort. The study highlights the importance of considering the scope of validity of the models and of quantifying the uncertainties.
Highlights:
Models that have been calibrated using remote sensing data from large forest areas are not necessarily applicable locally.
Diagnostic tools must be used to identify these cases and to correct any observed biases, especially for high-stake forests.
Introduction
L’utilisation des données de télédétection, telles celles issues de couverture lidar aéroporté (ALS) ou de photogrammétrie, gagne en popularité quand il s’agit de gestion forestière. Depuis le début des années 2000, ces dernières ont été utilisées pour faciliter l’estimation de différents attributs forestiers en contexte d’inventaire forestier statistique (par exemple Gregoire et al., 2011 ; Maltamo et al., 2014 ; Vega et al., 2021). Elles ont également été utilisées pour identifier les dégâts de tempête (Renaud et al., 2017), la structure des peuplements, les indices de qualité de sites (Vega, 2006 ; Vega et St-Onge, 2009), voire les habitats forestiers (Napoléoni, 2018). Elles se sont avérées utiles pour produire des modèles numériques de terrain (MNT) et faciliter les investigations archéologiques (Georges-Leroy et al., 2011). De nos jours, des pays comme la Finlande, la Suède et la Norvège produisent des cartes d’attributs forestiers au niveau national basées sur des données ALS (Hauglin et al., 2021 ; Kangas et al., 2018 ; Nilsson et al., 2017). En France, de nombreux vols ALS ont été réalisés par le passé, ne couvrant généralement que des zones limitées telles que des massifs ou de petits territoires forestiers. Les modèles issus de ces acquisitions étaient également spécifiques à chaque vol. Cependant, le programme national de couverture lidar à haute densité de l’ensemble du territoire français (Institut national de l’information géographique et forestière, IGN, programme Lidar-HD) ouvre des possibilités sans précédent, en termes d’harmonisation des acquisitions, d’établissement de modèles plus génériques et d’approches d’estimation permettant d’obtenir des inférences locales.
Afin d’améliorer la précision des inventaires, des approches dites « multisources » ont été développées au début des années 1990. Elles combinent à la fois des données de télédétection et d'inventaire de terrain (Holmgren & Thuresson, 1998 ; Poso et al., 1999 ; Tomppo & Katila, 1991). Ces approches conduisent souvent à une meilleure planification ou à une évaluation en continu de la ressource (Poso et al., 1999 ; Tokola et al., 1996). Un bénéfice supplémentaire est de fournir des cartes pour la gestion forestière. Ceci permet de faciliter les processus de prise de décision, de réduire les besoins en inventaires de gestion et d’apporter des informations dans des zones difficiles d’accès ou non-échantillonnées (Fekety et al., 2015). Bien que l’utilisation de larges réseaux d’observation de terrain (territoriaux ou nationaux), permette une calibration satisfaisante des modèles, les densités utilisées sont généralement insuffisantes pour représenter certaines particularités forestières locales (de Lera Garrido et al., 2022 ; Hsu et al., 2020 ; Ramirez Parra, 2022). Les modèles, et les représentations cartographiques qui en résultent, ne représentent donc la plupart du temps qu’une idéalisation de la réalité fondée sur l’hypothèse de continuité (Besic et al., 2024a). Ainsi, ces modèles ont des domaines de validité limités et peuvent être localement substantiellement biaisés (Kangas et al., 2023 ; Sagar et al., 2022 ; Ståhl et al., 2024). Une façon de caractériser le domaine de validité et de diagnostiquer le degré d’interpolation ou d’extrapolation des produits cartographiques dans l’espace des variables de télédétection consiste à utiliser une approche d’enveloppe convexe (Brooks et al., 1988 ; Renaud et al., 2022). En caractérisant le domaine de calibration des prédicteurs par son enveloppe convexe, toute nouvelle prédiction peut être évaluée comme appartenant ou non à la plage de validité d’un modèle.
Le plan d’échantillonnage, sa répartition spatiale et la densité des placettes affectent directement le domaine de validité des modèles et leur qualité, en particulier aux échelles locales (Poso et al., 1999). La précision des modèles est souvent exprimée sous la forme d’un indicateur global, c’est-à-dire la racine de l’erreur quadratique moyenne (REQM) (James et al., 2021). Lorsqu’un modèle est appliqué à un ensemble de données externes différent de celui ayant servi à le calibrer (une population), la distribution de ces données dans l’espace des prédicteurs peut s’avérer différente de celles de calibration. Dans cette situation, la précision locale peut s’écarter substantiellement de la REQM de calibration et les prédictions peuvent se retrouver en dehors du domaine de validité du modèle (c’est-à-dire en extrapolation) (Meyer & Pebesma, 2021 ; Renaud et al., 2022 ; Sagar et al., 2022). Les prédictions en extrapolation peuvent ainsi montrer des biais substantiels (Bartley et al., 2019 ; Hsu et al., 2020 ; Renaud et al., 2022 ; Sagar et al., 2022).
Évaluer la précision locale des modèles et l’incertitude associée aux cartes est donc une préoccupation majeure, en particulier pour la gestion forestière (Hsu et al., 2020 ; Kangas et al., 2023 ; Ståhl et al., 2024). La performance des modèles (précisions et biais) dépend de plusieurs facteurs comme par exemple, le plan de sondage (densité et répartition), la résolution des données de télédétection, leur variabilité spatio-temporelle, ou la complexité des modèles de calibration (Yates et al., 2018). Ainsi, les principaux objectifs de cette étude sont d’évaluer comment les modèles calibrés sur de vastes territoires sont susceptibles de produire des biais locaux ; d’évaluer comment différents indicateurs de précision (R2, REQM, biais) ou d’extrapolation permettent de qualifier ou de quantifier la transférabilité des modèles, tout en évaluant également l’impact de différentes intensités d’échantillonnage sur ces paramètres.
Matériel et méthodes
Zone d’étude
La zone d’étude est située dans la région Grand-Est et comprend la partie nord du massif vosgien (figure 1). La région est caractérisée par des paysages contrastés, comprenant des plaines, des collines et des montagnes, s'étendant de 400 m à 1 424 m d’altitude. La partie montagneuse est caractérisée par un climat continental, avec une température moyenne annuelle allant de 6 à 10 °C selon l’altitude et l’orientation, et des précipitations annuelles variant de 900 à 2 000 mm avec une valeur annuelle moyenne de 1 116 mm. Elle est couverte à 75 % par des forêts dominées par des essences de feuillus, jusqu’à 500 m d'altitude, et un mélange de hêtres (Fagus Sylvatica L.), de sapins (Abies alba Mill.) et d’épicéas (Picea abies (L.) H.Karst) en altitude. Les zones de plaine et de collines forment la région péri-vosgienne. Dans cette zone, les forêts occupent 44 % de la superficie et sont très diversifiées en termes de composition et de structure, avec un mélange de hêtres et de chênes (Quercus petraea (Mattus.) Liebl.), de bouleaux (Betula spp.), de pins (Pinus sylvestris L.), de châtaignier (Castanea sativa Mill.), entre autres
Figure 1. Zone d’étude avec la localisation des placettes de terrain utilisées. Les vols ALS sont également illustrés.
Dans le cadre de cette étude, l’attribut forestier ciblé est la surface terrière (G, m²/ha). Les données de terrain comprennent à la fois des données IFN et ONF, représentant un total de 2 828 placettes (Tableau 1). Les données IFN consistent en 537 placettes mesurées entre 2016 et 2020. Le plan d’échantillonnage national de l’IFN repose sur un échantillonnage systématique annuel basé sur une grille carrée (1 point tous les 20 km²) divisée en deux blocs d’échantillons de périodicité de cinq ans, à partir desquels des échantillons annuels sont sélectionnés au hasard au sein des mailles. Les mesures de terrain sont effectuées pour un sous-échantillon annuel d’environ 6 500 placettes circulaires concentriques de 6, 9, 15 et 25 m de rayon (IGN, 2022). Ce dernier rayon est principalement utilisé pour décrire la structure et la composition du peuplement. Les mesures des arbres sont effectuées dans les trois premiers cercles, selon les classes de diamètre des arbres (7,5-22,5 cm, 22,5-47,5 cm et 47,5-67,5 cm respectivement). Les placettes IFN sont implantées de façon aléatoire et comportent donc des placettes à la fois complètement forestières ou en limites (par ex. une lisière entre la forêt et la zone de production agricole). Pour leur part, les données de l’ONF sont de deux natures différentes. Le premier jeu de données a été acquis dans le cadre de la mise en place d’un observatoire forestier, selon un plan d’échantillonnage systématique et comprend 370 placettes mesurées en 2021. Ces placettes sont déplacées vers le centre de la forêt lorsque le point initial inclut une lisière. Elles sous-représentent donc les arbres de lisières. Le deuxième jeu de données utilisé pour évaluer localement les modèles comprend 2 045 placettes recensées dans cinq forêts différentes (à savoir les forêts de Déodatie, Deux Lacs, Donon, Gueberschwihr et Mouterhouse) et utilisent des plans d’échantillonnage spécifiques. Les années d’implantation sont données au Tableau 1 et varient entre 2019 et 2021. Pour les placettes d’inventaire des forêts de Gueberschwhir et des Deux Lacs, les mesures des arbres ont été effectuées par une méthode à angle fixe avec un facteur 2 (Duplat et Perrotte, 1981). Pour les autres forêts, les mesures de terrain sont effectuées dans des placettes circulaires de 15 m de rayon pour les arbres de 17,5 cm ou plus de diamètre.

Tableau 1. Caractéristiques des différentes placettes de terrain utilisées pour la calibration des modèles et leur évaluation sur les différentes forêts gérées par l’ONF.
Pour permettre les comparaisons entre les données recueillies sur les placettes IFN et ONF, les calculs du G par placette ont été harmonisés. Dans un premier cas, seules les placettes IFN entièrement forestières (457) ont été prises en compte, afin de correspondre au protocole suivi par l’ONF, qui exclut les placettes avec replis. Toutefois, les placettes IFN situées en lisière de forêt (80) ont été utilisées comme jeu de test indépendant, mettant ainsi à l’épreuve les modèles en dehors de leur domaine de calibration. Les calculs au niveau des placettes IFN ont été effectués pour le sous-ensemble d’arbres ayant un diamètre égal ou supérieur à 17,5 cm, seuil de précomptage utilisé à l’ONF. Une description des moyennes et écarts-types de la surface terrière est donnée au Tableau 1 pour les forêts ONF et pour les deux réseaux ONF et IFN.
Vols ALS
La zone d’étude a été couverte par trois vols ALS dont la densité moyenne était de 5 points/m². Ils ont eu lieu en hiver 2020 pour les vols nord et sud-ouest, puis en hiver 2021 pour le vol sud-est. La classification des points a été effectuée par l’IGN.
Modélisation
Dans cette étude, une approche de modélisation utilisant des forêts aléatoires (Liaw & Wiener, 2002) a été utilisée pour prédire la surface terrière (G, m²/ha). La figure 2 illustre le processus utilisé pour entraîner et tester les modèles élaborés à partir des données de l’IFN et du réseau observatoire de l’ONF. Les métriques des couches ALS ont été extraites à partir du module LidR et d’un modèle numérique de hauteur de canopée (Roussel et al., 2020 ; Vega et al., 2016). Seuls les retours ALS au-dessus de deux mètres ont été sélectionnés pour le calcul des métriques ALS. Les valeurs radiométriques des différentes bandes Sentinel-2 ont été extraites selon Sagar et al., (2022), de même que le type forestier (Feuillus, Conifères ou Mixte) extrait de la couche vectorielle BD-Forêt (v2). Pour chaque ensemble de données correspondant aux placettes d’un réseau (IFN ou ONF), 80 % des placettes d’entraînement ont été sélectionnées pour calibrer et le 20 % restant pour valider les modèles. Les tests sur les modèles ont été effectués sur des données complètement indépendantes, soient sur les placettes IFN de lisière ou sur des données issues des forêts tests (figure 2).

Figure 2. Traitement des couches auxiliaires pour l’élaboration des modèles (basés sur les données de terrain des « réseaux ») et leur évaluation sur les jeux indépendants (soient les placettes IFN de lisières, ou les forêts indépendantes ONF).
Sélection des variables
Face au grand nombre de métriques résultant des données de télédétection, une sélection des variables est nécessaire afin d’améliorer la robustesse des modèles et de supprimer les variables qui ajoutent une complexité inutile (James et al., 2021). Des modèles complexes conduisent souvent à un surajustement, un manque de généricité, et une faible transférabilité (Babyak, 2004 ; Yates et al., 2018). Le nombre de prédicteurs a été limité à cinq afin de faciliter le calcul des enveloppes convexes, nécessaires à l’évaluation de l’extrapolation des modèles (Habel et al., 2024). Un même modèle, issu de Ramirez Parra (2022), a été retenu pour uniformiser la comparaison entre les réseaux. Il comportait une variable du modèle numérique de hauteur (Volin = volume sous la canopée), deux métriques du nuage de points ALS (Hmoy = hauteur moyenne ; GapRatio = la proportion de premiers retours qui atteignent le seuil de 2 m), une métrique issue de la radiométrie de Sentinel-2 (B11= bande infrarouge à ondes courtes (Swir-1) qui est associée à l’humidité de la végétation) et enfin une métrique de la BD Forêt IGN v2 (en trois catégories : forêt de feuillus, mixte, ou de conifères).
Évaluation de la qualité et de la transférabilité des modèles
Une fois les modèles retenus, leur qualité ainsi que leur transférabilité ont été évaluées comme suit (voir aussi figure 2) :
1) En évaluant leurs précisions et leurs biais sur les jeux de données test n’ayant pas servi à la calibration des modèles retenus et situées potentiellement en dehors du domaine de calibration des modèles (placettes IFN en lisières de forêts) ;
2) En évaluant leurs précisions locales et leurs biais sur les données disponibles sur cinq forêts pour lesquels des données d’inventaires ONF étaient disponibles.
Les principaux indicateurs utilisés pour définir la performance des modèles étaient :
Le coefficient de détermination (R2) :
La racine de l’erreur quadratique moyenne (REQM) :
Exprimée en pourcentage pour faciliter la comparaison :
Le biais moyen (Biais) :
Également exprimé en pourcentage pour faciliter la comparaison :
où n est le nombre de placettes, la surface terrière (G, m²/ha) observée, sa moyenne, et les valeurs de surface terrière issues du modèle.
Enveloppe convexe
La proportion de prédictions extrapolées par rapport au domaine de calibration des modèles a été calculée en utilisant une approche dite « d’enveloppe convexe ». Lors de la phase de test, la proportion de placettes situées en dehors de l’enveloppe de calibration, ainsi que leur distance au point de calibration le plus près, ont été calculées selon Renaud et al., (2022). Ces indicateurs visent à identifier les prédictions potentiellement biaisées, car plus une placette s’éloigne du domaine de calibration du modèle (dans l’espace des prédicteurs), plus la prédiction qui lui est associée devient incertaine.
Le module « geometry » (Habel et al., 2024) a été utilisé avec la fonction « Inhull » pour identifier les placettes en extrapolation et le module « yaImpute » (Crookston & Finley, 2008) a été utilisé pour déterminer les distances des prédictions extrapolées.
Évaluation de l’impact de l’effort d’échantillonnage
L'évaluation de l’effet de l'effort d'échantillonnage sur la précision des modèles a été réalisée pour les réseaux de placettes IFN et ONF. Pour cela, une grille a été construite sur toute l’étendue de la zone d’intérêt afin d’échantillonner une placette par cellule de la grille. Ensuite, cinq résolutions de grille ont été mises en œuvre avec pour résolution 2, 4, 6, 10 et 20 km (figure 3). Enfin, un rééchantillonnage a été effectué pour chaque résolution (respectivement 4, 4, 5, 6, 7 fois) en tenant compte de la densité de placettes par cellule. Pour chaque échantillon, une placette a été sélectionnée aléatoirement par cellule pour calibrer les modèles puis les placettes non-sélectionnées ont servi à l’évaluation des indicateurs de la qualité d'ajustement du modèle (REQM ; biais ; proportion et distance d’extrapolation).
Figure 3 : Illustration de la méthode de grille utilisée pour évaluer l’impact de l’effort d’échantillonnage sur la qualité des prédictions. Les grilles sont présentées à des résolutions de : A) 2 km, B) 4 km, C) 6 km, D) 10 km, et E) 20 km.
Résultats
Comparaison entre sources de données
Afin de faciliter la comparaison entre les différents réseaux, les modèles retenus avaient tous les mêmes prédicteurs, tant pour l’observatoire de l’ONF que pour les placettes IFN. Les biais sont négligeables et la précision est sensiblement la même pour les deux modèles (REQM <21%) (Tableau 2).
En revanche, ces modèles ont une précision qui se dégrade fortement et des biais qui augmentent lorsqu’on les utilise sur les placettes IFN de lisière (placettes test, Tableau 2). La REQM dépasse alors 50 % et le biais dépasse 19 %.

Tableau 2. Présentation des coefficients de détermination (R²), des racines des erreurs quadratiques moyennes (REQM en m²) ainsi que des biais moyens associés aux modèles. Leurs évaluations sur les placettes IFN situées en lisières sont également présentées.
Transférabilité locale des modèles sur les forêts indépendantes
Le Tableau 3 présente les indices de qualité des modèles (Observatoire ONF et IFN) évalués localement en utilisant les placettes établies au sein de chacune des cinq forêts retenues pour les tests. On observe une nette détérioration locale du coefficient de détermination (R² = 0,22 à 0,59). La précision est dégradée (REQM entre 25,2 et 35 %) et les biais vont de 1,9 à 15,5 %. Les dégradations des indicateurs varient en fonction des forêts. Globalement, la forêt de Mouterhouse présente les biais de prédiction les plus importants ( 13,7 et 15,5 %) (tableau 3).

Tableau 3. Évaluation de la transférabilité des modèles à l’échelle des forêts. Le coefficient de détermination (R²), la racine de l’erreur quadratique moyenne (REQM), le biais ainsi que le pourcentage de placettes en extrapolation sont présentés par forêt.
Afin de mieux mettre en perspective les particularités de ces forêts par rapport aux réseaux Observatoire ONF et IFN, une analyse en composantes principales sur les variables auxiliaires des modèles a été effectuée, et le premier plan factoriel est présenté à la figure 4. Les étiquettes sont placées au centroïde des valeurs obtenues pour les différentes forêts de test et les deux réseaux (ONF et IFN). On y voit nettement se différencier la forêt de Mouterhouse (Mout) et celle des Deux Lacs (Deux), principalement sur la base de leur composition. On voit également que la hauteur moyenne des retours ALS (Hmoy) et le volume du modèle numérique de canopée (VolIn) sont également plus élevés pour la forêt de Mouterhouse que pour celle des Deux-Lacs. Cette représentation graphique nous donne une illustration du domaine de validité des placettes servant à la calibration des réseaux (qui ont une position plus centrale sur le graphique) et comment certaines forêts peuvent diverger de cet espace.

Figure 4 : Premier plan factoriel d’une analyse en composante principale effectuée sur les variables auxiliaires retenues. Il illustre le centroïde de la distribution des placettes et leur ellipse en fonction de leur appartenance à un site (forêts ONF ou réseaux Observatoire et IFN). Les flèches rouges donnent la contribution des variables auxiliaires.
Pour sa part la figure 5 illustre, par forêt, les divergences entre les prédictions des modèles Observatoire ONF ou IFN et les mesures de terrain. On observe pour chacune des forêts un phénomène de régression vers la moyenne avec une tendance à une sous-estimation des fortes valeurs de G et une surestimation des valeurs faibles.

Figure 5 : Prédictions des surfaces terrières des modèles issus de l’observatoire ONF (OBS) et de l’IFN en fonction des mesures observées dans chacune des forêts test. La droite 1 : 1 est donnée en noir et les régressions linéaires sont également données pour chacun des modèles.
L’impact de l’effort d’échantillonnage
La figure 6 illustre l’impact de l’effort d’échantillonnage sur la précision et le niveau d’extrapolation des prédictions au sein de la population pour les modèles issus des réseaux Observatoire ONF et IFN. On observe que la REQM se dégrade rapidement avec une réduction de l’effort d’échantillonnage en dessous de 100 placettes (figure 6a). Le biais moyen, pour sa part, présente une augmentation de sa variabilité à de faibles niveaux d’échantillonnage (figure 6b), avec notamment une tendance de biais négatif même pour des efforts d’échantillonnage élevés pour le modèle IFN. Avec un échantillon d’environ 200 à 400 placettes (soit une placette tous les 600 à 1 200 ha environ), la REQM varie entre 32 et 33 %, et le biais moyen oscille entre 10 % et 20 %. On observe que la proportion d’extrapolation reste très élevée (> 50 %) surtout avec une intensité d’échantillonnage correspondant à 100-150 placettes de calibration (soit une placette tous les 1 700 à 2 500 ha). Pour sa part, la distance moyenne d’extrapolation augmente également avec une réduction de l’effort d’échantillonnage (figure 6d).

Figure 6. Illustration de la qualité d’ajustement (REQM et biais relatifs) ainsi que de la proportion et de la distance d’extrapolation des deux réseaux (ONF et IFN) en fonction de l’effort d’échantillonnage. A) REQM relatif (en %) ; B) biais moyen relatif (en %) ; C) proportion de prédictions extrapolées (pixels) au sein de la population ; D) distance moyenne d’extrapolation.
Discussion
Transférabilité des modèles : des biais liés à la nature même de l’inférence
On assiste ces dernières années à une prolifération de cartes d’attributs forestiers modélisées à partir de données de télédétection, souvent acquises sur de vastes territoires (par exemple Hauglin et al., 2021 ; Nilsson et al., 2017 ; Schwartz et al., 2023). Ces cartes sont souvent proposées comme source d’information pouvant aider à la prise de décision en gestion forestière. Du fait qu’une quantification des incertitudes locales soit rarement fournie, ces cartes peuvent laisser une fausse impression de précision (Kangas et al., 2023). De plus, il est très difficile voire impossible de quantifier l’incertitude d’une prédiction lorsqu’elle est faite en dehors du domaine de validité d’un modèle. Ståhl et al., (2024) ont clairement démontré qu’en forêt, les prédictions (et les cartes issues de ces modèles) étaient par nature biaisées. Ceci vient du fait que les modèles sont une simplification de la réalité considérée comme fixe dans le cas des forêts et que l’amplitude de leurs prédictions est généralement plus restreinte que celle des données de la population. Ceci contribue au phénomène bien connu de régression vers la moyenne, mis en lumière déjà au XIXème siècle par Galton (Galton, 1886). Ainsi les prédictions de faibles valeurs ont tendances à être surestimées, et inversement pour celles de fortes valeurs (Figure 5). En fonction de la qualité des modèles, ce phénomène peut être plus ou moins marqué. Plus faible est la corrélation entre les mesures de terrain et les prédictions d’un modèle, plus le phénomène de régression vers la moyenne sera important (Ståhl et al., 2024). Il n’est donc pas étonnant de constater que, pour les différentes forêts étudiées dans notre étude, les modèles établis sur les réseaux Observatoire ONF ou IFN présentent localement des précisions nettement moins importantes que celles annoncées par la calibration des modèles, et que des biais pouvant dépasser 15 % soient observés (tableau 3). Il est toutefois intéressant de noter que les modèles obtenus en utilisant les données de l’Observatoire ONF ou celles de l’IFN ne divergent pas de façon importante, et ce malgré un décalage temporel pouvant aller jusqu’à cinq ans entre le vol ALS et les mesures terrain pour les placettes IFN (2016-2020).
Selon Guerra-Hernández et al., (2022), dans les approches de cartographie, le succès du modèle réside dans les similitudes entre l’échantillon utilisé pour calibrer le modèle et le domaine à estimer. Les modèles calibrés sur de larges régions peuvent ainsi être mal adaptés à des forêts locales, ayant certaines particularités. Certains auteurs (Gelfand et al., 2003 ; May et al., 2023 ; Besic et al., 2024b) soulignent que, pour de larges territoires, les coefficients des modèles peuvent varier spatialement, induisant ainsi des biais locaux dans les prédictions si ceci n’est pas pris en compte, et ayant d’ailleurs conduit au développement de modèles de prédictions spatialisés (voir par exemple Brunsdon et al., 1998). C’est ainsi que des erreurs systématiques sont à craindre lorsque les modèles sont établis sur de larges territoires (Kangas et al., 2018). La Figure 4 donne une illustration de ce phénomène, où les différentes forêts (en particulier Mouterhouse et Deux Lacs) se démarquent dans l’espace du premier plan factoriel comparativement aux réseaux ONF et IFN. Si les données tendent à diverger localement, l’hypothèse selon laquelle il y aurait une compensation locale des biais de prédiction au sein des forêts, ne semble pas très réaliste et cette situation est de nature à expliquer les biais substantiels observés au tableau 3.
De Lera Garrido et al., (2023) ont également observé que la diversité des conditions forestières pouvait affecter la qualité des prédictions au niveau local et conduire à des erreurs et des biais importants (> 30 % pour la surface terrière et le volume). Ces derniers ont utilisé plus de 5 000 placettes de l’inventaire norvégien pour calibrer leurs modèles et ont observé des divergences locales similaires à celles observées dans notre étude. De même, dans notre cas, les placettes IFN de lisières, qui ne faisaient pas parti du domaine de calibration des modèles, étaient mal prédites (Tableau 2).
Il faut noter également que la méthode de régression utilisée ici (les forêts aléatoires) ne permet pas de réaliser des prédictions en dehors du domaine de calibration du modèle. Cette situation accentue certainement le phénomène de régression vers la moyenne observée à la Figure 5. Selon Tompalski et al., (2019), le niveau de similarité entre les forêts, l’attribut cible et les prédicteurs auxiliaires utilisés sont tous déterminants en termes de transférabilité des modèles. La façon dont est constitué l’échantillon de calibration est donc un élément central pour la fiabilité des prédictions.
Nos résultats (figure 6) montrent également qu’une faible intensité d’échantillonnage produit un taux d’extrapolation pouvant être élevé (> 50 %). Ce résultat est important et laisse supposer qu’un échantillonnage systématique n’est pas forcément garant d’un modèle robuste et transférable. A contrario, on peut également penser qu’un échantillonnage « peu dense » produit non seulement de forts taux d’extrapolations, mais également des distances d’interpolations plus élevées (telles qu’observées à la figure 6d, dans le cas des extrapolations) et induit ainsi des prédictions moins précises (figure 6a). Ceci mérite donc une réflexion plus approfondie concernant l’optimisation des plans d’échantillonnage et leur incidence à la fois sur les distances d’interpolations et d’extrapolations.
Comment éviter ce problème ? En échantillonnant plus, mieux, ou en spatialisant les modèles ?
Fekety et al., (2015) et Yates et al., (2018) ont signalé que le nombre de placettes, l’attribut d’intérêt et la variabilité spatio-temporelle de l’acquisition de données devraient recevoir une attention particulière lors du développement des modèles, car ils influencent directement la qualité de l’ajustement. Pour minimiser les erreurs de prédiction, différentes stratégies ont été proposées pour distribuer efficacement les échantillons de calibration des modèles dans l’espace auxiliaire des données de télédétection (Grafström et al., 2014 ; Hawbaker, 2009 ; Maltamo et al., 2011). Par exemple, au Wisconsin, Hawbaker et al., (2009) ont utilisé les hauteurs ALS pour stratifier leur échantillon et ont obtenu des gains de précision de plus de 60 %. La méthode du pivot local peut également s’avérer efficace pour obtenir un échantillon équilibré (Grafström et al., 2012 ; Grafström & Schelin, 2014). Cette méthode tend à optimiser l’échantillon dans l’espace des variables auxiliaires et ne semble pas avoir encore été utilisée pour réduire les biais de prédiction et améliorer l’efficacité des modèles de télédétection.
Accroître l’effort d’échantillonnage est une autre option pour améliorer la précision des modèles. Comme le montre la figure 6, une augmentation de cet effort tend à réduire la REQM ainsi que la proportion d’extrapolation. Cependant cette option s’exerce au dépend d’une augmentation des coûts d’inventaire.
Une autre possibilité serait, a posteriori, de compléter localement le plan d'échantillonnage, comme le suggèrent Tomppo et al. (1999), car une fois le modèle établi, il devient possible de compléter efficacement l’échantillonnage en fonction d’une population visée. Cependant, ceci nécessite encore une fois de disposer d’équipes rapidement mobilisables pouvant effectuer des mesures de terrain après l’acquisition ALS.
Sans efforts supplémentaires d’échantillonnage, il est également possible d’apporter des corrections locales au niveaux de petits domaines (Battese et al., 1988 ; Gregoire et al., 2011 ; Mauro et al., 2017 ; Särndal, 1984) ou par une recalibration des prédictions (Kangas & Maltamo, 2003 ; Lindgren et al., 2022 ; Persson & Ståhl, 2020). Ces méthodes peuvent corriger les biais au niveau d’un domaine d’estimation, sans toutefois les corriger au niveau des prédictions individuelles (pixels). L’utilisation de régressions pondérées spatialement est également une piste à explorer (Brunsdon et al., 1998) qui ne semble pas avoir beaucoup retenu l’attention des modélisateurs pour l’instant.
Enfin, certains auteurs (Renaud et al., 2021 ; Sagar et al., 2022) ont montré que l’utilisation d’enveloppes convexes pouvait aider à identifier les situations à risque d’extrapolation, ce qui permet d’alerter l’utilisateur de cartes sur la fiabilité potentielle des prédictions locales. Cependant, l’utilisation des enveloppes convexes développée dans notre étude présente des limites. Nous nous sommes restreints à n’utiliser que cinq prédicteurs pour développer notre modèle car, passé ce nombre, le calcul des enveloppes convexes devient rapidement prohibitif en temps de calcul. Il est donc possible que des modèles plus performants puissent être trouvés avec davantage de prédicteurs, tout en contrôlant les risques de surajustement. Dans ce cas, il faudra trouver d’autres moyens pour définir le domaine de validité d’un modèle. De même les distances entre observations dans l’espace des prédicteurs se creusent au fur et à mesure qu’augmente la dimensionnalité. Quelles en sont les conséquences sur les risques d’extrapolation et même sur la qualité des prédictions en interpolation ? Cette question représente probablement une belle avenue de recherche à explorer ! Il reste du travail à faire pour mieux comprendre comment les plans d’échantillonnage ou le choix des prédicteurs d’un modèle peuvent influencer la précision et les biais des prédictions qui en sont faites et quels en sont les répercussions sur la qualité des cartes produites à partir de modèles de télédétection. Idéalement, une carte devrait au minimum présenter ces zones d’incertitudes afin que le gestionnaire qui l’utilise puisse prendre des décisions éclairées, basées sur des prédictions fiables.
Conclusions
Les résultats obtenus montrent que les modèles calibrés sur de vastes territoires ne garantissent pas forcément une transférabilité locale des prédictions au sein même du domaine géographique initial. Des biais importants peuvent être observés dans des cas défavorables, où localement les variables auxiliaires utilisées divergent du jeu de calibration, soit par leur distribution, soit par le fait qu’une partie de leurs valeurs se situent hors du domaine de calibration. Il semble donc important d’utiliser, ou de développer, des outils de diagnostic permettant d’identifier ces situations et corriger les biais observés, surtout lorsque les modèles sont utilisés par les gestionnaires dans des forêts à enjeux.
L’importance de la prise en compte du domaine de validité des modèles lors de la production de cartes d’attributs forestiers a été soulignée et il semble possible de réduire les problèmes d’extrapolation par une modification ou une augmentation de l’effort d’échantillonnage, ou par un complément de relevés de terrain permettant d’étendre le domaine de validité d’un modèle.
Notre étude met globalement l’accent sur l’importance d’une réflexion concernant les stratégies d’échantillonnage et d’inférence lors de la production de cartes et souligne l’importance de bien quantifier les incertitudes liées aux cartes d’attributs forestiers produites par modélisation.
Notes
Références
- Babyak, M.A. (2004). What You See May Not Be What You Get : A Brief, Nontechnical Introduction to Overfitting in Regression-Type Models. Psychosomatic Medicine, 11p.
- Bartley, M.L., Hanks, E.M., Schliep, E.M., Soranno, P.A., & Wagner, T. (2019). Identifying and characterizing extrapolation in multivariate response data. PLoS ONE, 14(12), e0225715. https://doi.org/10.1371/journal.pone.0225715
- Battese, G.E., Harter, R.M., & Fuller, W.A. (1988). An Error-Components Model for Prediction of County Crop Areas Using Survey and Satellite Data. Journal of the American Statistical Association, 83(401), 28‑36. https://doi.org/10.2307/2288915
- Besic, N., Picard, N., Sainte-Marie, J., Meliho, M., Piedallu, C., & Legay, M. (2024a). A Novel Framework and a New Score for the Comparative Analysis of Forest Models Accounting for the Impact of Climate Change. Journal of Agricultural, Biological and Environmental Statistics, 29(1), 73‑91. https://doi.org/10.1007/s13253-023-00557-y
- Besic, N., Picard, N., Vega, C., Hertzog, L., Renaud, J.-P., Fogel, F., Pellissier-Tanon, A., Destouet, G., Planells-Rodriguez, M., & Ciais, P. (2024b). Remote sensing-based high-resolution mapping of the forest canopy height : Some models are useful, but might they be even more if combined? Geoscientific Model Development,18(2), 1‑26. https://doi.org/10.5194/gmd-18-337-2025
- Brooks, D.G., Carroll, S.S., & Verdini, W.A. (1988). Characterizing the Domain of a Regression Model. The American Statistician, 42(3), 187‑190. https://doi.org/10.2307/2684998
- Brunsdon, C., Fotheringham, S., & Charlton, M. (1998). Geographically Weighted Regression-Modelling Spatial Non-Stationarity. Journal of the Royal Statistical Society. Series D (The Statistician), 47(3), 431‑443.
- Crookston, N.L., & Finley, A.O. (2008). yaImpute : An R Package for k NN Imputation. Journal of Statistical Software, 23(10). https://doi.org/10.18637/jss.v023.i10
- De Lera Garrido, A., Gobakken, T., Ørka, H., Næsset, E., & Bollandsås, O. (2022). Estimating forest attributes in airborne laser scanning based inventory using calibrated predictions from external models. Silva Fennica, 56(2). https://doi.org/10.14214/sf.10695
- Duplat, P., & Perrotte, G. (1981). Inventaire et estimation de l’accroissement des peuplements forestiers. Office national des forêts. Fontainebleau : Office national des forêts (ONF) - Section technique. 432p.
- Fekety, P.A., Falkowski, M.J., & Hudak, A.T. (2015). Temporal transferability of LiDAR-based imputation of forest inventory attributes. Canadian Journal of Forest Research, 45(4), 422‑435. https://doi.org/10.1139/cjfr-2014-0405
- Galton, F. (1886). Regression towards mediocrity in hereditary stature. Journal of the Anthropological Institute, 15, 246‑263.
- Gelfand, A. E., Kim, H.-J., Sirmans, C. F., & Banerjee, S. (2003). Spatial Modeling With Spatially Varying Coefficient Processes. Journal of the American Statistical Association, 98(462), 387‑396. https://doi.org/10.1198/016214503000170
- Georges-Leroy, M., Bock, J., Dambrine, É., & Dupouey, J.-L. (2011). Apport du lidar à la connaissance de l’histoire de l’occupation du sol en forêt de Haye. ArcheoSciences. Revue d’archéométrie, 35, Article 35. https://doi.org/10.4000/archeosciences.3015
- Grafström, A., Lundström, N.L.P., & Schelin, L. (2012). Spatially Balanced Sampling through the Pivotal Method. Biometrics, 68(2), 514‑520.
- Grafström, A., Saarela, S., & Ene, L.T. (2014). Efficient sampling strategies for forest inventories by spreading the sample in auxiliary space. Canadian Journal of Forest Research, 44(10), 1156‑1164. https://doi.org/10.1139/cjfr-2014-0202
- Grafström, A., & Schelin, L. (2014). How to Select Representative Samples. Scandinavian Journal of Statistics, 41(2), 277‑290. https://doi.org/10.1111/sjos.12016
- Gregoire, T.G., Ståhl, G., Næsset, E., Gobakken, T., Nelson, R., & Holm, S. (2011). Model-assisted estimation of biomass in a LiDAR sample survey in Hedmark county, Norway. Canadian Journal of Forest Research, 41(1), 83‑95. Scopus. https://doi.org/10.1139/X10-195
- Guerra-Hernández, J., Botequim, B., Bujan, S., Jurado-Varela, A., Molina-Valero, J. A., Martínez-Calvo, A., & Pérez-Cruzado, C. (2022). Interpreting the uncertainty of model-based and design-based estimation in downscaling estimates from NFI data : A case-study in Extremadura (Spain). GIScience and Remote Sensing, 59(1), 686‑704. Scopus. https://doi.org/10.1080/15481603.2022.2051383
- Habel, K., Grasman, R., Gramacy, R., Mozharovskyi, P., & Sterratt, D. (2024). Geometry : Mesh Generation and Surface Tessellation. R package version 0.5.0. https://github.com/davidcsterratt/geometry.
- Hauglin, M., Rahlf, J., Schumacher, J., Astrup, R., & Breidenbach, J. (2021). Large scale mapping of forest attributes using heterogeneous sets of airborne laser scanning and National Forest Inventory data. Forest Ecosystems, 8(1), 65. https://doi.org/10.1186/s40663-021-00338-4
- Hawbaker, T.J., Keuler, N., Lesak, A., Gobakken, T., Contrucci, K., Radeldoff, V. (2009). Improved estimates of forest vegetation structure and biomass with a LiDAR-optimized sampling design. Journal of Geophysical Research,, 114(3). https://doi.org/10.1029/2008JG000870
- Holmgren, P., & Thuresson, T. (1998). Satellite remote sensing for forestry planning – A review. Scandinavian Journal of Forest Research, 13(1‑4), 90‑110. https://doi.org/10.1080/02827589809382966
- Hsu, Y.H., Chen, Y., Yang, T.R., Kershaw, J.A., & Ducey, M.J. (2020). Sample strategies for bias correction of regional LiDAR-assisted forest inventory Estimates on small woodlots. Annals of Forest Science, 77(3), 75. https://doi.org/10.1007/s13595-020-00976-8
- IGN. (2022). La méthode d’inventaire forestier – INVENTAIRE FORESTIER. https://inventaire-forestier.ign.fr/spip.php?rubrique25
- James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). An Introduction to Statistical Learning : With Applications in R. Springer US. https://doi.org/10.1007/978-1-0716-1418-1
- Kangas, A., Astrup, R., Breidenbach, J., Fridman, J., Gobakken, T., Korhonen, K.T., Maltamo, M., Nilsson, M., Nord-Larsen, T., Næsset, E., & Olsson, H. (2018). Remote sensing and forest inventories in Nordic countries – roadmap for the future. Scandinavian Journal of Forest Research, 33(4), 397‑412. https://doi.org/10.1080/02827581.2017.1416666
- Kangas, A., & Maltamo, M. (2003). Calibrating predicted diameter distribution with additional information in growth and yield predictions. Canadian Journal of Forest Research, 33(3), 430‑434. https://doi.org/10.1139/x02-121
- Kangas, A., Myllymäki, M., & Mehtätalo, L. (2023). Understanding uncertainty in forest resources maps. Silva Fennica, 57(2). https://www.silvafennica.fi/article/22026
- Lindgren, N., Nyström, K., Saarela, S., Olsson, H., & Ståhl, G. (2022). Importance of Calibration for Improving the Efficiency of Data Assimilation for Predicting Forest Characteristics. Remote Sensing, 14(18), Article 18. https://doi.org/10.3390/rs14184627
- Maltamo, M., Bollandsås, O.M., Næsset, E., Gobakken, T., & Packalén, P. (2011). Different plot selection strategies for field training data in ALS-assisted forest inventory. Forestry, 84(1), 23‑31. https://doi.org/10.1093/forestry/cpq039
- Maltamo, M., Næsset, E., & Vauhkonen, J. (Éds.). (2014). Forestry Applications of Airborne Laser Scanning : Concepts and Case Studies (Vol. 27). Springer Netherlands. https://doi.org/10.1007/978-94-017-8663-8
- Mauro, F., Monleon, V.J., Temesgen, H., & Ford, K.R. (2017). Analysis of area level and unit level models for small area estimation in forest inventories assisted with LiDAR auxiliary information. PLoS ONE, 12(12). Scopus. https://doi.org/10.1371/journal.pone.0189401
- May, P., McConville, K.S., Moisen, G.G., Bruening, J., & Dubayah, R. (2023). A spatially varying model for small area estimates of biomass density across the contiguous United States. Remote Sensing of Environment, 286, 113420, 13p https://doi.org/10.1016/j.rse.2022.113420
- Meyer, H., & Pebesma, E. (2021). Predicting into unknown space? Estimating the area of applicability of spatial prediction models. Methods in Ecology and Evolution, 12(9), 1620‑1633. Scopus. https://doi.org/10.1111/2041-210X.13650
- Napoléoni, R. (2018). Cartographie des habitats à partir des données du Lidar. Rapport de recherche irstea, pp. 64 . https://hal.inrae.fr/hal-02608949
- Nilsson, M., Nordkvist, K., Jonzén, J., Lindgren, N., Axensten, P., Wallerman, J., Egberth, M., Larsson, S., Nilsson, L., Eriksson, J., & Olsson, H. (2017). A nationwide forest attribute map of Sweden predicted using airborne laser scanning data and field data from the National Forest Inventory. Remote Sensing of Environment, 194, 447‑454. https://doi.org/10.1016/j.rse.2016.10.022
- Persson, H. J., & Ståhl, G. (2020). Characterizing Uncertainty in Forest Remote Sensing Studies. Remote Sensing, 12(3), Article 3. https://doi.org/10.3390/rs12030505
- Poso, S., Wang, G., & Tuominen, S. (1999). Weighting alternative estimates when using multi-source auxiliary data for forest inventory. Silva Fennica, 33(1). https://www.silvafennica.fi/article/669
- Ramirez Parra, L.A. (2022). Evaluating models transferability in multisource forest inventories. A closer look at validity domains : From local to global models. Mémoire de master, mention AETPF spécialité FEN, AgroParisTech, 20pp. Date soutenance : 1/Sep/2022.
- Renaud, J.P., Sagar, A., Barbillon, P., Bouriaud, O., Deleuze, C., & Vega, C. (2022). Characterizing the calibration domain of remote sensing models using convex hulls. International Journal of Applied Earth Observation and Geoinformation, 112, 102939, 8p. https://doi.org/10.1016/j.jag.2022.102939
- Renaud, J.-P., Vega, C., Durrieu, S., Lisein, J., Magnussen, S., Lejeune, P., & Fournier, M. (2017). Stand-level wind damage can be assessed using diachronic photogrammetric canopy height models. Annals of Forest Science, 74(4), 74. https://doi.org/10.1007/s13595-017-0669-3
- Roussel, J.R., Auty, D., Coops, N.C., Tompalski, P., Goodbody, T.R.H., Meador, A. S., Bourdon, J.F., de Boissieu, F., & Achim, A. (2020). lidR : An R package for analysis of Airborne Laser Scanning (ALS) data. Remote Sensing of Environment, 251. Scopus. https://doi.org/10.1016/j.rse.2020.112061
- Sagar, A., Vega, C., Bouriaud, O., Piedallu, C., & Renaud, J.P. (2022). Multisource forest inventories : A model-based approach using k-NN to reconcile forest attributes statistics and map products. ISPRS Journal of Photogrammetry and Remote Sensing, 192, 175‑188. https://doi.org/10.1016/j.isprsjprs.2022.08.016
- Särndal, C. E. (1984). Design-Consistent Versus Model-Dependent Estimation for Small Domains. Journal of the American Statistical Association, 79(387), 624‑631. https://doi.org/10.2307/2288409
- Schwartz, M., Ciais, P., De Truchis, A., Chave, J., Ottlé, C., Vega, C., Wigneron, J.P., Nicolas, M., Jouaber, S., Liu, S., Brandt, M., & Fayad, I. (2023). FORMS : Forest Multiple Source height, wood volume, and biomass maps in France at 10 to 30 m resolution based on Sentinel-1, Sentinel-2, and Global Ecosystem Dynamics Investigation (GEDI) data with a deep learning approach. Earth System Science Data, 15(11), 4927‑4945. https://doi.org/10.5194/essd-15-4927-2023
- Ståhl, G., Gobakken, T., Saarela, S., Persson, H.J., Ekström, M., Healey, S.P., Yang, Z., Holmgren, J., Lindberg, E., Nyström, K., Papucci, E., Ulvdal, P., Ørka, H.O., Næsset, E., Hou, Z., Olsson, H., & McRoberts, R.E. (2024). Why ecosystem characteristics predicted from remotely sensed data are unbiased and biased at the same time – and how this affects applications. Forest Ecosystems, 11, 100164, 233-241. https://doi.org/10.1016/j.fecs.2023.100164
- Tokola, T., Pitkanen, J., Partinen, S., & Muinonen, E. (1996). Point accuracy of a non-parametric method in estimation of forest characteristics with different satellite materials. International Journal of Remote Sensing, 17(12), 2333‑2351. https://doi.org/10.1080/01431169608948776
- Tompalski, P., White, J.C., Coops, N.C., & Wulder, M.A. (2019). Demonstrating the transferability of forest inventory attribute models derived using airborne laser scanning data. Remote Sensing of Environment, 227, 110‑124. Scopus. https://doi.org/10.1016/j.rse.2019.04.006
- Tomppo, E., Goulding, C., & Katila, M. (1999). Adapting Finnish Multi-Source Forest Inventory Techniques to the New Zealand Preharvest Inventory. Scandinavian Journal of Forest Research, 14(2), 182-192. https://doi.org/10.1080/02827589950152917
- Tomppo, E., & Katila, M. (1991). Satellite image-based national forest inventory of finland for publication in the igarss’91 digest. 3, 1141‑1144. https://doi.org/10.1109/IGARSS.1991.579272
- Vega, C. (2006). Cartographie des changements de hauteur du couvert forestier, de l’âge et de l’indice de qualité de station par altimétrie laser et photogrammétrie. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.458.1633&rep=rep1&type=pdf
- Vega, C., Renaud, J.P., Durrieu, S., & Bouvier, M. (2016). On the interest of penetration depth, canopy area and volume metrics to improve 1 Lidar-based 2 models of forest parameters. Remote Sensing of Environment, 175(15/03), 32-42. https://doi.org/10.1016/j.rse.2015.12.039
- Vega, C., Renaud, J.P., Sagar, A., & Bouriaud, O. (2021). A new small area estimation algorithm to balance between statistical precision and scale. International Journal of Applied Earth Observation and Geoinformation, 97, 102303, 11p. https://doi.org/10.1016/j.jag.2021.102303
- Vega, C., & St-Onge, B. (2009). Mapping site index and age by linking a time series of canopy height models with growth curves. Forest Ecology and Management, 257(3), 951‑959.
- Yates, K.L., Bouchet, P.J., Caley, M.J., Mengersen, K., Randin, C.F., Parnell, S., Fielding, A.H., Bamford, A.J., Ban, S., Barbosa, A. M., Dormann, C.F., Elith, J., Embling, C.B., Ervin, G.N., Fisher, R., Gould, S., Graf, R.F., Gregr, E. J., Halpin, P.N., Heikkinen, R.K., Heinänen, S., Jones, A.R., Krishnakumar, P.K., Lauria, V., Lozano-Montes, H ., Mannocci, L., Mellin, C., Mesgaran, M.B., Moreno-Amat, E., Mormede, S., Novaczek, E., Oppel, S., Crespo, G.O., Peterson, A. T., Rapacciuolo, G., Roberts, J., Ross, R.E., Scales, K.L., Schoeman, D., Snelgrove, P., Sundblad, G., Thuiller, W., Torres, L.G., Verbruggen, H., Wang, L., Wenger, S., Whittingham, M., Zharikov, Y., Zurell, D., Sequeira, A.M.M. (2018). Outstanding Challenges in the Transferability of Ecological Models. Trends in Ecology & Evolution, 33(10), 790‑802. https://doi.org/10.1016/j.tree.2018.08.001

Vues: 323
PDF: 65
XML: 13