Articles
Outils et méthodes

Reconnaître automatiquement les essences forestières avec son téléphone : rêve ou réalité ? Test de l’application Pl@ntNet

Résumé

Des applications permettant la détermination botanique à partir de photos sont désormais disponibles. Parmi elles, Pl@ntNet a été testée sur deux cents photos de feuilles d’essences forestières réparties en vingt espèces. Les résultats varient selon les essences testées, le nombre de photos utilisées pour l’apprentissage et en fonction de divers paramètres liés à la prise de vue (saison, nombre de feuilles sur la photo, support des feuilles et orthogonalité de la prise de vue). Après une analyse de ces résultats par groupes d’essences, les limites et avantages de cette application sont ensuite discutés et des pistes d’utilisation potentielle sont présentées.


Messages clés
• La détermination automatique des essences à partir de photos est désormais possible.
• La qualité de cette détermination est très variable.
• Elle fluctue principalement selon les essences.

Abstract

Applications for botanical identification from photographs are now available. Among them, Pl@ntNet was tested on two hundred photographs of leaves of twenty forest tree species. The results varied depending on the species, the number of photographs used for learning, and various parameters linked to the shots (the season, the number of leaves on the photograph, the way the leaves are presented, orthogonality of the shot). The results are analysed by group of species. The limitations and advantages of this application are discussed, and potential uses are presented.


 Highlights:
• Automatic identification of tree species from photographs is now possible.
• The accuracy of identification is quite variable.
• It mainly varies according to species.

Introduction

L’intelligence artificielle s’invite de plus en plus dans notre quotidien et permet de reconnaître des visages, des chansons, des chants d’oiseaux… Des outils analogues sont proposés pour la reconnaissance des plantes : PlantSnap, Seek, Flora Incognita, LeafSnap et Pl@ntNet. Si ces applications ont été regardées avec condescendance ou circonspection par certains botanistes ou si les discours qui les accompagnent sont parfois très optimistes en ce qui concerne les résultats obtenus, il est intéressant de les tester pour mieux cerner leur intérêt. C’est ce qui est présenté ici pour l’application Pl@ntNet.

Pl@ntNet et son fonctionnement

Présentation et fondements

Pl@ntNet a été conçu par un consortium regroupant l’Institut de recherche pour le développement (IRD), le Centre de coopération internationale en recherche agronomique pour le développement (CIRAD), l’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE), l’Institut national de recherche en informatique et en automatique (INRIA) et le réseau Tela Botanica, avec le concours de la fondation Agropolis.

Après une dizaine d’années d’existence, l’application a été téléchargée plusieurs millions de fois et compte des dizaines de milliers d’utilisateurs par jour à travers le monde.

La reconnaissance automatique des images s’appuie sur des techniques d’intelligence artificielle (apprentissage profond). Après des transformations numériques des images visant à en extraire les invariances, des recherches de similarités sont faites depuis une base de données de plantes déjà référencées et nommées. Les images soumises pour des déterminations peuvent ensuite rejoindre la base de données (selon leur qualité et leur pertinence).

L’application et son utilisation

Une interface dédiée à la détermination des plantes est proposée, disponible à la fois sur téléphone et depuis un site dédié. L’utilisateur envoie de une à quatre photos en précisant de quels organes il s’agit. L’application lui retourne une liste d’espèces (photo 1), classées par ordre de vraisemblance selon une valeur comprise entre 0 et 100 % (confidence score). Elle est assimilable à la probabilité d’appartenance du sujet de la photo fournie à l’espèce indiquée, selon le modèle mis à contribution. Ces valeurs peuvent fortement varier d’une photo à l’autre (par exemple de 2,58 % à 74,5 % pour deux feuilles d’Alisier blanc classées l’une et l’autre en première position), ou d’une espèce à l’autre. Le rang des espèces proposées importe donc également beaucoup, au-delà de la simple valeur de vraisemblance. L’utilisateur peut voir d’autres photos des espèces proposées pour juger d’une éventuelle ressemblance. Il peut ensuite choisir l’espèce qui lui semble le mieux convenir, même si elle n’apparaît pas en premier, voire en saisir une nouvelle si aucune ne convient dans la liste et qu’il est sûr de son fait. Des critères botaniques complémentaires (taille relative, odeur, rugosité, pilosité, etc.) sont accessibles à l’utilisateur alors que le modèle ne travaille qu’à partir de photos. De plus, il voit la plante dans son contexte et peut s’appuyer sur d’autres organes pour sa détermination.

L’outil Pl@ntNet est collaboratif et repose beaucoup sur ses nombreux utilisateurs revendiqués. Ainsi, chaque utilisateur peut aussi participer à la validation des images ou proposer des corrections (photo 1). Ce travail de révision permet d’améliorer les déterminations et de n’enrichir la base qu’avec des données confirmées.

Photo 1 Trois copies d’écran de l’application Pl@ntNet sur téléphone
À gauche, les résultats obtenus à la suite de la demande d’identification d’une feuille de Bouleau verruqueux (Betula pendula Roth.). Au centre, la possibilité offerte aux utilisateurs de réviser un résultat (le leur ou celui d’un autre), pour confirmer une proposition ou en faire une autre. À droite, la possibilité de valider ou non une photo (selon la netteté, le cadrage ou la facilité à reconnaître les critères d’identification) et de proposer un autre organe quand celui spécifié n’est pas le bon.

Un tel outil semble a priori utile et, après une dizaine d’années d’existence, il est intéressant d’analyser son fonctionnement, ses atouts et ses limites. Pour cela, une prise en main a d’abord été effectuée, puis après quelques mois, une série de photos a été saisie pour tester les résultats obtenus pour des essences forestières. L’objectif n’était pas de déterminer l’essence sur la photographie soumise à l’application car elle était déjà connue, mais de vérifier la pertinence des résultats proposés.

Matériel et méthode

Le jeu de photos

Il a été décidé de tester l’application sur un jeu d’essences forestières feuillues, les feuilles étant un organe plutôt facile pour la détermination des essences. Vingt essences assez communes pour la plupart, des plaines et collines du nord et du centre de la France ont été sélectionnées (tableau 1).

Cette sélection a été faite en fonction de la fréquence de ces essences, de leur diversité morphologique, de leur autochtonie, de la difficulté variable pour leur détermination et de la disponibilité de photographies. Par ailleurs, certains genres (Acer, Quercus et Ulmus) ont été privilégiés pour visualiser les éventuelles confusions entre espèces morphologiquement proches.

Certaines essences comme les Tilleuls (Tilia cordata Mill. et T. platyphyllos Scop.) n’ont pas été retenues car il était difficile sur des photographies prises auparavant de garantir la bonne détermination de l’espèce, dans la mesure où les critères utilisables (couleur de la pilosité sous les feuilles, présence ou non de poils sur le pétiole ou le bourgeon, présence ou non de côtes saillantes sur les fruits…) y sont rarement vérifiables.

Pour chaque essence, dix photographies ont été sélectionnées. Elles proviennent soit de l’auteur (pour environ un tiers d’entre elles), soit de divers auteurs de la base photographique PhotoFor (Gaudin & Mouas, 2016), pour les deux autres tiers. Seules des photos prises en milieu forestier ont été retenues, pour éviter des confusions avec des espèces du même genre aux caractéristiques botaniques proches, comme on peut en retrouver dans les parcs et jardins.

Les photos utilisées dans ce test sont quasiment toutes issues d’appareils photos numériques et non de téléphones. Cela induit notamment des différences sur les arrière-plans. En effet, les appareils à moyen ou grand capteur, grâce à leur focale assez longue, leur diaphragme pouvant être ouvert en grand et parfois des objectifs macro peuvent produire des arrière-plans assez flous sur lesquels le sujet principal ressort d’autant mieux (photo 2). Les photos sélectionnées sont globalement de meilleure qualité que ce qui est saisi en majorité dans Pl@ntNet (netteté, cadrage…). De plus, comme elles ont été prises par des forestiers et sélectionnées pour intégrer une base photographique professionnelle, elles mettent en évidence le plus souvent un certain nombre de critères botaniques utiles à la détermination.

Une vérification conséquente a été réalisée pour que chaque photo illustre bien l’espèce indiquée, en particulier pour les essences pouvant s’hybrider (notamment dans le genre Quercus). Tout doute a conduit au rejet de la photo. Chaque cliché devait comporter une ou plusieurs feuilles de l’espèce considérée. Un recadrage a parfois été effectué pour répondre aux recommandations de Pl@ntNet (netteté, sujet centré, absence de mains tenant la feuille…).

Les photos ne devaient comporter que des feuilles, voire des rameaux et des bourgeons. Celles comportant d’autres organes pouvant intervenir dans la reconnaissance (fruits, fleurs…) n’ont pas été retenues pour que la détermination proposée ne se fasse qu’à partir des feuilles ou des rameaux et que toutes les photos soient classées selon le même organe.

Les critères relevés sur les photos

Sur un échantillon de deux cents photos, il est assez facile de constater qu’il existe d’assez nombreuses différences. Dans la mesure où ces particularités interviennent potentiellement dans la reconnaissance, du moins par l’œil humain, il a été décidé d’en noter certaines pour estimer si elles intervenaient ou non dans la qualité de la reconnaissance par logiciel. Pour les facteurs présentés ci-dessous, les nombres entre parenthèses précisent combien de photos sont concernées par chaque modalité (pour un total de 200 photos).

• Nombre de photos dans la base

Pl@ntNet se réfère aux photos présentes dans sa base de données pour établir un classement par ressemblance. A priori, plus il possède de photos, plus les propositions faites sont efficaces (Joly et al., 2014). Le nombre de photos de feuilles présentes dans la base pour chaque essence juste avant de réaliser les tests a donc été noté (tableau 1).

Tableau 1 Nombre de photos de feuilles présentes dans Pl@ntNet avant le commencement des tests pour chaque essence testée


Nom latin

Nom français

Nombre de photos

Acer campestre L.

Érable champêtre

11 306

Acer opalus Mill.

Érable à feuilles d’obier

1 800

Acer platanoides L.

Érable plane

8 549

Acer pseudoplatanus L.

Érable sycomore

11 900

Alnus glutinosa (L.) Gaertn.

Aulne glutineux

6 593

Carpinus betulus L.

Charme

11 064

Castanea sativa Mill.

Châtaignier

6 721

Corylus avellana L.

Noisetier

11 136

Fagus sylvatica L.

Hêtre

14 606

Fraxinus excelsior L.

Frêne commun

13 224

Populus tremula L.

Tremble

3 689

Prunus avium (L.) L.

Merisier

7 911

Quercus petraea Liebl.

Chêne sessile

1 132

Quercus pubescens Willd.

Chêne pubescent

3 960

Quercus robur L.

Chêne pédonculé

9 443

Sorbus aria (L.) Crantz

Alisier blanc

3 590

Sorbus aucuparia L.

Sorbier des oiseleurs

6 623

Sorbus torminalis (L.) Crantz

Alisier torminal

2 084

Ulmus glabra Huds.

Orme de montagne

3 231

Ulmus minor Mill.

Orme champêtre

8 197

• Nombre de feuilles

Le nombre de feuilles peut fortement varier sur chaque photo. Toutes les feuilles non coupées par le cadrage ont été comptées. Pour des raisons de facilité de traitement des informations, elles ont ensuite été regroupées en quatre classes d’effectifs pas trop disproportionnés :

— A : une seule feuille (70) ;

— B : de deux à quatre feuilles (49) ;

— C : de cinq à dix feuilles (57) ;

— D : plus de onze feuilles (24).

• Saison

L’application accepte des images prises à toutes les saisons. Comme il s’agissait ici uniquement d’essences à feuilles caduques, seules des photos prises au printemps (17), en été (131) ou en automne (52) ont été retenues. Les premiers stades de débourrement n’étaient pas pris en compte, de même que les stades de décomposition assez marquée (avec une forte squelettisation, par exemple). Les feuilles printanières se distinguent par une morphologie qui peut être différente des feuilles estivales (photo 2) ou par leur couleur (vert tendre du Hêtre après le débourrement, par exemple). Les feuilles automnales peuvent bien entendu changer de couleurs, présenter des taches, mais également voir leur forme varier (racornissement, déchirement, flétrissement partiel du limbe), par rapport aux feuilles estivales.

Photo 2. Cette photo d’Érable sycomore présente 4 feuilles (classe B), en fin de débourrement (la saison notée est le printemps) qui se détachent bien grâce un arrière-plan flou permis par les réglages de l’appareil photographique (fond noté simple). La prise de vue est orthogonale par rapport au limbe (orthogonalité notée bonne). Son support est sa branche.
Photo : © Sylvain Gaudin

• Support

Les feuilles photographiées et saisies dans Pl@ntNet peuvent être prises sur différents supports. Ici trois modalités ont été notées : sur la branche (191), sur un fond (4) ou sur la litière (5). Le fond est souvent artificiel (feuille de papier ou de carton, terre mise à nue, rocher, borne).

• Orthogonalité

Les limbes étant le plus souvent plans, une prise de vue orthogonale au limbe permet d’avoir toute la feuille dans le plan de netteté et d’obtenir une image qui n’est pas déformée, ce qui rend la détermination plus facile (Gaudin, 2013). Pour la majeure partie des photos sélectionnées, cette orthogonalité est bonne (137), elle est parfois qualifiée de moyenne (58) quand l’angle diffère de l’angle droit et que quelques déformations apparaissent (photo 3). Dans de rares cas, l’angle est marqué et les feuilles nettement déformées ou vues de biais. Leur orthogonalité est alors qualifiée de faible (5).

Photo 3. Cette photo de Frêne commun présente un nombre de feuilles entrant dans la classe C (cinq à dix feuilles). Les feuilles ayant leur morphologie adulte, la saison notée est l’été. Leur support est une branche. Comme la prise de vue est de biais par rapport à la majorité des limbes, l’orthogonalité est moyenne. Le fond assez présent et de même couleur que les feuilles rend au premier abord la lecture de l’image assez difficile. Il est donc noté moyen.
© Sylvain Gaudin

• Fond

Selon l’environnement de la plante et les conditions de prise de vue, les feuilles photographiées se détachent plus ou moins bien sur le fond, rendant la détermination de leurs contours plus ou moins difficile. Ainsi, pour chaque photo, le fond a été qualifié de simple (130) quand il était flou ou très homogène ou quand les feuilles avaient une couleur nettement différente du fond, à l’opposé de complexe (20) quand il était particulièrement chargé et que les feuilles s’y retrouvaient mal et de moyen (50) dans les cas intermédiaires.

• Type de feuilles

Pour chaque essence, il a été noté si sa feuille était simple (180) ou composée (20).

Certains des critères notés sur chaque photo (orthogonalité, aspect du fond) nécessitent une appréciation globale qui est en partie subjective. Pour obtenir une classification la plus homogène possible, les 200 photos ont été notées par la même personne.

Le test des photos par Pl@ntNet et les paramètres notés

Les 200 photos ont été saisies dans Pl@ntNet depuis un ordinateur via l’interface internet. Cela s’est fait en un temps réduit (sur deux journées, fin décembre 2022) pour que la même version des algorithmes soit utilisée pour toutes les photos et toutes les essences.

Pour chaque photo, la page dédiée présente non seulement les résultats à l’écran, mais propose également au téléchargement un fichier indiquant la liste des espèces potentielles avec chacune sa probabilité associée, classées par ordre décroissant. Cela permet donc d’obtenir directement sa probabilité et son rang pour l’espèce connue qui a été testée, ainsi que la liste des autres espèces proposées par l’application.

L'inverse du rang obtenu (Reciprocal Rank) a également été calculé pour chaque photo. Il vaut 1/1 si la bonne essence a été classée première, 1/2 si elle a été classée deuxième… La moyenne de l'inverse du rang (Mean Reciprocal Rank) est un critère utilisé habituellement pour comparer les sorties obtenues par des méthodes classant les résultats par ordre de vraisemblance (Joly et al., 2013). Par ailleurs, dans la mesure où les rangs peuvent varier fortement dans certains cas et prendre des valeurs assez différentes, ils ont été regroupés en trois classes : A : premier, B : deuxième et C : troisième ou rang ultérieur.

Résultats

Quels sont les paramètres qui influencent la bonne reconnaissance des essences ?

Les données ont été analysées en utilisant la méthode des forêts aléatoires (Random Forests ; Breiman, 2001). Une première analyse a concerné le pourcentage (confidence score) retourné par l’application pour l’espèce présente sur la photo. Pour les deux cents photos testées, le modèle n’explique qu’environ 31 % de la variance de cette variable. Le graphique de l’importance des variables est présenté en figure 1. C’est de loin l’espèce qui est la variable la plus importante pour expliquer le pourcentage retourné par l’application. Vient ensuite le nombre de photos présentes dans la base pour l’espèce concernée au moment des tests. Les variables suivantes sont relatives à la prise de vue. Le fait que les feuilles soient composées ou simples ou la nature chargée ou non du fond n’ont pas d’importance sur le résultat, d’après nos données et la façon dont elles ont été encodées.

Figure 1 Graphique de l’importance des variables
Une importance élevée va de pair avec un poids conséquent de la variable pour diminuer l’erreur du modèle.

Comme cela a été expliqué, les pourcentages retournés par l’application servent à classer les résultats. Une seconde analyse a donc été réalisée sur les rangs. Le modèle reclasse correctement 74 % des observations. C’est encore l’espèce qui a la plus forte importance, suivie du nombre de photos présentes dans la base, puis de la saison. Les autres variables ont pour cette seconde analyse une importance négligeable. Le comportement individuel de ces variables (figure 2) est identique dans les deux analyses.

Figure 2 Graphiques présentant l’effet marginal qu’ont les différentes variables sur le pourcentage retourné par Pl@ntNet (axe des ordonnées)

L’analyse des données

Les données ont été analysées sous R à l’aide de la méthode des forêts aléatoires (bibliothèque randomForest, version 4.7-1.1). Cet outil, de plus en plus utilisé pour l’analyse des données en écologie, présente l’avantage de traiter facilement des données variées à la fois numériques et catégorielles (avec des modalités très nombreuses, comme ici les vingt essences).

Le nombre total d’arbres (ntree) a été de 10 000, le nombre de variables testées à chaque embranchement a été optimisé de manière à maximiser la part de variance expliquée par le modèle (mtry = 2). L’importance des variables (figure 1) a été calculée selon la méthode s’appuyant sur le poids de chaque variable pour diminuer l’erreur du modèle (%IncMSE).

La part de variance expliquée par le modèle (31 %) peut paraître faible. Toutes les caractéristiques des photos n’ont pas été traduites en variables : par exemple, est-ce que les feuilles sont éclairées en lumière directe ou par transparence (en contre-jour) ? Cependant, la raison principale est sans doute la très forte variabilité de la valeur à expliquer (confidence score) retournée par l’application. Pour l’ensemble des photos correctement classées en première position, elle varie de 2,6 % à 95,6 % avec un premier quartile à 19,5 %, une médiane à 40,9 % et un troisième quartile à 63,7 %.

La part de variance expliquée par le modèle (31 %) peut paraître faible. Toutes les caractéristiques des photos n’ont pas été traduites en variables : par exemple, est-ce que les feuilles sont éclairées en lumière directe ou par transparence (en contre-jour) ? Cependant, la raison principale est sans doute la très forte variabilité de la valeur à expliquer(confidence score) retournée par l’application. Pour l’ensemble des photos correctement classées en première position, elle varie de 2,6 % à 95,6 % avec un premier quartile à 19,5 %, une médiane à 40,9 % et un troisième quartile à 63,7 %.

Importance de la qualité de la prise de vue sur les résultats obtenus

Même si les modèles ont un pouvoir explicatif limité, la figure 2 montre quelques tendances intéressantes en ce qui concerne les prises de vue. Il faudra cependant les corroborer avec d’autres analyses.

• La saison

Les photos prises en été donnent généralement de meilleurs résultats. Les feuilles à leur pleine maturité sont sans doute plus faciles à identifier, de par leur typicité, que celles présentant encore des caractères juvéniles ou celles marquées par l’automne (perte de la silhouette, limbe incomplet…).

• Le nombre de feuilles sur la photo

La tendance qui se dégage est l’obtention d’un meilleur score avec un nombre réduit de feuilles sur la photo. Les photos présentant de nombreuses feuilles sont parfois moins lisibles et souvent prises à une distance plus grande, ce qui met moins en valeur les détails (nervures, denture…).

• Le support

Les photos prises sur un fond donnent un meilleur résultat que celles prises sur la branche ou parmi la litière. La silhouette de la feuille est dans ce cas plus lisible. Un résultat analogue a déjà été mis en évidence avec une meilleure reconnaissance pour des échantillons pris sur un fond que dans leur environnement naturel (Goëau et al., 2013).

• L’orthogonalité

Une certaine tolérance au manque d’orthogonalité apparaît dans les résultats (résultats identiques pour une orthogonalité qualifiée de bonne ou moyenne). En revanche, des prises de vue trop obliques font baisser la reconnaissance.

Les résultats par essences

La figure 1 montre l’importance marquée de l’essence pour expliquer la bonne reconnaissance. Il existe des différences notables entre les essences (figure 2). Cela peut venir de difficultés intrinsèques (essence difficile à reconnaître d’après une photo, confusion fréquente avec d’autres espèces du même genre…) ou de l’application (manque de références pour l’essence, photos mal classées présentes dans la base, difficulté de différencier des espèces morphologiquement proches…). À ce titre, même si le nombre de photos dans la base pour chaque essence intervient de manière conséquente, il n’y a pas de relation linéaire entre ce nombre et la qualité de la reconnaissance (figure 2). Autrement dit, la quantité de photographies n’est pas la seule donnée à prendre en compte, leur qualité importe également. Par exemple, les photos étiquetées comme Érable à feuilles d’obier présentes dans la base ont été passées en revue. Parmi elles se trouvaient un nombre non négligeable de photos d’Érable champêtre, d’Érable sycomore ou de quelques autres érables, voire d’espèces d’autres genres comme la Viorne obier (Viburnum opulus L.).

La figure 3 présente les résultats globaux obtenus pour chaque essence. Ces valeurs ne proviennent que de dix photos et sont donc à prendre comme des ordres de grandeur. Il faudrait plusieurs dizaines, voire plusieurs centaines de photos pour être plus précis. La moyenne de l’inverse du rang est un paramètre synthétique qui varie entre 0 et 1 et qui tient compte non seulement de la bonne reconnaissance, mais aussi du classement. Une photo dont l’essence arrive au dixième rang fera nettement plus baisser la moyenne qu’une arrivant au deuxième. Par exemple, l’Érable plane, le Châtaignier et l’Alisier blanc ont chacun un taux de reconnaissance de 50 %, mais les rangs obtenus sont globalement meilleurs pour l’Érable plane et moins bons pour l’Alisier blanc.

Figure 3 Taux de reconnaissance et moyenne de l’inverse du rang pour les vingt essences testées

• Les essences bien reconnues

Trois essences (l’Érable champêtre, le Hêtre et l’Alisier torminal) ont vu leurs photos toutes reconnues et cinq autres (l’Érable sycomore, l’Aulne glutineux, le Tremble, le Merisier et le Sorbier des oiseleurs) ont été reconnues dans 9 cas sur 10 (la photo mal classée se plaçant en deuxième ou en troisième place). Sur notre petit échantillon, cela peut être considéré comme un bon résultat.

Comme le montre le tableau 1, les effectifs des photos de ces espèces présentes dans Pl@ntNet sont très variables. On peut supposer en revanche que ces bases iconographiques sont globalement correctes. En effet, ces espèces sont plutôt réputées comme faciles à reconnaître par les forestiers et les naturalistes. Ainsi, les saisies ont des chances d’être globalement meilleures que pour d’autres essences plus difficiles à déterminer et les propositions de correction plus faciles à faire d’après les photos, en cas d’erreur.

Les résultats pour le Sorbier des oiseleurs sont meilleurs qu’escomptés initialement. En effet, cette essence peut être confondue avec le Cormier (Sorbus domestica L.) qui arrive d’ailleurs en deuxième position derrière le Sorbier des oiseleurs dans 6 cas sur 10.

• Les essences mal reconnues

L’Érable plane n’est placé en première position que d’après 5 photos. Pl@ntNet le classe en deuxième position sur les 5 autres, quatre fois derrière l’Érable coloré (Acer pictum Thunb.) et une fois derrière l’Érable à sucre (Acer saccharum Marshall), notamment pour les feuilles aux couleurs automnales. L’Érable coloré est une essence asiatique, dont les feuilles ressemblent peu à celles de l’Érable plane, extrêmement rare en Europe et absente des milieux naturels. Seules dix photos de feuilles de cette essence sont présentées dans la base de Pl@ntNet. Une d’entre elles correspond très certainement à une feuille automnale d’Érable plane.

L’Érable à sucre est plus difficile à différencier de l’Érable plane. Cette essence qui n’est pas présente en forêt est souvent proposée à la place de celui-ci sur d’autres photos.

Le Châtaignier n’est correctement reconnu que sur la moitié des photos. Dans les autres cas, son vicariant d’Extrême-Orient, Castanea crenata Siebold & Zucc. apparaît 3 fois en première position et 4 fois en deuxième. Ses feuilles sont très proches de celle de notre Châtaignier (mais plus petites). Par ailleurs, d’autres genres (Carpinus, Betula, Zelkova, Ulmus…) représentés par des espèces allochtones apparaissent dans les résultats avant le Châtaignier.

La différenciation botanique des principaux chênes est assez complexe, même pour les personnes initiées à la botanique. Elle a généré la rédaction de documents spécialisés (Horisberger, 2016). Les chênes sont globalement très mal reconnus par Pl@ntNet (tableau 2).

À l'exception d'un cas (Zelkova carpinifolia (Pall.) K.Koch), toutes les confusions se font au sein du genre Quercus. Quercus x rosacea Bechst., un hybride entre le Chêne pédonculé et le Chêne sessile, est l'essence la plus proposée, souvent en premier, à la place des trois espèces testées. Cet hybride, peu ou pas connu des forestiers, est peu documenté et n'apparaît pas dans les flores consultées (Lambinon et al., 2004 ; Tison & de Foucault, 2016 ; Dumé et al., 2018). Seules dix photographies de feuilles de cette essence sont recensées dans Pl@ntNet. Sinon, beaucoup de chênes étrangers (européens, méditerranéens, d'Asie mineure, américains…) sont proposés par l'application à la place des essences testées.

Tableau 2 Résultats obtenus pour les trois espèces de chêne testées. Les essences figurant dans ce tableau sont soit la bonne essence (cellules grisées) soit les essences mieux classées que le chêne testé
Ont été regroupés dans Quercus sp. les chênes absents de la dition (Quercus canariensis Willd., Quercus castaneifolia C.A.Mey., Quercus coccinea Munchh., Quercus crenata Lam., Quercus faginea Lam., Quercus frainetto Ten., Quercus ilicifolia Wangenh., Quercus ithaburensis Decne., Quercus lusitanica Lam., Quercus nigra L., Quercus trojana Webb et Quercus x turneri Willd.).


Essence testée ou mieux classée que l'essence testée

Essence testée

Quercus petraea Liebl.

Quercus pubescens Willd.

Quercus robur L.

Quercus petraea Liebl.

2

2

3

Quercus pubescens Willd.

4

3

Quercus robur L.

1

1

Quercus x rosacea Bechst.

8

5

8

Quercus cerris L.

3

1

Quercus pyrenaica Willd.

4

2

Quercus sp.

1

12

11

Zelkova carpinifolia (Pall.) K.Koch

1

L’Alisier blanc n’est cité en premier que sur 5 photos alors que c’est une espèce dont la détermination semble plutôt facile. Il est parfois confondu avec Sorbus mougeotii Soy.-Will. & Godr., ce qui semble cohérent dans la mesure où il s’agit d’un hybride fixé entre torminalis et aria, dont les feuilles ressemblent à celles de l’Alisier blanc. En revanche, différentes espèces allochtones du genre Betula ou Alnus sont mieux classées et surtout de nombreuses espèces du genre Rubus, ce qui est assez surprenant.

L'Orme champêtre n'est reconnu que 6 fois sur 10. Cependant dans trois cas, il n'est devancé que par Ulmus carpinifolia Gled. Or, l'élévation de ce taxon au rang d'espèce est discutée (Dumé et al., 2018). Les critères botaniques pour le différencier de Ulmus minor Mill. sont subtils (port, finesse des rameaux, forme de la samare…). Ainsi en considérant qu'il s'agit de la même espèce, ce qui serait plus réaliste, les résultats obtenus seraient bien meilleurs pour l'Orme.

• Quels enseignements tirer des confusions d’essences ?

Même avec notre faible échantillon de 200 photographies, il semble que les espèces ne sont pas toutes aussi facilement déterminables par cette application qui n’utilise que des photographies. Celles pour lesquelles les meilleurs résultats sont obtenus sont plutôt celles réputées comme faciles à reconnaître par les forestiers. L’efficacité de reconnaissance par Pl@ntNet vient peut-être de leur morphologie typique, mais aussi d’une base de données de bonne qualité.

Même s’il existe des confusions entre genres, voire entre familles, la plupart de celles constatées se font au sein d’un même genre (Quercus, Acer, Ulmus, Castanea…). Pl@ntNet semble donc efficace pour atteindre le genre. Souvent les espèces proposées dans le même genre ne sont pas des espèces locales, mais des espèces absentes du territoire métropolitain (par exemple, l’Érable à sucre à la place de l’Érable plane). Cela vient notamment du fait que même en saisissant Europe de l’Ouest comme filtre d’identification, le territoire pris en compte est nettement plus vaste que celui de la France. Par ailleurs, de nombreux arbres originaires d’autres continents ont été introduits à des fins ornementales dans les parcs et jardins. Ils sont donc potentiellement présents en Europe de l’Ouest, même s’ils sont rares ou cantonnés à des milieux anthropisés. Un utilisateur averti saura la plupart du temps évincer ces espèces supplémentaires qui ne peuvent qu’exceptionnellement être rencontrées en forêt. Ce n’est pas le cas pour un débutant ou un utilisateur occasionnel.

Discussion

Les réflexions présentées ci-après résultent non seulement du test qui a été réalisé, mais également d’une utilisation de l’outil pendant plusieurs mois (environ 1 600 images saisies pour 500 espèces, 3 200 validations d’espèces et 500 propositions de correction). Cela permet de mieux connaître Pl@ntNet, son fonctionnement, ses atouts et ses limites.

Un outil fiable ?

Pl@ntNet est à la fois décevant et enthousiasmant ! Décevant car les résultats proposés comportent parfois des erreurs flagrantes pour un botaniste, y compris sur des espèces considérées comme faciles à déterminer. Enthousiasmant car il classe parfois très bien, voire en première position des plantes réputées difficiles, grâce à des photos ne montrant pas tous les caractères botaniques utiles alors qu’un tel résultat semblait impossible à atteindre.

Cette diversité des résultats pose donc le problème de la fiabilité. Autant il est facile de statuer en connaissant l’espèce avant même de la saisir dans l’application, même si elle n’apparaît pas en premier, autant cela est difficile en présence d’une plante complètement inconnue. Il faut dans ce cas regarder les photos proposées pour chercher les éventuelles ressemblances et surtout ouvrir des ouvrages spécialisés pour vérifier les critères de diagnostic.

L’accumulation des données pourrait permettre d’améliorer l’efficacité de l’outil. Cependant, le test réalisé montre que si le nombre de photos de feuilles dans la base est une variable d’importance, il n’y a pas de relation linéaire avec la précision des résultats obtenus (ni pour le pourcentage associé, ni pour le rang). Ainsi, la question de la qualité des photographies (cadrage, angle de prise de vue, typicité de la feuille photographiée, netteté…) et celle de leur pertinence (pourcentage de photos représentant réellement l’espèce et non une autre) se posent.

La validation ou la correction des espèces ainsi que l’appréciation de la qualité des photographies reposent sur un fonctionnement collaboratif. Cela permet donc de corriger des erreurs quand elles sont perçues. Cependant, certaines validations sont faites par des personnes ne connaissant pas assez les plantes et les critères de différenciation des espèces, ce qui ne contribue dans ce cas qu’à entériner des erreurs de détermination ! Ce phénomène peut même conduire à amplifier les erreurs : par exemple, Pl@ntNet propose souvent l’Érable à sucre en premier à la place de l’Érable plane. L’observation des photos classées comme Acer saccharum Marshall montre qu’une partie d’entre elles sont très vraisemblablement des photos d’Érable plane. Cela conduit donc non seulement l’application à proposer une mauvaise essence, mais aussi l’utilisateur à valider le résultat, des photos identiques à la sienne étant étiquetées comme Érable à sucre.

Seul un travail méticuleux de passage en revue des photos de la base réalisé par plusieurs botanistes pourrait enrayer cela, mais il y a parfois des milliers de photos par essence… Par ailleurs, certaines essences sont difficiles à identifier sur photo, même par des spécialistes. Les mauvais résultats obtenus sur les chênes s’expliquent peut-être ainsi.

L'application permet de saisir plusieurs photos et donc plusieurs organes de la même plante. Les samares pour un érable ou les glands pour un chêne apportent une information supplémentaire qui permet souvent d'affermir le diagnostic. Travailler ainsi de manière plus systématique améliorerait la pertinence des nouvelles photos saisies (Joly et al., 2014).

Un outil pour les débutants ?

Pl@ntNet est souvent présenté comme une application qui permet de manière instantanée de reconnaître les plantes. Cela conduit directement à penser qu’aucune compétence botanique n’est nécessaire et qu’un débutant obtiendra le résultat sans effort… Sur les deux cents photos testées, la validation systématique de l’espèce proposée au premier rang donne un taux de reconnaissance de 71 %. Ce serait donc la précision obtenue sur ces photos par une personne ne vérifiant pas la cohérence des résultats dans l’application ou n’utilisant pas une flore pour valider l’espèce proposée ou en choisir une autre dans la liste.

Une telle précision n’est pas gênante pour un utilisateur occasionnel, d’une part parce qu’il ignorera ses éventuelles confusions et d’autre part, parce que savoir que l’arbre vu est un érable est suffisant pour lui (peu importe que ce soit un plane ou un sycomore). Cependant, la validation de données inexactes contribue à polluer les bases de photographies servant à de nouvelles déterminations. L’un des objectifs affichés par Pl@ntNet est d’améliorer la connaissance du vivant (distribution des espèces, dynamique des populations, etc.). Même s’il existe des filtres (sur la qualité et la pertinence des photos) et que toutes les données ne sont pas intégrées dans des bases à usage scientifique, des déterminations inexactes risquent d’introduire du bruit dans les résultats.

Un outil qui remplace les ouvrages spécialisés ?

La détermination des plantes ne passe pas que par des critères visuels suffisamment gros pour être photographiés sans matériel spécialisé. Le toucher (rugosité, aspect coriace…) ou l’odorat (odeur de l’Épiaire des bois, de la Menthe aquatique) sont par exemple d’autres moyens de diagnostiquer une plante. Par ailleurs, les espèces de certaines familles (Poacées, Cypéracées, Joncacées par exemple) nécessitent une analyse approfondie, la maîtrise d’un vocabulaire spécifique et l’utilisation d’une loupe pour être déterminées. Pour toutes ces raisons, des ouvrages spécialisés seront toujours nécessaires pour conclure. Les flores sont moins accessibles et moins ludiques, mais plus complètes et offrent plus de certitudes en ce qui concerne les déterminations. L’utilisation des outils comme Pl@ntNet ne devrait donc se faire qu’en synergie avec les ouvrages de détermination.

Quelles stratégies d’utilisation ?

• Pour l’initiation

Même si l’utilisation de l’application par un débutant risque de produire de nombreuses déterminations erronées, Pl@ntNet propose la détermination botanique au grand public. Cela peut ensuite conduire une partie des utilisateurs à approfondir leurs connaissances et à progresser dans ce domaine. Il faudra alors passer par d’autres outils comme les flores.

• Pour la formation

Les gestionnaires d’espaces verts, les naturalistes, les agriculteurs ou les forestiers ont besoin de se former à la botanique pour leurs pratiques professionnelles. Cela passe par la connaissance de la biologie des plantes, par l’acquisition d’un vocabulaire scientifique, par l’étude de la systématique et par beaucoup de pratique. Des approches pédagogiques intégrant des outils de reconnaissance photographique (en précisant bien leurs limites) en plus des méthodes traditionnelles permettraient peut-être une progression plus rapide. Des expériences ont déjà été faites dans ce sens (Lang & Šorgo, 2022).

• Pour faciliter la détermination d’espèces inconnues

L’activité professionnelle des forestiers conduit à s’intéresser aux plantes en toute saison. Si l’expérience permet de reconnaître certaines espèces herbacées une bonne partie de l’année, il est compliqué de déterminer une espèce complètement inconnue à certaines périodes. En effet, la plupart des ouvrages proposent des clés de détermination qui s’appuient principalement sur les organes reproducteurs (fleurs, fruits…), ce qui rend la détermination difficile, voire impossible. L’usage de Pl@ntNet ne donnera pas nécessairement la bonne espèce, mais permettra de cibler les recherches dans les flores et proposera des pistes éventuelles pour déterminer l’espèce. Il en est de même lorsqu’on s’intéresse à de nouveaux groupes taxonomiques. Les débuts peuvent être difficiles, faute de références et d’habitudes et l’application peut aider à gagner du temps.

• Pour voyager ou travailler sur de nouveaux milieux

La découverte d'une nouvelle flore (à l'étranger, dans un domaine biogéographique éloigné du sien) bouleverse les habitudes et oblige à travailler sur des espèces, voire sur des genres et des familles inconnus (Joly et al., 2016). L'utilisation de Pl@ntNet peut alors aider à se familiariser avec la flore locale et à faciliter les recherches. Par exemple, la découverte d'un Ephedra distachya L. (petit arbuste ou arbrisseau de 30 à 100 cm de haut) en région méditerranéenne ne conduira pas nécessairement un utilisateur à chercher dans les pages consacrées aux gymnospermes du tome 3 de la Flore forestière française (Rameau et al., 2008). Si l'application retrouve au moins le bon genre, la recherche sera nettement facilitée. Il en est de même lors de la détermination d'espèces dans de nouveaux milieux (par exemple des prairies ou des marais pour un forestier). Dans les pays sans ouvrages de référence, Pl@ntNet est l'un des rares outils utilisables.

• Pour aller vers de nouveaux usages ?

Déterminer les arbres forestiers à partir des feuilles ne devrait pas nécessiter d’application particulière pour des professionnels. En revanche, la reconnaissance des arbres à partir de leur seule écorce est nettement moins facile. Si actuellement la détermination par l’application à partir des seules écorces semble peu fiable, la constitution d’une photothèque de qualité permettrait à terme d’obtenir de meilleurs résultats. Ce serait alors un réel bénéfice pour une utilisation forestière. De même, une reconnaissance efficace par les feuilles des chênes ou d’autres genres difficiles serait un atout.

Conclusion

Un outil comme Pl@ntNet n’est jamais intrinsèquement bon ou mauvais. Tout dépend de l’usage qui en est fait. Ainsi, faire une confiance sans borne aux résultats produits serait très dangereux et s’en priver complètement, dommage. Chacun pourra se faire sa propre idée : l’application est ouverte à tous et gratuite.

Remerciements

Remerciements à Maël Lhopital et à Hélène Gaudin pour leur relecture et à Aymeric Gaudin pour ses explications concernant l’intelligence artificielle.

Références

  • Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32. doi:10.1023/A:1010933404324
  • Dumé, G., Gauberville, C., Mansion, D., & Rameau, J.C. (2018). Flore forestière française. Guide écologique illustré. Tome 1 : Plaines et collines. Paris : Institut pour le développement forestier. 2e édition : 2460 p.
  • Gaudin, S. (2013). Photographier la forêt, photographier en forêt : initiation à la prise de vue, méthode et guide pratique. Paris : Institut pour le développement forestier. 272 p.
  • Gaudin, S., & Mouas, M. (2016). PhotoFor : une base de données photographiques dédiée à la forêt. Forêt-Entreprise, (228), 6-9.
  • Goëau, H., Joly, A., Bonnet, P., Bakic, V., Barthélémy, D., Boujemaa, N., & Molino, J.F. (2013). The ImageCLEF 2013 Plant Identification Task. In: Proceedings of the 2nd ACM international workshop on Multimedia analysis for ecological data. 23-28. https://inria.hal.science/hal-00960929
  • Horisberger, D. (2016). Détermination des chênes – Clé et utilisation pratique. Fiche technique. Éd. proQuercus. 10 p.
  • Joly, A., Goëau, H., Bonnet, P., Bakić, V., Molino, J. F., Barthélémy, D., & Boujemaa, N. (2013). The imageclef plant identification task 2013. In: MAED: Multimedia Analysis for Ecological Data, Barcelone, Spain, 23-28. doi:10.1145/2509896.2509902
  • Joly, A., Goëau, H., Bonnet, P., Bakić, V., Barbe, J., Selmi, S., ... & Barthélémy, D. (2014). Interactive plant identification based on social image data. Ecological Informatics, 23, 22-34. doi:10.1016/j.ecoinf.2013.07.006
  • Joly, A., Bonnet, P., Goëau, H., Barbe, J., Selmi, S., Champ, J., ... & Barthélémy, D. (2016). A look inside the Pl@ntNet experience. Multimedia Systems, 22(6), 751-766. doi:10.1007/s00530-015-0462-9
  • Lambinon, J., Delvosalle, L., Duvigneaud, J. et al. (2004). Nouvelle Flore de Belgique, du Grand Duché de Luxembourg, du Nord de la France et des Régions voisines (Ptéridophytes et Spermatophytes). Meise : Éditions du Patrimoine du Jardin botanique national de Belgique. 5e édition : 1167 p.
  • Lang, V., & Šorgo, A. (2022). Added value of the pl@ntnet smartphone application for the motivation and performance of lower secondary school students in species identification. In: ICERI2022 Proceedings. 15th Annual International Conference of Education, Research and Innovation, 7-9 November, 2022, Seville, Spain, IATED, 4534-4540. doi:10.21125/iceri.2022.1091
  • Rameau, J.C., Mansion, D., Dumé, G., & Gauberville, C. (2008). Flore forestière française. Guide écologique illustré. Tome 3 : région méditerranéenne. Paris : CNPF-IDF. 2426 p.
  • Tison, J.M., & de Foucault, B. (2014). Flora gallica : flore de France. Éd. Biotope. 1196 p.

Auteurs


Sylvain Gaudin

sylvain.gaudin@cnpf.fr

Affiliation : CRPF du Grand Est, 51000, Châlons-en-Champagne, France

Pays : France

Pièces jointes

Pas d'informations justificatives pour cet article

Statistiques de l'article

Vues: 1021

Téléchargements

PDF: 152

XML: 7

Citations