Les statistiques, incontournables des programmes de sélection

Cédric Loi

La recherche, ce n’est pas que des paillasses et des blouses blanches. Ces dernières années, les spécialistes des statistiques et de la gestion des data épaulent les sélectionneurs pour collecter et trier la masse des paramètres à analyser. Une dynamique qui s’accélère pour gagner du temps dans le process de sélection de la variété idéale. Rencontre avec Cédric Loi, responsable de l’équipe Data Analytics pour Limagrain Field Seeds research.

 

Ingénieur généraliste de formation à CentraleSupélec, Cédric Loi s’est rapidement spécialisé dans le domaine des mathématiques appliquées aux statistiques et aux probabilités. Après une thèse en collaboration avec l’Inria (Institut national de recherche en sciences et technologie du numérique) dédiée à modéliser la croissance des plantes, il rejoint le groupe Limagrain en 2011, au sein de la section potagères, pour créer et développer l’activité statistiques pour cette branche. « Dans ma filière, une grande majorité des étudiants endosse des fonctions dans des structures dédiées aux assurances, aux finances ou en lien avec la bourse, explique-t-il. Pour ma part, je souhaitais travailler dans un domaine appliqué au monde du vivant, de la biologie ou des plantes. Postuler pour le groupe Limagrain, l’un des leaders mondiaux de la filière semencière, avait un réel sens à mes yeux, en lien direct avec notre alimentation. »

Être au cœur du processus de sélection

« Dans un premier temps, mon rôle était de créer un lien entre collecte de données sur le terrain, par les équipes de sélection, et développement d’un modèle statistique afin d’utiliser au mieux toutes les données phénotypiques disponibles des légumes implantés dans nos différentes parcelles expérimentales : rendement, forme, taille, couleur, goût... pour ensuite, relier les performances de chaque semence à ses conditions de culture et ainsi, identifier les meilleurs candidates en vue d’une future commercialisation. En compilant toutes ces informations, l’enjeu est également de mieux comprendre comment les conditions climatiques et environnementales ont un impact sur le développement des plantes et ainsi, ajuster les itinéraires de culture. » Au sein du groupe semencier, toutes les équipes travaillent de concert, qu’il s’agisse des sélectionneurs, des techniciens de laboratoire, des informaticiens ou des équipes marketing. « Avec mon équipe, nous sommes au cœur du processus de sélection, poursuit-il. Nous visons tous le même objectif : proposer aux agriculteurs et aux clients de l’aval les variétés qui correspondent le mieux à leurs attentes, sans oublier les papilles des consommateurs. Rien n’est laissé au hasard. Les conditions pédoclimatiques dans lesquelles seront produites les variétés s’avèrent par exemple capitales, tout comme le retour sur investissement des semences mises en terre. Tous les critères sont étudiés par nos outils statistiques : certains sont propres à Limagrain tandis que d’autres ont été améliorés pour s’adapter à nos besoins. »

Des outils pour mieux naviguer dans des milliers de données

Avant le développement massif des modèles statistiques, le « tri » des données était très empirique, reposant sur une appréciation globale qualitative des variétés, à partir des observations réalisées par les sélectionneurs, sous serre puis au champ. Si aujourd’hui, leur rôle reste central, l’intelligence artificielle et ses multiples déclinaisons s’affichent comme des alliées de poids. « Car au fil des années, le nombre d’informations à prendre en compte ne cesse de croitre : qu’il s’agisse de données génétiques, agronomiques, climatiques ou environnementales », liste Cédric Loi. Les statistiques et les outils prédictifs aident aussi à prédire ce que « donnera » telle ou telle variété dans tel ou tel contexte de production. Une stratégie qui facilite l’orientation à donner aux programmes de sélection : le gain de temps dans les phases d’analyses est ainsi indéniable. « Le processus de création d’une variété est très complexe, insiste-t-il. Nous devons choisir parmi des milliers, voire des millions, de paramètres, souvent liés les uns aux autres. La gestion statistique de ces données permet de mieux « naviguer » pour repérer les bonnes combinaisons et ainsi optimiser les chances de succès commercial des variétés créées ». 

Des marges de progrès encore à attendre

Après avoir travaillé un peu plus de 10 ans dans le pôle des semences potagères, Cédric Loi a, en 2023, rejoint l’équipe grandes cultures de Limagrain. « Nous sommes un peu plus de 20 permanents avec des profils assez différents, précise-t-il : des data scientists, des généticiens quantitatifs, des bioinformaticiens et des agronomes. Un certain nombre d’entre eux ont fait un doctorat. L’arrivée des statistiques et de l’informatique dans les métiers de la sélection n’est pas nouvelle mais elle s’est accélérée ces dix dernières années. Sur ce même pas de temps, l’effectif de mon équipe a doublé. Le rôle de notre plateforme est aussi de mettre au point des OAD (outils d’aide à la décision) pour affiner la prise de décision, lors des essais, toujours avec un objectif de gain de temps, de précision : ce qui nous permet d’augmenter nos chances de réussite. » Quand les opportunités se présentent, Cédric Loi se déplace dans les parcelles d’essais. « C’est toujours intéressant d’échanger avec nos collègues, plus proches du terrain, pour réellement visualiser leurs attentes et comprendre comment notre métier impacte le leur. »
Pour l’avenir, il estime qu’il existe encore de « belles marges de progrès » car de nouveaux paramètres, socio-économiques notamment, devront être pris en compte. « Les outils statistiques devront s’adapter à cette nouvelle collecte massive de données avec, par exemple, la mise au point de réseaux d’apprentissage profonds pour repérer des relations encore plus fines entre les données et ainsi, mieux comprendre leurs interactions. Les supercalculateurs ont encore de beaux jours devant eux », conclut-il.

Anne Gilet

 

LG
MD
SM