Être au cœur du processus de sélection
« Dans un premier temps, mon rôle était de créer un lien entre collecte de données sur le terrain, par les équipes de sélection, et développement d’un modèle statistique afin d’utiliser au mieux toutes les données phénotypiques disponibles des légumes implantés dans nos différentes parcelles expérimentales : rendement, forme, taille, couleur, goût... pour ensuite, relier les performances de chaque semence à ses conditions de culture et ainsi, identifier les meilleurs candidates en vue d’une future commercialisation. En compilant toutes ces informations, l’enjeu est également de mieux comprendre comment les conditions climatiques et environnementales ont un impact sur le développement des plantes et ainsi, ajuster les itinéraires de culture. » Au sein du groupe semencier, toutes les équipes travaillent de concert, qu’il s’agisse des sélectionneurs, des techniciens de laboratoire, des informaticiens ou des équipes marketing. « Avec mon équipe, nous sommes au cœur du processus de sélection, poursuit-il. Nous visons tous le même objectif : proposer aux agriculteurs et aux clients de l’aval les variétés qui correspondent le mieux à leurs attentes, sans oublier les papilles des consommateurs. Rien n’est laissé au hasard. Les conditions pédoclimatiques dans lesquelles seront produites les variétés s’avèrent par exemple capitales, tout comme le retour sur investissement des semences mises en terre. Tous les critères sont étudiés par nos outils statistiques : certains sont propres à Limagrain tandis que d’autres ont été améliorés pour s’adapter à nos besoins. »
Des outils pour mieux naviguer dans des milliers de données
Avant le développement massif des modèles statistiques, le « tri » des données était très empirique, reposant sur une appréciation globale qualitative des variétés, à partir des observations réalisées par les sélectionneurs, sous serre puis au champ. Si aujourd’hui, leur rôle reste central, l’intelligence artificielle et ses multiples déclinaisons s’affichent comme des alliées de poids. « Car au fil des années, le nombre d’informations à prendre en compte ne cesse de croitre : qu’il s’agisse de données génétiques, agronomiques, climatiques ou environnementales », liste Cédric Loi. Les statistiques et les outils prédictifs aident aussi à prédire ce que « donnera » telle ou telle variété dans tel ou tel contexte de production. Une stratégie qui facilite l’orientation à donner aux programmes de sélection : le gain de temps dans les phases d’analyses est ainsi indéniable. « Le processus de création d’une variété est très complexe, insiste-t-il. Nous devons choisir parmi des milliers, voire des millions, de paramètres, souvent liés les uns aux autres. La gestion statistique de ces données permet de mieux « naviguer » pour repérer les bonnes combinaisons et ainsi optimiser les chances de succès commercial des variétés créées ».
Des marges de progrès encore à attendre
Après avoir travaillé un peu plus de 10 ans dans le pôle des semences potagères, Cédric Loi a, en 2023, rejoint l’équipe grandes cultures de Limagrain. « Nous sommes un peu plus de 20 permanents avec des profils assez différents, précise-t-il : des data scientists, des généticiens quantitatifs, des bioinformaticiens et des agronomes. Un certain nombre d’entre eux ont fait un doctorat. L’arrivée des statistiques et de l’informatique dans les métiers de la sélection n’est pas nouvelle mais elle s’est accélérée ces dix dernières années. Sur ce même pas de temps, l’effectif de mon équipe a doublé. Le rôle de notre plateforme est aussi de mettre au point des OAD (outils d’aide à la décision) pour affiner la prise de décision, lors des essais, toujours avec un objectif de gain de temps, de précision : ce qui nous permet d’augmenter nos chances de réussite. » Quand les opportunités se présentent, Cédric Loi se déplace dans les parcelles d’essais. « C’est toujours intéressant d’échanger avec nos collègues, plus proches du terrain, pour réellement visualiser leurs attentes et comprendre comment notre métier impacte le leur. »
Pour l’avenir, il estime qu’il existe encore de « belles marges de progrès » car de nouveaux paramètres, socio-économiques notamment, devront être pris en compte. « Les outils statistiques devront s’adapter à cette nouvelle collecte massive de données avec, par exemple, la mise au point de réseaux d’apprentissage profonds pour repérer des relations encore plus fines entre les données et ainsi, mieux comprendre leurs interactions. Les supercalculateurs ont encore de beaux jours devant eux », conclut-il.
Anne Gilet