2018

Surveiller l’environnement grâce à l’intelligence artificielle

Des chercheurs de l’UNIGE ont développé une méthode qui allie la génomique et les outils d’apprentissage automatique pour explorer la biodiversité microbienne des écosystèmes.

CP_Figure.jpg

Bioindication par les micro-organismes de l’état de santé des écosystèmes. © Yvain Coudert

 

Les micro-organismes remplissent des fonctions clés dans les écosystèmes et leur diversité reflète l’état de santé de leur environnement. Or, ils sont encore largement sous-exploités dans les programmes de biosurveillance actuels, car difficilement identifiables. Des chercheurs de l’Université de Genève (UNIGE) ont récemment mis au point une approche combinant deux technologies de pointe pour pallier ce manque. Ils se servent d’outils génomiques pour séquencer l’ADN des micro-organismes dans les prélèvements, puis exploitent cette masse considérable de données grâce à l’intelligence artificielle. Ils construisent ainsi des modèles prédictifs capables d’effectuer un diagnostic de santé des écosystèmes à large échelle et d’identifier les espèces qui remplissent des fonctions importantes. Cette nouvelle approche, publiée dans la revue Trends in Microbiology, permettra d’augmenter considérablement la capacité d’observation d’écosystèmes étendus et de diminuer le temps d’analyse, pour des programmes de biosurveillance de routine beaucoup plus performants.

Surveiller l’état de santé des écosystèmes revêt une importance cruciale dans un contexte de développement durable et de pression croissante exercée par l’humain sur l’environnement. Différentes espèces de micro-organismes sensibles aux changements qui affectent leur milieu sont utilisées comme bio-indicateurs pour le suivi de la qualité de l’environnement. Or, leur identification morphologique nécessite beaucoup de temps et d’expertise. «Il y a un an, nous avons pu établir un indice de la qualité de l’eau basé uniquement sur les séquences d’ADN d’algues unicellulaires présentes dans les prélèvements, sans qu’il soit nécessaire d’en identifier visuellement chaque espèce», explique Jan Pawlowski, professeur au Département de génétique et évolution de la Faculté des sciences de l’UNIGE.


Utiliser des séquences d’ADN sans devoir les identifier

Cet outil génomique permet de décrire rapidement et très précisément des communautés biologiques peuplant un environnement. Cependant, une large proportion des données ne peut pas être utilisée pour effectuer des diagnostics de santé des milieux, parce que bon nombre de séquences d’ADN ne sont pas référencées dans les base de données existantes. Les espèces qui détiennent ces séquences demeurent donc inconnues, ainsi que leur rôle écologique. «Afin d’exploiter la totalité des données de génomique environnementale, soit l’ensemble de la biodiversité des échantillons, nous avons eu recours à un algorithme d’apprentissage automatique», note Tristan Cordier, membre du groupe genevois et premier auteur de l’étude.

Les biologistes ont utilisé des échantillons de différents statuts de qualité écologique connus, allant de bon à mauvais, dont ils ont séquencé l’ADN. La combinaison de ces informations leur a permis de constituer un système de référence avec les données de chaque échantillon. «Un modèle prédictif a ensuite été élaboré avec cet algorithme, à partir de données d’apprentissage. Celles-ci comprennent les données des diagnostics de référence et celles du séquençage d’espèces inconnues», expose Jan Pawlowski. Ce modèle est affiné et validé au fur et à mesure en incluant de nouveaux échantillons de référence au jeu de données existant.


Découvrir de nouveaux bio-indicateurs

La combinaison de ces deux technologies de pointe permet d’obtenir des valeurs écologiques pour les séquences d’ADN sans devoir les identifier. Des espèces de micro-organismes, déjà décrites ou non,  remplissant des fonctions importantes peuvent être découvertes grâce à cette approche, ainsi que de nouveaux bio-indicateurs. «Notre recherche partage des points communs avec celle menée sur le microbiome humain. Les deux visent en effet à démêler des communautés microbiennes et à identifier des biomarqueurs pouvant servir de puissants outils de diagnostic pour détecter la pollution environnementale ou des maladies humaines», conclut Tristan Cordier.

13 décembre 2018
  2018