2018

Un langage électronique commun pour la résonance magnétique

Une équipe de chimistes dirigée par l’UNIGE vient de créer un langage électronique commun permettant de partager les données de chimie organique avec l’ensemble de la communauté scientifique internationale.

 

En chimie organique, les scientifiques sont sans cesse à la recherche de nouvelles molécules qu’ils créent et étudient grâce à la résonance magnétique. Les données récoltées sont ensuite retranscrites en fonction des normes propres à chaque laboratoire ou publication. Elles sont dès lors difficilement exportables électroniquement et donc peu utilisables par la communauté scientifique. Une équipe internationale, dirigée par des chimistes de l’Université de Genève (UNIGE), a développé un nouveau langage électronique commun, permettant de traduire les données de chaque molécule d’une seule et même manière et de les exporter facilement d’un système informatique à l’autre. Les données deviennent ainsi facilement accessibles par tous les chimistes et réutilisables directement, permettant un gain de temps notable pour les futures recherches. Cette étude, à lire dans la revue Magnetic Resonance in Chemistry (Wiley), ouvre la voie à la création d’une base de données internationale en accès libre et à des outils spécifiques incluant l’analyse par intelligence artificielle.

Les organiciens créent de nouvelles molécules à base d’atomes de carbone, mais celles-ci sont si petites qu’il leur est impossible de voir ce qu’ils synthétisent. Pour vérifier ces assemblages effectuées à l’aveugle, les chercheurs utilisent alors la résonance magnétique : chaque atome constituant la molécule émet un signal, et la fréquence de ce signal est traduite sous forme de spectre que les chimistes vont ensuite décoder. Pour déterminer la structure d’une molécule, il faut donc être capable de lire les spectres de résonance magnétique.


La résonance magnétique se met au diapason

Les chimistes possèdent un vocabulaire spécifique pour décrire les spectres et détailler la résonance des atomes. Mais cette traduction des données brutes en langage écrit varie en fonction de chaque laboratoire, logiciel utilisé et publication. Il n’y a donc ni base de données sur la composition des molécules, ni uniformité dans le traitement des spectres et des données qui leurs sont attribuées. «C’est pourquoi il est très difficile de réutiliser des données générées par d’autres laboratoires sans risque d’erreur, explique Damien Jeannerat, chercheur au Département de chimie organique de la Faculté des sciences de l’UNIGE. Nous avons donc eu l’idée de créer un langage électronique unique qui permette de passer d’un système à l’autre sans perte d’information et de constituer des bases de données internationales en libre accès.»

Le NMReDATA comme langue unique

Les chimistes de l’UNIGE ont ainsi dirigé une initiative international impliquant les spécialistes du domaine et proposé une norme pour le traitement des données des molécules organiques. «Notre nouveau format, nommé NMReDATA, fonctionne selon un système d’étiquettes à attribuer à chaque  donnée extraite du spectre dans un ordre défini et qui est facilement lisible par un ordinateur», précise Marion Pupier, ingénieure au Département de chimie organique de la Faculté des sciences de l’UNIGE.  Ainsi, le signal de chaque spectre sera traduit dans l’ordre par le déplacement chimique, le nombre d’atomes, le couplage, les corrélations interatomiques et finalement l’attribution. «Jusqu’à présent, chacun transmettait ces mêmes informations de façon plus ou moins complète dans un ordre qui lui était propre, rendant impossible le transfert électronique d’un ordinateur à l’autre sans un contrôle et une réorganisation des informations par les chercheurs. Avec notre système, cette obligation disparaît grâce à l’uniformité du langage», s’enthousiasme Damien Jeannerat.


Créer une base de données internationale en libre accès

L’idée d’un langage électronique commun est intimement liée à la volonté de créer une base de données en accès libre. «Celle-ci permettrait aux chimistes de trouver la composition exacte de molécules étudiées, sans refaire eux-mêmes un travail déjà effectué par le passé», note Marion Pupier. L’information sera visible et disponible en tout lieu et toute heure, permettant un gain de temps et d’argent considérable dans la recherche en chimie organique.

Reste à présent à diffuser ce nouveau format et à en faire la norme dans la publication d’articles par les grandes revues internationales. «Nous espérons que dans une année environ, tous les logiciels seront parfaitement opérationnels et que NMReDATA sera utilisé par tous», conclut Damien Jeannerat.

7 juin 2018
  2018