Campus

Dossier | linguistique

La longue marche des langues

Une étude basée sur la linguistique place l’origine des langues indo-européennes en Anatolie d’où elles se seraient diffusées, à partir de 8500 av. J.-C., vers l’est jusqu’en Inde et vers l’ouest en Europe. Elle contredit la thèse, jusqu’ici dominante, d’une naissance dans les steppes pontiques vers 5000 av. J.-C.

Il existe une controverse tenace sur l’origine des langues indo-européennes. Cette famille, qui regroupe entre autres les idiomes celtiques, italiques, germaniques, balto-slaves, indo-iraniens ou encore grecs, serait issue, pour une partie des linguistes, des nomades des steppes pontiques (au nord de la mer Noire, entre le Dniepr et la Volga) qui auraient déferlé au cours de l’âge du Bronze (vers 4000 av. J.-C.) sur le Vieux Continent avec leurs chars à deux roues tirés par des chevaux. Cette thèse est soutenue par un certain nombre d’éléments linguistiques et archéologiques. Pour les autres, elle aurait été diffusée quelques millénaires plus tôt par les premiers paysans venus d’Anatolie, en Turquie actuelle, qui ont fait basculer progressivement l’Europe dans le Néolithique.

Sans trancher définitivement la question – une dispute scientifique ne s’éteint pas si facilement –, un article paru dans la revue Science du 24 août 2012 fait franchement pencher la balance du côté de la seconde option. Les auteurs ont fait appel à la puissance des ordinateurs pour simuler la diffusion des langues dans le temps et l’espace. Résultat: les langues indo-européennes viennent d’une langue originelle parlée il y a 8500 ans dans le sud de la Turquie. Russel Gray, linguiste, professeur à l’Université d’Auckland en Nouvelle-Zélande et l’un des auteurs de l’étude, a détaillé la démarche à l’occasion du Congrès sur la diversité génétique et l’origine des Européens qui s’est tenu à Genève les 15 et 16 janvier dernier. Un événement organisé par Alicia Sanchez-Mazas, professeure à la Faculté des sciences et directrice du Laboratoire d’anthropologie, génétique et peuplements.

Pertes et gains

«Nous avons utilisé un modèle développé initialement pour rechercher, à partir de données moléculaires, l’origine des épidémies virales, explique Russel Gray. Nous l’avons adapté pour analyser un ensemble de mots appartenant au vocabulaire de base de 103 langues indo-européennes contemporaines et antiques. A la place des mutations génétiques qui sont la cause de l’évolution en biologie, nous avons utilisé les pertes et les gains au cours du temps de «cognats», ou mots apparentés entre les langues.»

Pour être enregistrés comme tel, les mots doivent avoir une signification similaire et, plus important encore, montrer des correspondances systématiques dans leur prononciation. Par exemple, le mot anglais pour cinq, five, possède des mots apparentés en allemand (fünf), en suédois (fem) et néerlandais (vijf), reflétant une descendance du mot proto-germanique (*fimf). Des mots apparentés peuvent disparaître ou apparaître, par exemple lorsqu’une langue commence à utiliser un nouveau terme pour une signification donnée. Ainsi, dans la lignée qui a mené vers les langues germaniques, le mot indo-européen pour os, *ast(h), a été remplacé à un certain moment par *bainan, ce qui a donné bone en anglais, Bein en allemand, ben en suédois ou encore been en néerlandais.

A ces «mutations» linguistiques, les chercheurs ont ajouté les distributions géographiques de ces langues et des contraintes de diffusion avant de faire remonter le temps à leur simulation. L’exercice a été répété plusieurs fois en variant un certain nombre de paramètres.

Dans tous les cas de figure, les ordinateurs ont désigné l’Anatolie comme point de départ des langues indo-européennes. Le résultat est encore plus significatif si l’on ne prend en compte que la vingtaine de langues aujourd’hui éteintes (hittite, gothique, latin…). Et il pointe toujours la Turquie si le modèle ne considère que les langues vivantes.

Toutes les langues mènent à Rome

Sachant qu’historiquement toutes les langues romanes sont issues du latin, les chercheurs ont choisi ce sous-groupe pour vérifier leur modèle. Celui-ci n’a pas failli et a calculé que l’endroit où la probabilité est la plus grande de trouver la langue originelle est la région de Rome.

«Les premières phases du scénario que nous proposons sont cohérentes avec l’expansion de l’agriculture qui traverse l’Europe via les Balkans et atteint les côtes occidentales vers 5000 av. J.-C., poursuit Russel Gray. Il correspond également avec les résultats génétiques et craniométriques qui montrent qu’il existe une contribution anatolienne dans le génome européen.»

Russel Gray n’en est pas à son coup d’essai. Il a mené, il y a quelques années déjà, une étude similaire sur les langues austronésiennes, parue dans la revue Science du 23 janvier 2009. Cette famille de langues comprend quelque 1200 idiomes parlés dans presque tout l’océan Pacifique. Il existe un accord assez généraopour affirmer que l’ancêtre commun de toutes ces langues était parlé à Taïwan il y a plusieurs millénaires. La simulation élaborée par Russel Gray et ses collègues a confirmé cette thèse et a permis de montrer que la diffusion des langues austronésiennes à travers les îles aurait débuté il y a 5200 ans et serait passée par des périodes de pause et d’accélération liées à des innovations techniques et sociales.

Les critiques de cette méthode numérique ne manquent pas, cependant. Les tenants de la thèse des steppes pontiques notent, par exemple, que les chercheurs ont limité leur étude au vocabulaire qui ne représente qu’une partie minoritaire des données accessibles en linguistique. Ils estiment également que trop de paramètres concernant la diffusion et le taux de modification des langues sont arbitraires.

En réponse, les auteurs de l’étude sur les langues indo-européennes précisent que les archéologues, eux, doivent lutter pour lier leurs découvertes à des cultures particulières. «Guigner dans le passé de l’être humain n’est pas une chose simple, expliquent-ils. Cela revient à tenir une bougie au-dessus d’un sombre abysse. On doit utiliser la moindre information à disposition.» z

Les linguistes sur les traces des migrants Plusieurs linguistes étaient présents lors du Congrès sur la diversité génétique et l’origine des Européens qui s’est tenu à Genève les 15 et 16 janvier derniers. L’un d’eux, Laurent Sagart, du Centre de recherches linguistiques sur l’Asie Orientale à Paris, était l’un des modérateurs. Il explique les raisons de sa présence dans une assemblée dominée par les archéologues et les biologistes. Campus: Que font des linguistes dans un congrès sur la migration et le peuplement? Laurent Sagart: Dans ma discipline, il existe une catégorie de chercheurs, les linguistes historiques dont je fais partie, qui étudient l’origine des langues. L’histoire du peuplement humain nous intéresse dans la mesure où les populations emportent avec elles les langues qu’elles parlent lorsqu’elles se déplacent. L’une de nos tâches consiste à reconstruire des langues disparues. Du coup, nous cherchons aussi à reconstruire leur histoire, comprendre qui les parlaient, à quel endroit et à quelle époque. Dans cette optique, la linguistique est une des fenêtres sur le passé, au même titre que l’archéologie et la génétique des populations. La linguistique est-elle aussi fiable que l’archéologie ou la génétique dans ce domaine? Elle est fiable. Nous disposons de méthodes permettant d’exclure le hasard. Quand on veut reconstruire une langue morte, l’ancêtre des langues indo-européennes par exemple, nous commençons par repérer des mots qui se ressemblent d’une langue à l’autre. Ils sont choisis dans une partie du vocabulaire qui est connue pour résister aux emprunts. Il faut que ces mots soient liés entre eux en fonction d’un système de règles de correspondances. Ces lois, bien établies, permettent d’éviter les mots qui se ressemblent par hasard (il y en a beaucoup) ainsi que les mots empruntés d’une langue à l’autre. En agissant ainsi, on peut tenter de reconstruire une partie du vocabulaire de la langue ancestrale et avoir une idée de la manière dont ces mots se prononçaient et ce qu’ils voulaient dire. Les langues ouvrent-elles aussi une porte sur la culture du passé? Une partie du vocabulaire que nous obtenons se retrouve dans toutes les langues. Elle est universelle et ne nous dit rien sur la culture des populations. Mais une autre partie, elle, véhicule une information utilisable. On peut déterminer si une langue ancestrale possédait des mots pour désigner les céréales, par exemple, ou pour l’action de récolter. Ces termes indiquent si les locuteurs en question pratiquaient une certaine forme d’agriculture ou si, au contraire, on a affaire à une culture pastorale. Il est ensuite possible de corréler ces résultats avec des données archéologiques qui peuvent fournir des dates absolues.

Campus

La longue marche des langues

Les linguistes sur les traces des migrants