III. Naviguer dans l'océan des images

Nous fournissons à nos machines des millions d’illustrations imprimées pour qu’elles les comparent et les regroupent par similarités. Quels résultats nous crachent-elles ?

 

 

Cracher est bien le mot : c’est une bouillie qui sort, qu’il s’agit ensuite d’ordonner et comprendre. Les groupes d’images proches, que nous appelons clusters ou grappes d’images, sont si nombreux que l’effet déluge est décuplé. La vision artificielle n’est alors rien sans des techniques bien pensées pour décrire les données et les ordonner.

Notre corpus de périodiques est déjà suffisamment gros pour qu’il soit possible à la machine d’isoler, parmi nos 3 millions d’images des années 1890-1950, des lots d’images plus reproduites que d’autres à cette époque.

Mais comment, ensuite, ordonner ce chaos ?

Clickez sur "Enter" et naviguez dans un échantillon de 10'000 images grâce à PixPlot

 

Comment repérer plus en détails les groupements d’images qui auraient le plus circulé à l’échelle internationale ? Comment mettre en évidence les images qui auraient fait la mondialisation, et les logiques de leur circulation ?

 

Négociant entre le modèle des Cultural Analytics (qui se contente de visualiser de grosses masses de données, mais perd la visualité et le contexte des images) et celui, plus souple, de l’atlas (qui présente les images et permet de les comparer, mais manque aussi quelque peu leur contexte), nous complétons ces approches déjà très riches par des études de cas plus détaillées.