Infos

Socface va transcrire automatiquement les recensements de 1836 à 1936

Vous connaissez les recensements français de 1836 à 1936, car vous pouvez en consulter des transcriptions réalisées depuis des décennies par les associations de généalogie. Plus récemment, Filae a publié ceux de 1872 à 1911 pour la quasi intégralité des départements français. Toutes ces transcriptions ont été réalisées par l'oeil humain. Mais avec le projet Socface, lancé par l'INED (Institut national d'études démographiques), c'est la machine qui va prendre le relais. 

Socface réunit archivistes, démographes, économistes, historiens et informaticiens pour mettre au point le traitement à grande échelle de vastes séries de documents historiques. À l'aide de la reconnaissance automatique d’écriture manuscrite, il s'agit d'analyser l’ensemble des listes nominatives de recensement de 1836 à 1936, soit 20 recensements.

Avec pour horizon mars 2025, le résultat sera une base de données de tous les individus ayant vécu en France entre 1836 et 1936. Elle sera utilisée pour analyser le changement social dans la longue durée. Bonne nouvelle, cette base des listes nominatives sera ouverte au grand public en Open Access, permettant à tous de parcourir librement des centaines de millions d’enregistrements. 

L’Ined possède une longue tradition de recherche en démographie historique, qu’il a contribué à fonder. Le projet Socface s'inscrit dans la continuité des enquêtes de l’Ined en démographie historique, comme l’enquête TRA. Socface associe également l'École d’Économie de Paris, qui rassemble près de 150 chercheurs et 155 doctorants. La technologie sera assurée par Teklia, une entreprise française spécialisée dans la reconnaissance automatique de documents manuscrits et imprimés, quel que soit leur format, leur langue et leur période. 

Liens utiles

A lire dans nos archives

 

que_peut_lintelligence_artificielle_pour_les_archives_etat_de_lart.mp4

Commentaires

5 commentaires
  • Portrait de Isabelle Dannerollle

    Je ne vois pas où est le plagiat ? Éclairez moi svp
    • Portrait de Jérôme

      Article: "Socface réunit archivistes, démographes, économistes, historiens et informaticiens pour mettre au point le traitement à grande échelle de vastes séries de documents historiques." Site Socface: "Le projet Socface réunit archivistes, démographes, économistes, historiens et informaticiens travaillant ensemble pour mettre au point des technologies de traitement à grande échelle de vastes séries de documents historiques" Article: "À l'aide de la reconnaissance automatique d’écriture manuscrite, il s'agit d'analyser l’ensemble des listes nominatives de recensement de 1836 à 1936, soit 20 recensements." Site Socface: "Le projet mobilise la reconnaissance automatique d’écriture manuscrite pour analyser l’ensemble des listes nominatives du recensement de 1836 à 1936 (soit 20 recensements)."
  • Portrait de thebaud franck

    Je viens de tester leur logiciel de reconnaissance, et force est de constater qu'il manque encore l'oeil humain. Sur un petit paragraphe pourtant écrit clairement, il y a plus de 4 fautes, sur les prénoms, noms... Même leur IA n'arrive pas à choisir les bons termes avec les prénoms... Espérant que leur IA puisse apprendre et se corriger.