Le GedCom est-il périmé? (5commentaires )

Auteur Message ‹ Retour au sommaire

yannig
Yannick VOYEAUD

Posté le 27 Mars 2019 à 17h57

Certains généalogistes prétendent que la grammaire GedCom est dépassée. Je pose la question de savoir en quoi elle est périmée. Force est de constater que ces personnes ne savent pas de quoi elles parlent !

Un fichier GedCom est un fichier TEXTE dont les données sont inscrites selon un format bien précis. D’aucuns voudraient voir des images dans ce fichier mais cela est tout simplement IMPOSSIBLE. Il est possible de faire un lien vers une image mais en aucun cas afficher celle-ci dans le fichier lui-même. D’autres pensent que XML permet de faire cela. Quand ils auront réussi ils viendront me voir car c’est aussi IMPOSSIBLE qu’avec le fichier ged actuel pour la même raison que XML est un fichier texte qui renvoie vers un autre fichier texte.
Donc soyons clair on ne mettra jamais des images dans un fichier texte. Certains vont objecter que dans certains logiciels c’est possible, ils oublient que la grammaire GedCom n’est pas un traitement de texte.

D’autres disent qu’il manque plein de choses à cette grammaire. OUI il manque des choses à nos esprits européens. La grammaire GedCom a été créée par les Mormons qui sont américains donc ils ont travaillé sur cette base. L’ensemble des acteurs généalogiques ont pris fait et cause pour cette norme de fait à une époque ou peu de monde manipulait les sources que nous avons à notre disposition. Il faut faire avec et palier à d’éventuels manques. Ceux qui critiquent la grammaire ne l’utilisent pas à fond car s’ils le faisaient ils ne diffuseraient pas leurs diatribes. Plus j’avance dans l’utilisation de mon logiciel préféré, qui respecte au pied de la lettre la norme, plus je m’aperçois que beaucoup de choses ont été prévues. Les utilisateurs des poids lourds du marché français mettent énormément de choses en notes alors que beaucoup, pour ne pas dire toutes, ont des tags prévus dans la grammaire.
Les choses qui ne sont vraiment pas prévues peuvent malgré tout être intégré proprement via le tag EVEN (pour évènement) et ses sous-tags. Le service militaire est de ceux-là. Rien ne vous empêche d’utiliser ce tag pour le saisir comme ceci :
EVEN
TYPE Conscription
DATE du xx/xx/xxxx au xx/xx/xxxx
PLACE régiment caserne, ville, …
SOUR lien vers la source
Et si besoin, plusieurs fois ce tag pour par exemple la mobilisation, la captivité …
Nous sommes obligés de passer par cet artifice ‘légal’ car la conscription n’existe pas aux États-Unis mais c’est une profession (OCCU) qui peut aussi être utilisé chez nous en cas d’engagement.
Ce même tag EVEN peut être utilisé pour la communion solennelle qui n’est pas dans les tags de type religieux prévus.
Plein de tags existent au niveau de l’individu, 39 possibles et certains peuvent apparaître plusieurs fois. Ne pas oublier que chaque TAG a en général au moins 5 sous-tags à sa disposition. Ne pas oublier que l’on peut lier des individus entre-eux (témoin, déclarant, parrain, marraine, et même tuteur)
Certains mettent en NOTE les graphies différentes d’un patronyme hors le tag NAME peut être utilisé plusieurs fois. Même le nom d’artiste, par exemple, peut être entré en respectant la norme. Les patronymes nobles peuvent aussi être scindés correctement selon la norme.

Au niveau de la FAMille c’est pareil il y a 15 tags possibles (promesse, fiançailles, mariage, contrat pré-nuptial, contrat de mariage, demande de divorce, divorce pour les plus utilisés). Récemment j’ai eu à proposer une démarche pour un conseil de famille autorisant le mariage et bien oui c’est possible sans faire de salade (pour répondre au cas précis j’ai utilisé 1 fois EVEN car ce n’était pas classique comme configuration).

Il vous est possible d’avoir des NOTEs, SOURces, OBJEts à usage unique ou multiple. Vous pouvez indiquer la nature du document qui vous sert de source (photo, internet, photocopie, …), le niveau de confiance que vous avez dans l’information, si votre source est un livre rien ne vous empêche d’en indiquer la page et tout ceci avec un tag approprié.
Le champ NOTE est vraiment une note et non un fourre-tout, inexploitable ensuite car vous ne mettrez jamais les informations dans le même ordre et avec le même séparateur au cours de votre vie généalogique. Seuls les tags SOURces et REPO (dépôts) respectent un formalisme limité encore que pour SOUR on peut aller assez loin dans le pinaillage en mettant 1 SOUR par acte mais alors là je ne vous dis pas la grandeur de votre fichier.

Une question subsidiaire combien de lignes un individu qui passe par TOUS les états possibles de la norme peut-il générer ? Nous avons donc 5 personnes dans notre arbre ! Nous pouvons arriver à 6-7000 lignes différentes. Cela vous amène à relativiser l’obsolescence de cette grammaire, norme, quand on sait que si nous avons 300 lignes pour nos individus nous pouvons être heureux, seuls les plus pointus atteignent les 1000. Mais dites-vous que cela peut être assez rapide aussi, si vous exploitez toutes les sources à votre disposition.

Scribae

Posté le 3 Avril 2019 à 10h26

Merci pour ce message très instructif !

Hervé BALESTRIERI

Posté le 18 Avril 2019 à 23h42

La "grammaire" du GEDCOM, c'est à dire son niveau sémantique, n'est certainement pas dépassée, car la science généalogique n'a pas fondamentalement évolué depuis que les Mormons, à la partir de la fin des années 1980, ont cherché à l'informatiser. Vous en rappelez beaucoup de ses possibilités, ce qui intéressera les lecteurs à même de plonger avec délices, comme vous le faites, dans les subtilités du codage et de l'emploi des multiples fonctions qu'il prend en charge. Vous dites que vous utilisez un logiciel qui respecte au pied de la lettre la norme GEDCOM. Pour ma part, j'attribue à certains éditeurs de logiciels un certain dédain, voire une paresse coupable dans leur support de la norme "de facto" d'échanges d'informations généalogiques, ce qui leur permet de "verrouiller" leur clientèle ayant patiemment rempli, et parfois sur des milliers de fiches, des champs d'informations qui ne pourront jamais sortir de leur logiciel car celui-ci "bride" l'export GEDCOM en omettant ces informations... Mais ceci n'est qu'une considération commerciale. Avant de développer les raisons qui, pour moi, doivent amener à réfléchir sur la pérennité du standard GEDCOM, je voudrais tout d'abord m'arrêter sur le point de la transmission des images : En effet, s'il n'est pas question de voir apparaître une image dans un fichier de format "texte brut", c'est méconnaître pour ce qui concerne la transmission un certain nombre des possibilités d'encodage de ce type d'informations, comme le font de nos jours les e-mails que nous nous échangeons en masse avec des photos jointes, car cet encodage pourrait très bien à mon sens s'intégrer au format GEDCOM : Il suffit que vous ayiez prévu à l'émission l'adaptation de cet encodage au format de la norme, ainsi que son décodage à la réception. Il faut préciser aussi que le format d'échange de données sous standard "XML" peut tout à fait prendre en charge la "grammaire" du standard GEDCOM, ainsi que, sous la condition développée plus haut, également la transmission d'images. Enfin, oui, GEDCOM est dépassé, et devrait être à plus moins long terme, remplacé par XML : Il n'est pas définitivement dépassé dans sa "grammaire", nous l'avons dit, il l'est surtout dans sa syntaxe, car celle-ci date d'une époque où les échanges s'effectuaient par des "fichiers plats", aux formats rigoureusement prédéfinis, et dont les programmes qui les "digéraient" avaient des possibilités d'interfacages très limitées. La richesse du format XML est sa faculté de pouvoir transmettre des données qui peuvent prendre une forme hiérarchique et potentiellement répétitive, tout en gardant la possibilité de définir un format rigoureux, pouvant correspondre à celui des Bases de données, si l'on adjoint le standard "XSD" qui convient pour ce faire. Un grand nombre d'applications s'appuient désormais sur ce format pour lire et échanger des données, comme par exemple, celles qui prennent désormais en charge la lecture de votre dossier médical numérisé. Ce n'est pas pour rien que les grands éditeurs de bases de données du marché, mais également celles qui sont parmi les plus populaires en logiciels libres prévoient que leurs moteurs de stockage et de recherche puissent gérer le format "XML" comme d'autres types de données plus élémentaires : chaînes de caractères, nombres... Mais, même en informatique, où l'on dit que les choses évoluent vite, les standards ou protocoles d'échanges ne meurent que si l'on ne s'en sert plus, ou bien si les avantages d'un autre protocole sont suffisamment "poussés en avant" par des éditeurs qui y trouvent un bénéfice. Le bénéfice pour les éditeurs de logiciels de généalogie est encore pour le moment du côté de la stabilité et de la perennité, car il ne raisonnent pas à l'échelle d'un marché "global", mais seulement "culturel", et très occidental. La voie du logiciel "libre" pousserait-elle les standards actuels comme XML dans le domaine de la généalogie, ce qui permettrait l'émergence de logiciels s'adaptant à toutes les cultures, en ouvrant les limites du standard "GEDCOM" ? C'est une possibilité à laquelle devraient réfléchir des éditeurs soucieux d'un "fond de commerce" encore plus large... Car les Mormons eux-mêmes ont préparé l'avenir avec la norme "GEDCOM X", et il serait aisé pour eux de répandre cette nouvelle norme en remplacement de celle qu'ils avaient forgée il y a près de 40 ans.

yannig
Yannick VOYEAUD

Posté le 14 Mai 2019 à 17h54

Réponse à Hervé
Si sur le fond on peut être d'accord force est de constater que cela pose des problèmes.
1) Les images dans les courriels passent en HTML
2) le poids des images actuelles est trop important pour télécharger un fichier xml avec des images pour peu que vous en ayez 200 à 5Mo chacune je ne vous dis pas la rapidité de chargement sans parler du stockage du même fichier qui deviendra intransportable hors DD externe.

Par ailleurs le XML reste toujours un fichier texte. Certes ce fichier est ordonné et structuré d'une façon précise mais il n'en demeure pas moins que l'image ne pourra qu'être coder en 0 et 1 (pour simplifier) afin d'être transportable Imaginez la bande passante nécessaire pour transférer un tel fichier.
Déjà qu'à l'heure actuelle on doivent utiliser des services externes pour transférer nos fichiers GedCom. Il convient de regarder le coté pratique et ses conséquences pour se lancer dans une telle solution.
Là où je suis assez d'accord avec vous c'est sur la capacité des logiciels libres à intégrer rapidement cet aspect des choses si les Mormons se décidaient à la mettre en avant. Mais hélas ce sont les commerciaux, américains de surcroît, qui font encore la loi et donc cela n'avancera que TRÈS lentement.

Jacques Joseph

Posté le 27 Décembre 2019 à 21h19

Voilà quelques éléments qui complètent peut-être ce fil de discussion. J'ai essayé plusieurs logiciels qui permettent tous d'exporter une BD à la norme GEDCOM. Je me suis aussi formé à XML que j'ai utilisé pour la publication de dictionnaires. XML est un format très adapté à ce type de contenu simple et hiérarchisé. C'est un langage de balises (comme HTML mais en plus puissant) qui permet d'étiqueter les éléments d'information suivant la signification que lui affecte l'auteur (ou un groupe d'auteurs collaborant à distance) qui en l'occurrence créé son propre langage. D'une certaine manière la norme GEDCOM est aussi un langage assez proche de XML les balises en moins. Un fichier XML est un fichier texte, obéissant à quelques règles simples de balisage de l'information structurée qu'il contient, en cela il peut être considéré comme une base de données stricto sensu. Le grain élémentaire de la BD étant dans le cas présent l'individu, accompagné des tous ses éléments d'identification : nom, prénom,sexe, date et lieu de naissance, décés, relations verticales (parent/enfant) ou horizontale (conjoint, frêre, soeur etc.) Devant les limites des logiciels, j'ai converti ma BD GEDCOM en fichier XML, ce qui est assez facile avec un script php par exemple. La conversion inverse est aussi possible sans intermédiaire et encore plus facile avec un éditeur de texte comme NotePad++ par ex. Donc l'interopérabilité est acquise (réversibilité des fichiers). Bien sûr comme tout fichier texte et comme cela a été expliqué dans ce forum, il n'y a pas de possibilité d'intégrer des images à l'état natif. Mais la puissance du Web permet de stocker à part des images (y compris dans des supports distants) sans avoir à les transporter physiquement, les liens hypertextes se chargeant très bien d'assurer la liaison et la restitution des images le moment venu, ils constituent en cela l'essence même du Web. L'individu du fichier XML est représenté par un élément comprenant divers autres éléments (au sens de XML un élément est le texte compris entre deux balises ouvrantes de fermantes ex. ....) : Prénom NOM M jj mois aaaa lieu ... ...... Il est à noter que j'ai choisi de suivre au plus près la signification des éléments et des attributs GEDCOM, sans que cela soit obligatoire. Les noms des balises et des attributs reprennent au plus prés le nommage GEDCOM le fichier XML en reprennant la hiérarchie. On peut compléter à tout moment avec autant d'éléments que nécessaire et éventuellement en les imbriquant. Il est possible de séparer les individus, les familles, les sources etc. en divers fichiers indépendants voire distants, tout en conservant les liens entre éléments grâce aux attributs ID et IDREF. La BD comprend à peu près 1500 individus, le fichier contient 32 000 lignes. Le poids du fichier est de 500 Ko. Le temps d'une requête sur un nom est de quelques millisecondes, quelques secondes pour remonter un arbre sur 8 générations. Ceci pourrait être réduit en modifiant la structure de l'ensemble et les méthode de parcours des éléments de la BD. Le temps de chargement des images est lié à leur poids, mais en les limitant à quelques centaine de kO cela peut se gérer. Le langage XSLT (Extended Stylesheet Langage Transformation ) permet de manipuler les données du fichier XML et de les adpater au but rechercher en transformant les divers éléments en champs HTML et donc de les afficher sous la forme voulue, les feuilles de style CSS (Cascading Style Sheet) offrant toutes les possibilités de style (couleurs, boîtes etc.) Le langage XSLT permet entre autre de sélectionner des champs, de les trier, de sélectionner et d'afficher les fiches individuelles, la liste des enfants, le nom des parents, d'afficher tous les descendants d'un individu ou à l'inverse tous ses ascendants ou bien toutes les personnes ayant une structure identique, d'ajouter des images... Il est aussi possible d'interconnecter des fichiers distants ayant la même structure afin d'agrandir une base de données sans regroupement physique. Cela permet par exemple à plusieurs auteurs d'assembler des éléments familiaux épars et de compléter un arbre en utilisant le même schéma XSD ou la même DTD. Le peuplement de la BD se fait à la main avec un peu de rigueur, il serait aussi possible d'intégrer un formulaire de saisie en utilisant un script php par ex. Le couple XML-XSLT (avec un peu de javascript pour animer le tout) représente un avantage évident sur GEDCOM, car il permet l'affichage direct des données après filtage éventuel, sans passer par des transformations compliquées. Cela demande cependant un peu de formation et une pratique certaine. En conclusion ou peut affirmer que XML répond entièrement aux besoins de communication, d'échanges et d'interopérabilité y compris en matière de généalogie, ce que ne permet pas entièrement GEDCOM. Le choix entre GEDCOM ou XML n'est lié en fait qu'aux pratiques et aux usages d'échange entre commnautés. Pour l'insant GEDCOM reste incontournable, en formulant le voeux que dans un avenir proche XML prenne le relai.Il y a fort à parier que si XML avait été connu par les pères de GEDCOM c'est ce langage là qu'ils auraient choisi. Malheureusement les recommandations de la W3C en la matière ne datent que de 1998.

zero dinars

Posté le 11 Mars 2020 à 20h59

Salut , une chaine youtube spéciale sur les droits a l’investissement en France et notamment en généalogie c’est possible que vous trouverai des renseignements ou demander de l’aide sur ce sujet a Maitre : Saadi salim , Demander des renseignement sur le droit et la nationalité française et/ou des renseignements sur l’état civil de vos ascendants . Je vous invite a vous abonnez sur la chaine youtube sur le lien suivant : https://www.youtube.com/channel/UCqYkcZ_XN85V_ZGE2B6yKPg vous pouvez voir tout ces videos et vous trouverez également des renseignements sur la généalogie et connaitre aussi vos droit avec MR : SAADI Salim , et connaitre des droits que vous n’avait jamais connu . je vous invite a visiter aussi une video qui vous interessera sur le lien suivant : https://www.youtube.com/watch?v=foZMHPpUdJA j’espère que je vous ai aider dans ce cadre. Merci beaucoup

Plan du site La Revue française de Généalogie