La canopée ou le parcours en profondeur d’un arbre d’ascendance

Principe et définitions

Photographie de canopée – Source : Wikipédia/Canopée

Pourquoi un parcours en profondeur ?

La représentation classique d’un arbre d’ascendance, qu’elle soit horizontale ou verticale, privilégie la forme générale, sans distinction entre les individus dont les parents sont connus et ceux dont les parents sont inconnus. De la même façon, les représentations parcellaires de l’arbre, qu’elles se fassent par générations ou par lignées, négligent ce paramètre pourtant essentiel, notamment en phase de recherche d’ancêtres.

En effet, lorsqu’on souhaite reprendre un travail de recherche interrompu dans une branche ou un lieu, la première question qui se pose est de savoir où on l’a laissé. Même si tout bon généalogiste a en tête, au moins de manière vague, les principaux noms qu’il a explorés ou au contraire laissés en instance de recherche dans une branche ou un lieu donné, il peut être utile d’avoir une représentation complète des individus terminaux sur lesquels l’arbre s’arrête en l’état actuel des recherches.

Autre situation où cette représentation est utile, dans une logique descriptive cette fois, lorsqu’on cherche à globaliser la représentation des origines connues d’une personne, en s’affranchissant des générations et des ascendants inconnus. Dans une logique quantitative, on peut s’en servir pour étudier les origines d’un individu en s’affranchissant des individus inconnus ou encore pour délimiter les branches ayant une certaine homogénéité d’origine (voir le second article, à venir, sur mes origines).

Définition

Je nomme donc canopée, en référence à la surface irrégulière formée par la cime des arbres et des branches d’une forêt, le sous-ensemble d’un arbre d’ascendance composé des ascendants dont soit le père, soit la mère, soit les deux, ne sont pas connus. On peut aussi donner une définition plus restrictive, ou canopée terminale (la redondance est assumée), dans laquelle on ne prend que les ascendants dont ni le père ni la mère ne sont connus. Nous utiliserons plus volontiers la première définition.

On définit aussi des canopées partielles : la canopée agnatique formée des individus dont le père est inconnu et la canopée cognatique formée des individus dont la mère est inconnue.

Point essentiel, la canopée comporte au moins un individu de chaque lignée. Attention : les représentants de lignées multiples peuvent être présents plusieurs fois. En fonction de l’utilisation (descriptive ou quantitative) qu’on aura de la canopée, on peut choisir de les compter plusieurs fois ou non.

La canopée agnatique, d’une utilisation restreinte, présente cependant l’intérêt théorique qu’elle comporte un individu et un seul de chaque lignée.

Parmi les autres propriétés de l’objet, on peut noter qu’une canopée terminale rassemble des individus entre lesquels aucun lien de parenté connu autre que la similitude ne peut exister puisque, par définition, aucun de leurs ascendants n’est connu.

Construction

La canopée d’un arbre d’ascendance se construit par un parcours en profondeur de l’arbre et en ne retenant que les individus qui remplissent les conditions données ci-dessus.

Sans entrer dans de vrais détails techniques, on peut donner par curiosité l’algorithme suivant qui construit une canopée terminale :

Initiation : lire la souche de l’arbre

Récurrence : pour chaque individu, si son père est connu on passe à son père ; si sa mère est connue on passe à sa mère ; si aucun des deux n’est connu, on l’ajoute à la canopée.

Une illustration vaut une explication

Reprenons par exemple l’arbre virtuel suivant, déjà rencontré dans l’article sur la partition d’un arbre en lignées.

Exemple d’arbre d’ascendance incomplet

La canopée de cet arbre est composée des SOSA 16, 17, 18, 9, 20, 21, 5, 24, 25, 26, 27 et 7, dont au moins l’un des deux parents est inconnu.

Canopée de l’arbre donné plus haut

Sa canopée terminale exclut les individus dont au moins l’un des parents est connu, elle est donc limitée aux SOSA 16, 17, 18, 19, 20, 21, 24, 25, 26 et 27.

Canopée terminale de l’arbre donné plus haut

On voit sur cette illustration, dans une logique d’outil d’aide à la recherche, que la canopée simple permet de repérer les recherches à conduire pour compléter l’arbre, tandis que la canopée terminale laisse de côté les parents manquants lorsque leur « conjoint » est connu.

Comment mettre un peu d’ordre dans sa canopée ?

Au-delà des quelques paramètres et indices que je vais définir ci-dessous sur cet objet, il faut relever que la première utilisation de la canopée est en tant que liste d’individus qui forment un sous-ensemble particulier de l’arbre d’ascendance de par leur caractéristique principale : ils sont généalogiquement « orphelins » au moins d’un parent.

On représentera donc la canopée comme une liste d’individus, pour laquelle ont pourra choisir, en fonction des utilisations, divers ordres pour la classer.

Ordre des SOSA

Un ordre simple sur la canopée est celui des SOSA croissants des individus qui la composent. Un regroupement naturel pourra se faire par générations. La canopée est alors représentée par paquets correspondant aux générations dans l’arbre d’ascendance des individus qui la composent, avec dans chaque paquet un ordre croissant des SOSA. Naturellement, puisque le numéro de SOSA augmente strictement entre deux générations données, l’ordre général est bien respecté.

Cet ordre est intéressant pour reprendre une recherche interrompue, puisqu’il peut être naturel de reprendre cette recherche par les individus situés le plus « bas » dans l’arbre, qui sont donc généralement les plus récents et présentent donc une meilleure probabilité de trouver leurs parents manquants.

Notons que ce classement par ordre des SOSA peut ignorer, ou non, la question des individus doubles suivant qu’on choisit de les numéroter suivant leur place dans l’arbre (plusieurs SOSA pour un même individu) ou de reprendre un même numéro SOSA pour un  même individu, sans considération pour sa place dans l’arbre.

Dans l’exemple ci-dessus, la canopée dans cet ordre donne : (5, 7),(9), (16, 17, 18, 20, 21, 24, 25, 26, 27). Les parenthèses séparent les générations.

Ordre des lignées

Avec la numérotation des lignées présentées dans cet article, il est assez naturel de classer la canopée dans l’ordre croissant des numéros de lignées. Il faut en effet rappeler qu’une canopée comporte exactement un individu de chaque lignée, son générateur.

Cette numérotation a un intérêt plus limité pour la recherche mais présente l’avantage de numéroter dans l’ordre des lignées (et donc, en général, des patronymes) les plus courantes puisque toute la lignée L1 porte, dans un système de transmission patrilinéaire du nom, le patronyme de la souche, la lignée L2 celui de sa mère, la lignée L3 celui de sa grand-mère paternelle, etc.

Propriété intéressante : dans un arbre complet (dont tous les individus sont connus jusqu’à une génération donnée) sans individus doubles, cet ordre est exactement inversé à celui basé sur la taille des lignées puisque plus une lignée part d’une souche récente, plus elle est longue dans un arbre complet.

Dans l’exemple ci-dessus, la canopée ainsi classée se lit : 16, 24, (5, 20), 7, (9, 18), 26, 17, 21, 25, 27. Les nombres entre parenthèses sont ceux d’une même lignée.

Ordre préfixe : « de gauche à droite »

L’ordre préfixe de la canopée, correspondant au parcours en profondeur préfixe de l’arbre d’ascendance, est intéressant en ce qu’il est intrinsèquement lié à la notion de canopée et qu’il traduit une réalité graphique. Totalement indépendant des ordres liés aux lignées et aux numéros SOSA, il traduit l’ordre qu’on obtient en parcourant la canopée « de gauche à droite ».

Du point de vue théorique, on pourrait l’obtenir en numérotant chaque individu suivant son SOSA en numérotation binaire, laquelle est intrinsèquement liée aux arbres généalogiques ascendants qui sont binaires par nature (chaque individu a au maximum deux parents), et ensuite en classant ces numéros dans un ordre préfixe. Mais ce n’est pas le propos de cet article…

Retenez plutôt qu’on l’obtient en lisant la canopée de gauche à droite en s’affranchissant des différences de génération.

Dans cet ordre, l’arbre donné plus haut se lit : 16, 17, 18, 9, 20, 21, 5, 24, 25, 26, 27, 7.

J’utiliserai cet ordre notamment pour séparer mon arbre d’ascendances en groupes d’origine commune.

Quelques caractéristiques de la canopée

Définitions simples

On l’a vu, la canopée est un outil naturel de recherche en tant qu’elle pointe les individus pour lesquels un travail d’exploration complémentaire doit être mené pour déterminer, si possible, l’identité de l’un ou l’autre de leurs parents.

On peut alors définir la notion intuitive d’épaisseur de la canopée qui, par définition, est donnée par le nombre de générations d’ascendances différentes rencontrées parmi les individus qui la composent. Dans l’exemple donné plus haut, l’épaisseur de la canopée est de 3 (individus des générations III, IV, V). On appelle alors génération de base de la canopée (resp. génération de cime de la canopée) la plus petite (resp. la plus grande) génération rencontrée dans la canopée, soit la IIIe et la Ve dans l’exemple.

Par construction, on sait que l’arbre d’ascendance considéré est complet, c’est-à-dire que tous les individus en sont connus, jusqu’à la génération de base de sa canopée.

L’ombrage de la canopée comme mesure de la morphologie de l’arbre d’ascendance

On peut alors définir un indice sur la canopée, appelé ombrage de la canopée, qui donne un renseignement global sur l’arbre d’ascendance considéré.

Etape 1 : on attribue a chaque individu de la canopée un poids obtenu de la manière suivante :

  • lorsque aucun des deux parents de l’individu n’est connu, il reçoit le poids individuel 1.  Lorsqu’un seul de ses parents est connu, il a un poids individuel de 1/2 ;
  • en partant de la génération de cime de la canopée, on attribue à chaque génération un poids générationnel déterminé de la façon suivante : 1 pour la génération de cime, 1/2 pour la génération de cime – 1, 1/4 pour la génération de cime – 2, etc. et donc 1/2^i (2 puissance i) pour la génération de cime – i ;

le poids de chaque individu est le produit de son poids individuel et de son poids générationnel.

Etape 2 : on calcule le poids de la canopée comme la somme des poids des individus qui la composent. Attention : si la canopée comporte des individus doubles, ils doivent être comptés autant de fois qu’ils sont présents.

Etape 3 : on obtient l’ombrage de la canopée, compris entre 0 et 100 %, comme le quotient du poids de la canopée et du nombre théorique d’individus dans l’arbre à la génération de cime de la canopée (soit 2^(G-1), 2 puissance G moins 1, si G est la génération de cime de l’arbre).

Lorsque l’ombrage est égal à 100 %, cela signifie que l’arbre est complet, c’est-à-dire que tous les individus de l’arbre d’ascendance sont connus jusqu’à une génération donnée. Lorsqu’au contraire l’ombrage est proche de 0 %, cela signifie que l’arbre est peu touffu et qu’une ou plusieurs lignées (un seul ascendant à chaque génération) sont beaucoup plus longues que les autres.

La formule est effectivement un peu complexe, mais elle permet de respecter ce à quoi on s’attend intuitivement : un arbre complet, quelle que soit la génération, aura une canopée « très dense » et un ombrage élevé, proche de 100 %, tandis qu’un arbre  « très clairsemé », dominé par des « tiges », aura un ombrage proche de 0 %. Vous aurez compris que j’ai choisi le terme d’ombrage par référence à la lumière qui atteindrait le sol sous l’arbre d’ascendance au milieu d’un champ, par exemple ;-).

Dans l’exemple d’arbre donné plus haut, la canopée compte 12 individus. Les 9 de la Ve génération ont chacun un poids individuel de 1 et un poids générationnel de 1, celui de la IVe génération a un poids individuel de 1/2 et un poids générationnel de 1/2 et les 2 de la IIIe génération ont un poids individuel de 1/2 et un poids générationnel de 1/4. Enfin, à la Ve génération, on a un nombre théorique d’ascendants de 2^(5-1) = 2^4 = 16, soit au final un ombrage de :

(9 x 1 + 1/2 x 1/2 + 2 x 1/2 x 1/4)/16  = 9,5/16 = 59 %

ce qui me semble refléter l’intuition en la matière, suivant laquelle l’arbre donné en exemple n’est ni vraiment dense ni vraiment clairsemé.

Saurez-vous retrouver quel est l’ombrage de la canopée de l’autre arbre utilisé dans l’article sur la partition d’un arbre d’ascendance en lignées ? Rappelez-vous, la présence d’individus doubles n’a pas d’effet sur l’ombrage.

Exemple d’arbre d’ascendance incomplet

Le calcul de l’ombrage d’une canopée donne un indicateur synthétique de la morphologie globale d’un arbre d’ascendance. Associé aux générations de base et de cime de la canopée, il donne une bonne idée de la forme générale et du niveau de complétude de l’arbre d’ascendance.

Suivant le même calcul du poids de la canopée, mais en le divisant par le nombre d’individus de la canopée au lieu du nombre théorique d’individus à la plus haute génération, on obtient un indice d’étagement de la canopée, de 0 à 100 % également, qui indique si la canopée est très ramassée sur peu de générations (proche de 100 %) ou au contraire très étagée avec des tiges ou des branches qui dépassent de beaucoup les autres (proche de 0 %). Dans notre premier exemple, l’indice d’étagement est de

9,5/12 = 79 %

ce qui traduit la prédominance en son sein d’individus de la plus haute génération (9/12) et donc son faible étagement.

La notion de canopée, tant dans son approche descriptive, comme liste classée d’individus que dans son approche analytique qui renseigne sur la morphologie de l’arbre dans son ensemble, va notamment nous permettre de proposer une réponse plus complète à la question des origines d’une personne.

Mais cela est une autre histoire…

Advertisements
Cet article, publié dans Analyses, est tagué , , , , , , . Ajoutez ce permalien à vos favoris.

2 commentaires pour La canopée ou le parcours en profondeur d’un arbre d’ascendance

  1. Pauline dit :

    Ce commentaire a près de trois ans de retard (honte à moi), mais je comprends tout à coup beaucoup mieux un certain commentaire sur mon propre blog. J’avoue que je n’avais pas poussé aussi loin l’analyse de la « canopée »…Il va falloir que j’étudie la question !

    • J’avoue que cet article, un des plus théoriques de ce blog, n’est sans doute pas le plus utile pour mes lecteurs. Heureux que vous l’ayez trouvé, pour l’anecdote.

      Au fond, même si tous les développements de cet article ne sont pas essentiels pour mener des recherches généalogiques, je pense que le concept est néanmoins intéressant car c’est le point de départ de toute progression : lorsqu’on reprend une branche après une longue absence, on commence par se demander quels étaient les plus anciens ancêtres connus qui pourraient faire l’objet d’investigations complémentaires. La réponse est : ce sont les ancêtres appartenant à la canopée.
      Bien généalogiquement,
      Rémi

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s