Les données sur le temps de survie de l’humanité pourraient être soumises à un biais de survivance. Si les premiers Homo sapiens ont besoin d’une longue période de temps pour développer la machinerie intellectuelle nécessaire pour faire des observations scientifiques, alors ces observations ne pourraient pas inclure des histoires d’évolution courtes, quel que soit le taux d’extinction. La quantité d’informations que nous pourrions tirer d’un long historique de survie serait donc limitée en raison de cet effet de sélection des observations. De tels antécédents pourraient indiquer un faible taux d’extinction, ou être le sous-produit d’ancêtres chanceux ayant survécu à des taux d’extinction élevés suffisamment longtemps pour engendrer une progéniture capable de faire des observations scientifiques. On pourrait donc objecter que les limites du taux d’extinction que nous avons estimé sont trop basses12,23. Ici, nous examinons et répondons à cette préoccupation.
Modèles pour quantifier le biais d’échantillonnage potentiel
Pour modéliser le biais de sélection des observations, supposons qu’après la première apparition d’Homo sapiens, une autre étape doit être franchie. Cela pourrait représenter l’origine du langage, de l’écriture, de la science, ou tout autre facteur pertinent qui ferait passer les premiers humains dans la classe de référence de ceux qui sont capables de faire des observations (nous appelons cette étape » observateurhood « ). Soit cette étape est une variable aléatoire notée S, avec une fonction de distribution cumulative FS(t). Comme nous examinons les risques naturels, nous supposons que S et T sont indépendants. La probabilité que l’humanité survive suffisamment longtemps pour atteindre le statut d’observateur (via l’intelligence, le langage, l’écriture, la science, etc.) peut être trouvée avec l’intégrale suivante :
où fT(t) = μe-μt, la probabilité d’extinction au temps t. Nous évaluons une fonction de vraisemblance ajustée \({ {\mathcal L} }^{\ast }(\mu |T > t)\), indiquant que nous prenons la probabilité d’un taux d’extinction μ étant donné que l’humanité a survécu jusqu’au temps t, et le fait que nous conditionnons l’existence d’observateurs tels que T > S. Il en résulte la fonction de vraisemblance ajustée :
où c = P(T > S) est une constante de normalisation. Nous évaluons un modèle avec quatre variations pour l’étape d’observance : un modèle dans lequel l’observance se produit comme un événement unique qui a un taux constant au fil du temps, un modèle avec un taux croissant au fil du temps, un modèle avec des étapes multiples, et un modèle où l’observance nécessite simplement un temps fixe.
Si on le souhaite, on pourrait définir plus clairement cette propriété d’observance comme la capacité pour une espèce de collecter des données fiables sur son propre historique de survie (par exemple via la datation des fossiles) et de les analyser. En corrigeant les effets de sélection de l’observation, nous conditionnons simplement le fait que notre espèce a développé la capacité de mener cette analyse. La propriété d’observance n’a pas besoin d’invoquer la conscience ou d’être la propriété d’une espèce biologique – une machine estimant un paramètre devrait tenir compte du biais de sélection des observateurs si sa capacité à faire de telles estimations était corrélée avec le paramètre en question.
Modèle 1 : Étape unique, taux constant
Notre premier modèle suppose que l’observance a un taux d’occurrence constant θ, de sorte que S est distribué exponentiellement avec une fonction de distribution cumulative : FS(t) = 1 – e-θt. Ce modèle décrit un processus dans lequel la transition des premiers humains en observateurs se produit par hasard en une seule étape. Cela pourrait représenter l’hypothèse selon laquelle le langage hiérarchique est apparu chez les humains comme le sous-produit d’une mutation fortuite24. Avec ce modèle, la probabilité que les observateurs arrivent avant l’extinction est P(T > S) = θ(θ + μ)-1. Notre fonction de vraisemblance peut être dérivée analytiquement :
Modèle 2 : Une seule étape, un taux croissant
Notre deuxième modèle suppose de la même manière qu’une seule étape est nécessaire mais que le taux d’observation augmente au fil du temps. Ce modèle pourrait représenter une augmentation de la taille ou de la densité de la population, qui pourrait à son tour conduire l’évolution culturelle et augmenter la probabilité d’une telle étape25. Nous représentons cela par une distribution de Weibull avec une fonction de distribution cumulative \({F}_{S}(t)=1-{e}^{-{(\theta t)}^{k}}\) où k > 1 indique un taux croissant dans le temps (lorsque k = 1, c’est la même chose que l’exponentielle du modèle 1). Nous utilisons l’intégration numérique pour évaluer la fonction de vraisemblance.
Modèle 3 : étapes multiples, taux constant
Notre troisième modèle suppose qu’il y a plusieurs étapes qui doivent se produire dans une séquence afin d’obtenir des observateurs. Cela pourrait représenter un développement plus incrémental des outils, de la culture ou de la langue. Nous supposons que chaque étape est exponentiellement distribuée avec un taux θ, de sorte que le timing de la kième étape finale suit une distribution Erlang avec une fonction de distribution cumulative :
Notez que lorsque k = 1, la distribution est la même que l’exponentielle du modèle 1. Nous utilisons l’intégration numérique pour évaluer la fonction de vraisemblance.
Modèle 4 : exigence de temps fixe
Notre dernier modèle suppose qu’il faut une quantité fixe de temps τ pour atteindre l’observance. Il s’agit d’un modèle extrême qui ne laisse aucune place au hasard, mais qui pourrait représenter une accumulation graduelle et déterministe de traits. La probabilité que l’état d’observateur ait été atteint avant le temps t est donc FS(t) = 1, la fonction caractéristique qui prend la valeur 1 lorsque t > τ et 0 sinon. La probabilité que l’humanité survive au-delà du temps τ est 1 – FT(τ) = e-μτ. Notre fonction de vraisemblance de μ est :
Cette expression de vraisemblance peut également être dérivée en utilisant la propriété sans mémoire de l’exponentielle. Il convient de noter que le modèle à temps fixe est un cas limite à la fois pour le modèle à taux croissant et le modèle à étapes multiples. En prenant la limite du modèle 2 lorsque k → ∞, on obtient un modèle à temps fixe avec τ = θ-1. De même, le modèle 3 converge vers un modèle à temps fixe lorsque le nombre d’étapes augmente et que le temps attendu de chaque étape diminue (avoir une infinité d’étapes à la limite, chacune d’entre elles étant infiniment courte).
Résultats des modèles de biais d’échantillonnage
Nous évaluons la probabilité de taux d’extinction entre 10-8 et 10-2, étant donné une durée de survie humaine de 200 kyr et un large éventail de taux différents auxquels les observateurs pourraient provenir (figure 2). La première chose à noter à propos des trois premiers modèles est que lorsque les taux d’observateurs sont suffisamment rapides, la fonction de vraisemblance converge vers la version non biaisée de la section précédente. Ceci peut être vérifié en prenant des limites : pour tous les modèles lorsque θ → ∞ (ou τ → 0 dans le cas du modèle à temps fixe), \({ {\mathcal L} }^{\ast }(\mu |T > t)\to {e}^{-\mu t}\). Si l’on s’attend à ce que l’état d’observateur se produise rapidement, alors nous pouvons prendre pour argent comptant un historique de survie de 200 kyr et estimer le taux d’extinction sans biais de sélection de l’observation.
Cependant, lorsque les taux d’observance diminuent jusqu’au point où le temps d’observance attendu approche un ordre de grandeur proche de 200 kyr, un biais de sélection des observateurs émerge. Les taux qui étaient auparavant exclus par notre historique de survie se voient attribuer des probabilités plus élevées, puisqu’une partie de l’historique est une nécessité pour les observateurs (Fig. 2). Par exemple, dans le modèle 1, lorsque θ = 2 × 10-4 (correspondant à une durée d’observation prévue de 20 kyr), la probabilité relative de μ = 6,9 × 10-5 est augmentée d’un facteur 2,3 (de 10-6 à 2,3 × 10-6). Pour obtenir une vraisemblance de 10-6 (correspondant à la limite supérieure la plus conservatrice), le taux doit être fixé à 7,3 × 10-5 (voir toutes les limites éditées dans le tableau 2). Il est toutefois intéressant de noter que cet effet est limité. Même lorsque les taux d’observance ralentissent au point où le temps d’observance prévu dépasse largement 200 kyr (par exemple, plus de 20 milliards d’années), les limites supérieures révisées restent dans un facteur de 2 des limites originales. Plus la limite est stricte, plus le biais potentiel est faible : par exemple, la limite de vraisemblance de 10-6 n’est modifiée que par un facteur d’environ 1,2 dans la limite où θ → 0. Bien qu’il y aurait un certain biais d’échantillon, il y a un plafond dur sur combien notre historique de survie peut être déformé par les effets de sélection d’observation.
La raison pour laquelle les taux lents d’observance ont un impact limité sur nos estimations est que si le taux d’extinction était exceptionnellement élevé, les humains chanceux qui réussissent à survivre jusqu’à l’observance auront atteint un tel statut inhabituellement rapidement, et donc observeront toujours un historique de survie très court. Un long historique de survie est donc encore suffisant pour exclure des taux d’extinction élevés associés à des taux d’observation faibles. Nous pouvons le démontrer en examinant le temps typique nécessaire aux heureux survivants pour atteindre le statut d’observateur, en supposant un taux d’extinction élevé et un faible taux d’observance. Par exemple, dans le modèle de taux constant à une seule étape, lorsque θ = 10-6 (correspondant à un temps d’observation attendu de 1 million d’années) et μ = 10-3 (correspondant à un temps d’extinction typique de 1 000 ans), le temps d’observation attendu conditionnellement à ces taux d’extinction élevés est de 1 000 ans. Un observateur typique aura donc toujours un historique de survie très court. Les modèles avec des taux croissants ou des étapes multiples présentent la même propriété, bien que le biais soit plus important selon le paramètre k. Pour les modèles 2 et 3 avec θ = 10-6, μ = 10-3, et k = 2 (paramètres correspondant normalement à un temps d’observation attendu de 830 kyr pour le modèle 2 et de 2 Myr pour le modèle 3), les taux d’extinction élevés auront toujours pour conséquence qu’un observateur typique émergera exceptionnellement tôt et n’aura qu’un historique de survie d’environ 2000 ans. Cela peut également être vu dans la figure 2 où, pour les modèles 1, 2 et 3, la probabilité de taux d’extinction élevés dépassant 10-4 est toujours attribuée à une faible probabilité indépendamment de θ.
Cependant, un biais de sélection sévère de l’observateur peut se produire dans les modèles 2 et 3 lorsque k devient plus grand, façonnant la distribution de l’observance de telle sorte que l’observance précoce est vanishingly improbable et l’observance tardive presque garantie. Dans le cas le plus extrême, cela est représenté par le modèle à temps fixe, où la probabilité de l’observabilité passe de 0 à 1 lorsque t = τ (le modèle à temps fixe est également le cas limite lorsque k → ∞). Si ce temps fixe est suffisamment long (disons qu’il dépasse 190 ou 195 kyrs), un historique de survie de 200 kyrs n’est plus suffisant pour exclure des taux d’extinction supérieurs à 10-4. Ce résultat se produit car le modèle à temps fixe interdit toute possibilité d’observation se produisant de manière anormalement rapide. Toute lignée d’Homo sapiens suffisamment chanceuse pour survivre assez longtemps pour obtenir le statut d’observateur doit nécessairement avoir un temps de survie supérieur à τ, ce qui signifie qu’être un observateur avec un temps de survie de τ ne transmet aucune information sur le taux d’extinction.
Pour de nombreuses raisons, nous trouvons le modèle de temps fixe peu plausible. Pratiquement tous les processus biologiques et culturels impliquent un certain degré de contingence, et il n’y a aucune raison fondamentale de penser qu’acquérir la capacité de faire des observations scientifiques serait différent. Pour illustrer une comparaison, considérons un monde dans lequel le taux d’extinction est de 10-4 (en moyenne une extinction tous les 10 000 ans), mais où le statut d’observateur prend un temps fixe de 200 kyr. Dans ce modèle, le fait que l’humanité réussisse à survivre suffisamment longtemps pour atteindre le statut d’observateur est un événement qui a une chance sur 200 millions. Étant donné le biais de sélection des observations, nous ne pouvons pas exclure la possibilité d’événements rares qui sont nécessaires à nos observations. Mais nous pouvons nous demander pourquoi un événement ayant une chance sur 200 millions ne pourrait pas également inclure la possibilité que des observateurs humains modernes émergent exceptionnellement rapidement. Le langage, l’écriture et la science moderne sont peut-être très peu susceptibles de se développer dans les dix mille ans suivant l’apparition des premiers humains modernes, mais il semble exceptionnellement trop confiant de mettre les chances à moins de 1 sur 200 millions.
Un raisonnement similaire peut être appliqué pour déterminer si le taux croissant et les modèles à étapes multiples avec k élevé sont raisonnables. Nous testons cela en demandant quels paramètres seraient nécessaires pour espérer un historique de survie de 200 kyr avec un taux d’extinction à notre limite supérieure prudente de μ = 6,9 × 10-5. Pour le modèle à taux croissant, l’observance est attendue après 203 kyr avec θ = 10-7 et k = 14 et pour le modèle à étapes multiples, l’observance est attendue après 190 kyr avec θ = 10-7 et k = 16. Bien que ces modèles n’attribuent pas une probabilité strictement nulle aux premiers temps d’observation, les probabilités sont toujours extrêmement faibles. Avec un taux croissant et ces paramètres, l’état d’observateur a moins d’une chance sur un billion de se produire dans les 10 000 ans (3,4 × 10-14), et environ 1 % de chance de se produire dans les 100 000 ans. Avec des étapes multiples et ces paramètres, le statut d’observateur a moins d’une chance sur un billion de se produire dans les 10 000 ans (5,6 × 10-17), et moins de 0,02 % de chance de se produire dans les 100 000 ans. De la même manière que pour le modèle à temps fixe, nous pensons que ces modèles présentent des niveaux de confiance irréalistes dans les temps d’observation tardifs.
Bien que la plausibilité des modèles à temps fixe (ou presque fixe) soit difficile à tester directement, la grande variance de l’émergence du comportement humain moderne à travers la géographie offre une source de données qui peut tester leur plausibilité. La transition du Paléolithique supérieur s’est produite vers 45 kya en Europe et en Asie occidentale, marquée par l’émergence généralisée du comportement humain moderne25 (par exemple, les œuvres d’art symboliques, les lames géométriques, l’ornementation). Mais il existe des preuves solides de l’apparition sporadique de ce comportement humain moderne bien plus tôt dans certaines parties de l’Afrique26,27, y compris des preuves d’œuvres d’art et d’outils avancés dès 164 kya28. Bien que de nombreux facteurs aient pu empêcher la transition vers le Paléolithique supérieur de se produire rapidement, le fait que certaines communautés humaines aient effectué cette transition plus de 100 kyrs plus tôt que le reste de l’humanité indique qu’une trajectoire de développement beaucoup plus précoce n’est pas totalement hors de question.
En résumé, il est peu probable que les effets de sélection des observateurs introduisent un biais majeur dans notre historique de survie, tant que nous tenons compte de la possibilité d’observateurs précoces. Des antécédents de survie faussement longs peuvent se produire si la probabilité d’observateurs précoces est exceptionnellement faible, mais nous trouvons ces modèles peu plausibles. La grande variance du comportement de l’homme moderne est une source de données qui suggère qu’il est peu probable que nos antécédents soient gravement biaisés. Nous pouvons également nous tourner vers d’autres sources de données indirectes pour tester le biais de sélection des observateurs.