De gegevens over de overlevingstijd van de mensheid zouden onderhevig kunnen zijn aan een vertekening van het overlevingspatroon. Als de vroege Homo sapiens een lange periode nodig heeft om de intellectuele machinerie te ontwikkelen die nodig is om wetenschappelijke waarnemingen te doen, dan zouden dergelijke waarnemingen geen korte evolutionaire geschiedenissen kunnen omvatten, ongeacht de extinctiesnelheid. De hoeveelheid informatie die we zouden kunnen afleiden uit een lange staat van dienst op het gebied van overleving zou dus beperkt zijn als gevolg van dit waarnemingsselectie-effect. Een dergelijke staat van dienst zou kunnen wijzen op een laag uitstervingspercentage, of het bijproduct kunnen zijn van gelukkige voorouders die lang genoeg een hoog uitstervingspercentage overleefden om nakomelingen te verwekken die in staat waren wetenschappelijke waarnemingen te doen. Men zou daarom kunnen aanvoeren dat de door ons geschatte grenzen voor de uitsterfsnelheid te laag zijn12,23.
Modellen om potentiële steekproefbias te kwantificeren
Om observatieselectiebias te modelleren, laten we aannemen dat na het eerste ontstaan van Homo sapiens nog een stap moet worden gezet. Dit kan de oorsprong zijn van taal, schrift, wetenschap, of elke andere relevante factor die de vroege mens in de referentieklasse brengt van degenen die in staat zijn waarnemingen te doen (wij noemen deze stap ‘waarnemerschap’). Stel dat deze stap een willekeurige variabele is, S genaamd, met een cumulatieve verdelingsfunctie FS(t). Aangezien wij natuurlijke risico’s onderzoeken, nemen wij aan dat S en T onafhankelijk zijn. De kans dat de mensheid lang genoeg overleeft om de status van waarnemer te bereiken (via intelligentie, taal, schrift, wetenschap, enz.) kan worden gevonden met de volgende integraal:
waar fT(t) = μe-μt, de kans op uitsterven op tijdstip t. We evalueren een aangepaste waarschijnlijkheidsfunctie ^({\mathcal L} }^{\ast }(\mu |T > t)\), waarmee we aangeven dat we de waarschijnlijkheid nemen van een uitstervingspercentage μ gegeven dat de mensheid tot tijdstip t heeft overleefd, en het feit dat we conditioneren op het bestaan van waarnemers zodanig dat T > S. Dit resulteert in de aangepaste waarschijnlijkheidsfunctie:
waar c = P(T > S) een normaliserende constante is. We evalueren een model met vier variaties voor de waarnemerstap: een model waarin waarnemerschap optreedt als een enkele gebeurtenis met een constante snelheid in de tijd, een model met een toenemende snelheid in de tijd, een model met meerdere stappen, en een model waarin waarnemerschap gewoon een vaste hoeveelheid tijd vergt.
Zo nodig zouden we deze eigenschap van waarnemerschap scherper kunnen definiëren als het vermogen van een soort om betrouwbare gegevens over zijn eigen overlevingsgeschiedenis te verzamelen (b.v. via fossieldatering) en deze te analyseren. Wanneer we corrigeren voor selectie-effecten van waarnemingen, conditioneren we eenvoudigweg op het feit dat onze soort het vermogen heeft ontwikkeld om deze analyse uit te voeren. De eigenschap van waarnemerschap hoeft geen bewustzijn op te roepen of de eigenschap te zijn van een biologische soort – een machine die een parameter schat zou rekening moeten houden met waarnemerselectiebias als haar vermogen om dergelijke schattingen te maken gecorreleerd zou zijn met de parameter in kwestie.
Model 1: Eén stap, constante snelheid
Ons eerste model veronderstelt dat waarnemerschap een constante snelheid van voorkomen θ heeft, zodat S exponentieel verdeeld is met een cumulatieve verdelingsfunctie: FS(t) = 1 – e-θt. Dit model beschrijft een proces waarin de overgang van vroege mensen naar waarnemers door toeval als één enkele stap optreedt. Dit zou de hypothese kunnen vertegenwoordigen dat hiërarchische taal bij de mens is ontstaan als bijproduct van een toevallige mutatie24. Met dit model is de kans dat waarnemers vóór uitsterven aankomen P(T > S) = θ(θ + μ)-1. Onze waarschijnlijkheidsfunctie kan analytisch worden afgeleid:
Model 2: één stap, toenemende snelheid
Ons tweede model gaat er eveneens van uit dat er één stap nodig is, maar dat de snelheid van het waarnemerschap met de tijd toeneemt. Dit model zou een toenemende populatiegrootte of bevolkingsdichtheid kunnen voorstellen, die op hun beurt de culturele evolutie zou kunnen aanjagen en de kans op zo’n stap zou kunnen vergroten25. We stellen dit voor met een Weibull-verdeling met cumulatieve verdelingsfunctie {F}_{S}(t)=1-{e}^{-{(\theta t)}^{k}}) waarbij k > 1 wijst op toenemende snelheid in de tijd (wanneer k = 1, is dit hetzelfde als de exponentiële in model 1). We gebruiken numerieke integratie om de waarschijnlijkheidsfunctie te evalueren.
Model 3: meerdere stappen, constante snelheid
Ons derde model gaat ervan uit dat er meerdere stappen in een reeks moeten plaatsvinden om waarnemers te krijgen. Dit kan een meer incrementele ontwikkeling van gereedschappen, cultuur of taal voorstellen. We nemen aan dat elke stap exponentieel verdeeld is met een snelheid θ, zodat de timing van de laatste k-de stap een Erlang-verdeling volgt met cumulatieve verdelingsfunctie:
Merk op dat wanneer k = 1, de verdeling dezelfde is als de exponentiële in model 1. We gebruiken numerieke integratie om de waarschijnlijkheidsfunctie te evalueren.
Model 4: vaste tijdseis
Ons laatste model gaat ervan uit dat het een vaste hoeveelheid tijd τ duurt om het waarnemerschap te bereiken. Dit is een extreem model dat geen toeval toelaat, maar een geleidelijke en deterministische accumulatie van eigenschappen zou kunnen vertegenwoordigen. De waarschijnlijkheid dat waarnemerschap is bereikt vóór tijd t is daarom FS(t) = 1, de karakteristieke functie die de waarde 1 aanneemt wanneer t > τ en 0 anders. De kans dat de mensheid overleeft voorbij tijdstip τ is 1 – FT(τ) = e-μτ. Onze waarschijnlijkheidsfunctie van μ is:
Deze likelihood expressie kan ook worden afgeleid met behulp van de geheugenloze eigenschap van de exponentiaal. Het is de moeite waard op te merken dat het model met vaste tijd een limiet is voor zowel het model met toenemende snelheid als het model met meerdere stappen. De limiet van model 2 als k → ∞ resulteert in een vastetijdsmodel met τ = θ-1. Op dezelfde manier convergeert model 3 naar een model met een vaste tijd als het aantal stappen toeneemt en de verwachte tijd van elke stap afneemt (met oneindig veel stappen in de limiet, waarvan elke stap oneindig kort is).
Resultaten van steekproefbiasemodellen
We evalueren de waarschijnlijkheid van uitstervingspercentages tussen 10-8 en 10-2, gegeven een menselijke overlevingstijd van 200 kyr en een breed scala van verschillende snelheden waarmee waarnemers zouden kunnen ontstaan (Fig. 2). Het eerste dat moet worden opgemerkt over de eerste drie modellen is dat wanneer de waarnemerschapssnelheden voldoende snel zijn, de waarschijnlijkheidsfunctie convergeert naar de onvertekende versie in de vorige paragraaf. Dit kan worden geverifieerd door limieten te nemen: voor alle modellen geldt dat als θ → ∞ (of τ → 0 in het geval van het vaste-tijdsmodel), θ({ {\mathcal L} } }^{\ast }(\mu |T > t)\tot {e}^{-\mu t}). Als waarnemerschap naar verwachting snel zal optreden, dan kunnen we een overlevingskans van 200 kjr op zich nemen en de uitsterfsnelheid schatten zonder waarnemingsselectiebias.
Als de waarnemerstijd daalt tot het punt waar de verwachte waarnemerstijd een orde van grootte van bijna 200 kyr benadert, ontstaat er echter een vertekening van de waarnemerstijd. Snelheden die eerder werden uitgesloten door ons overlevingsverleden krijgen een hogere waarschijnlijkheid, omdat een deel van het overlevingsverleden een noodzaak is voor waarnemers (Fig. 2). Bijvoorbeeld in Model 1, wanneer θ = 2 × 10-4 (overeenkomend met een verwachte waarnemerstijd van 20 kyr), wordt de relatieve waarschijnlijkheid van μ = 6,9 × 10-5 verhoogd met een factor 2,3 (van 10-6 naar 2,3 × 10-6). Om een waarschijnlijkheid van 10-6 (overeenkomend met de meest conservatieve bovengrens) te krijgen, moet de snelheid op 7,3 × 10-5 worden gesteld (zie alle bewerkte grenzen in tabel 2). Interessant is echter dat dit effect beperkt is. Zelfs als de waarnemingssnelheden vertragen tot het punt waarop de verwachte waarnemerstijd veel langer is dan 200 kyr (bijvoorbeeld meer dan 20 miljard jaar), blijven de herziene bovengrenzen binnen een factor 2 van de oorspronkelijke grenzen. Hoe strenger de grens, hoe zwakker de potentiële vertekening: de 10-6 waarschijnlijkheidsgrens wordt bijvoorbeeld slechts met een factor 1,2 gewijzigd in de limiet als θ → 0. Hoewel er sprake zou zijn van enige vertekening door de steekproef, is er een hard plafond voor de mate waarin onze overlevingsgeschiedenis kan worden vertekend door selectie-effecten bij waarnemingen.
De reden waarom langzame overlevingspercentages een beperkte invloed hebben op onze schattingen, is dat als het uitstervingspercentage uitzonderlijk hoog zou zijn, de gelukkige mensen die er wel in slagen om de status van waarnemer te bereiken, deze status ongewoon snel zullen hebben bereikt, en daarom nog steeds een zeer korte staat van overleving zullen waarnemen. Een lange overlevingskans is daarom nog steeds voldoende om een hoge uitstervingskans in combinatie met een lage waarnemingskans uit te sluiten. Wij kunnen dit aantonen door de typische tijd te onderzoeken die het voor gelukkige overlevenden vergt om waarnemerschap te bereiken, veronderstellend een hoog uitstervingstarief en een laag waarnemerstarief. Bijvoorbeeld, in het eenstapsmodel met constante snelheid wanneer θ = 10-6 (overeenkomend met een verwachte waarnemerstijd van 1 Myr) en μ = 10-3 (overeenkomend met een typische uitsterftijd van 1000 jaar), is de verwachte waarnemerstijd voorwaardelijk voor deze hoge uitsterftempo’s 1000 jaar. Een typische waarnemer zal dus nog steeds een zeer korte overlevingskans hebben. Modellen met stijgende percentages of meerdere stappen vertonen dezelfde eigenschap, hoewel de vertekening groter is afhankelijk van parameter k. Voor zowel model 2 als 3 met θ = 10-6, μ = 10-3, en k = 2 (parameters die normaliter overeenkomen met een verwachte waarnemerstijd van 830 kyr voor model 2 en 2 Myr voor model 3), zullen de hoge extinctiesnelheden er nog steeds toe leiden dat een typische waarnemer ongewoon vroeg tevoorschijn komt en slechts een overlevingskans van ongeveer 2000 jaar heeft. Dit is ook te zien in Fig. 2 waar voor de modellen 1, 2, en 3, de waarschijnlijkheid van hoge uitstervingspercentages boven 10-4 nog steeds een lage waarschijnlijkheid wordt toegekend ongeacht θ.
Echter, ernstige selectiebias van waarnemers kan optreden in modellen 2 en 3 als k groter wordt, waardoor de verdeling van het waarnemerschap zodanig wordt gevormd dat vroeg waarnemerschap zeer onwaarschijnlijk is en laat waarnemerschap bijna gegarandeerd. In het meest extreme geval wordt dit weergegeven door het model met vaste tijd, waarbij de waarschijnlijkheid van waarnemerschap van 0 op 1 springt wanneer t = τ (het model met vaste tijd is ook het limietgeval wanneer k → ∞). Als die vaste tijd lang genoeg is (zeg, langer dan 190 of 195 kyr), is een overlevingskans van 200 kyr niet langer voldoende om uitsterfsnelheden groter dan 10-4 uit te sluiten. Dit resultaat treedt op omdat het model met een vaste tijd elke mogelijkheid van een ongewoon snelle uitsterving uitsluit. Elke afstamming van Homo sapiens die het geluk heeft lang genoeg te overleven om de status van waarnemer te verkrijgen, moet noodzakelijkerwijs een overlevingstijd hebben die groter is dan τ, wat betekent dat het zijn van een waarnemer met een overlevingstijd van τ geen informatie geeft over de uitstervingssnelheid.
Om talrijke redenen vinden wij het vaste-tijdsmodel ongeloofwaardig. Vrijwel alle biologische en culturele processen gaan gepaard met een zekere mate van toevalligheid, en er is geen fundamentele reden om te denken dat het verkrijgen van het vermogen om wetenschappelijke waarnemingen te doen anders zou zijn. Ter illustratie van een vergelijking: laten we een wereld beschouwen waarin de uitsterfsnelheid 10-4 is (gemiddeld één uitsterf per 10.000 jaar), maar de status van waarnemer een vaste 200 kyr duurt. In dit model is de kans dat de mensheid lang genoeg overleeft om de status van waarnemer te bereiken, een gebeurtenis met een kans van 1 op 200 miljoen. Gezien de selectiebias bij waarnemingen, kunnen we niet uitsluiten dat er zeldzame gebeurtenissen zijn die nodig zijn voor onze waarnemingen. Maar we kunnen ons afvragen waarom een gebeurtenis met een kans van 1 op 200 miljoen niet ook de mogelijkheid zou kunnen inhouden dat moderne menselijke waarnemers ongewoon snel zouden opduiken. Het is misschien hoogst onwaarschijnlijk dat taal, schrift en moderne wetenschap zich binnen tienduizend jaar na de eerste moderne mensen zouden ontwikkelen, maar het lijkt uitzonderlijk overmoedig om de kans op minder dan 1 op 200 miljoen te schatten.
Een soortgelijke redenering kan worden toegepast om te bepalen of de stijgende snelheid en meervoudige stappen modellen met hoge k redelijk zijn. We testen dit door ons af te vragen welke parameters nodig zijn om een overlevingskans van 200 kjr te verwachten met een uitsterfsnelheid bij onze conservatieve bovengrens van μ = 6,9 × 10-5. Voor het model met toenemende snelheid wordt waarnemerschap verwacht na 203 kjr met θ = 10-7 en k = 14 en voor het model met meerdere stappen wordt waarnemerschap verwacht na 190 kjr met θ = 10-7 en k = 16. Hoewel deze modellen geen strikte nulwaarschijnlijkheid toekennen aan vroege waarnemerstijden, zijn de waarschijnlijkheden nog steeds vanishingly klein. Met een toenemende snelheid en deze parameters is de kans dat waarnemerschap zich binnen 10.000 jaar voordoet minder dan één op een triljoen (3,4 × 10-14), en ongeveer 1% kans dat het zich binnen 100.000 jaar voordoet. Met meerdere stappen en deze parameters heeft waarnemerschap minder dan een kans van een op een triljoen dat het zich voordoet binnen 10.000 jaar (5,6 × 10-17), en minder dan een kans van 0,02% dat het zich voordoet binnen 100.000 jaar. Net als bij het vaste-tijdsmodel zijn wij van mening dat deze modellen onrealistische betrouwbaarheidsniveaus vertonen voor late waarnemerstijden.
Hoewel de plausibiliteit van de vaste tijd (of bijna vaste tijd) modellen moeilijk rechtstreeks te testen is, biedt de grote variatie in het ontstaan van modern menselijk gedrag in de geografie één bron van gegevens die hun plausibiliteit kan testen. De overgang naar het Boven-Paleolithicum vond ongeveer 45 kya plaats in Europa en West-Azië, en werd gekenmerkt door de wijdverspreide opkomst van modern menselijk gedrag25 (b.v. symbolische kunstwerken, geometrische messen, ornamentiek). Maar er bestaan sterke aanwijzingen voor de sporadische verschijning van dit moderne menselijke gedrag veel eerder in delen van Afrika26,27 , met inbegrip van bewijzen van kunstwerken en geavanceerde werktuigen zo vroeg als 164 kya28. Hoewel tal van factoren een snelle overgang naar het Boven-Paleolithicum in de weg kunnen hebben gestaan, geeft het feit dat sommige menselijke gemeenschappen deze overgang meer dan 100 kjr eerder maakten dan de rest van de mensheid aan dat een veel vroeger ontwikkelingstraject niet geheel uitgesloten is.
Samenvattend is het onwaarschijnlijk dat selectie-effecten van waarnemers een grote vertekening zullen veroorzaken in onze overlevingsgeschiedenis, zolang we rekening houden met de mogelijkheid van vroege waarnemers. Bedrieglijk lange overlevingscijfers kunnen voorkomen als de waarschijnlijkheid van vroege waarnemers uitzonderlijk laag is, maar wij vinden deze modellen onwaarschijnlijk. De grote variatie in modern menselijk gedrag is één van de gegevensbronnen die erop wijzen dat het onwaarschijnlijk is dat onze staat van dienst ernstig vertekend is. We kunnen ons ook wenden tot andere bronnen van indirecte gegevens om te testen of de selectie van waarnemers vertekend is.