Los datos sobre el tiempo de supervivencia de la humanidad podrían estar sujetos a un sesgo de supervivencia. Si los primeros Homo sapiens necesitan un largo periodo de tiempo para desarrollar la maquinaria intelectual necesaria para realizar observaciones científicas, entonces dichas observaciones no podrían incluir historias evolutivas cortas, independientemente de la tasa de extinción. Por tanto, la cantidad de información que podríamos obtener de un largo historial de supervivencia sería limitada debido a este efecto de selección de la observación. Este historial podría indicar una baja tasa de extinción, o ser el subproducto de ancestros afortunados que sobrevivieron a altas tasas de extinción el tiempo suficiente para engendrar una progenie capaz de realizar observaciones científicas. Por tanto, se podría objetar que los límites de la tasa de extinción que hemos estimado son demasiado bajos12,23. Aquí examinamos y respondemos a esta preocupación.
Modelos para cuantificar el sesgo potencial de la muestra
Para modelar el sesgo de selección de la observación, supongamos que después de que el Homo sapiens surja por primera vez debe alcanzarse otro paso. Esto podría representar el origen del lenguaje, la escritura, la ciencia, o cualquier factor relevante que haría la transición de los primeros humanos a la clase de referencia de aquellos capaces de hacer observaciones (llamamos a este paso «observerhood»). Dejemos que este paso sea una variable aleatoria denominada S, con una función de distribución acumulativa FS(t). Como estamos examinando los riesgos naturales, suponemos que S y T son independientes. La probabilidad de que la humanidad sobreviva lo suficiente como para alcanzar el estatus de observador (a través de la inteligencia, el lenguaje, la escritura, la ciencia, etc.) puede hallarse con la siguiente integral:
donde fT(t) = μe-μt, la probabilidad de extinción en el tiempo t. Evaluamos una función de verosimilitud ajustada \({\mathcal L} }^{\ast }(\mu |T > t)\N-, denotando que estamos tomando la probabilidad de una tasa de extinción μ dado que la humanidad ha sobrevivido hasta el tiempo t, y el hecho de que estamos condicionando la existencia de observadores tales que T > S. Esto resulta en la función de probabilidad ajustada:
donde c = P(T > S) es una constante normalizadora. Evaluamos un modelo con cuatro variaciones para el paso de observación: un modelo en el que la observación se produce como un único evento que tiene una tasa constante a lo largo del tiempo, un modelo con una tasa creciente a lo largo del tiempo, un modelo con múltiples pasos, y un modelo en el que la observación simplemente requiere una cantidad fija de tiempo.
Si se desea, podríamos definir más claramente esta propiedad de observación como la capacidad de una especie para recoger datos fiables sobre su propio historial de supervivencia (por ejemplo, a través de la datación de fósiles) y analizarlo. Al corregir los efectos de selección de la observación, simplemente estamos condicionando el hecho de que nuestra especie haya desarrollado la capacidad de realizar este análisis. La propiedad de ser observador no tiene por qué invocar la conciencia o ser la propiedad de una especie biológica: una máquina que estimara un parámetro tendría que tener en cuenta el sesgo de selección del observador si su capacidad para hacer tales estimaciones estuviera correlacionada con el parámetro en cuestión.
Modelo 1: Paso único, tasa constante
Nuestro primer modelo supone que la condición de observador tiene una tasa de ocurrencia constante θ, de modo que S se distribuye exponencialmente con la función de distribución acumulativa FS(t) = 1 – e-θt. Este modelo describe un proceso en el que la transición de los primeros humanos a observadores se produce por azar como un único paso. Esto podría representar la hipótesis de que el lenguaje jerárquico surgió en los humanos como subproducto de una mutación fortuita24. Con este modelo, la probabilidad de que los observadores lleguen antes de la extinción es P(T > S) = θ(θ + μ)-1. Nuestra función de probabilidad puede derivarse analíticamente:
Modelo 2: un solo paso, tasa creciente
Nuestro segundo modelo asume de forma similar que se necesita un solo paso pero que la tasa de observancia aumenta con el tiempo. Este modelo podría representar el aumento del tamaño de la población o de la densidad de población, lo que a su vez podría impulsar la evolución cultural y aumentar la probabilidad de dicho paso25. Lo representamos con una distribución de Weibull con función de distribución acumulativa \({F}_{S}(t)=1-{e}^{-{(\theta t)}^{k}}) donde k > 1 indica una tasa creciente con el tiempo (cuando k = 1, es lo mismo que la exponencial en el modelo 1). Utilizamos la integración numérica para evaluar la función de probabilidad.
Modelo 3: pasos múltiples, tasa constante
Nuestro tercer modelo supone que hay múltiples pasos que deben ocurrir en una secuencia para obtener observadores. Esto podría representar un desarrollo más incremental de las herramientas, la cultura o el lenguaje. ¡Suponemos que cada paso se distribuye exponencialmente con una tasa θ, de modo que el tiempo del kº paso final sigue una distribución Erlang con función de distribución acumulativa:
Nótese que cuando k = 1, la distribución es la misma que la exponencial del modelo 1. Utilizamos la integración numérica para evaluar la función de verosimilitud.
Modelo 4: requisito de tiempo fijo
Nuestro modelo final supone que se necesita una cantidad de tiempo fija τ para alcanzar la condición de observador. Este es un modelo extremo que no permite el azar, pero podría representar una acumulación gradual y determinista de rasgos. La probabilidad de que se haya alcanzado la condición de observador antes del tiempo t es, por tanto, FS(t) = 1, la función característica que toma el valor 1 cuando t > τ y 0 en caso contrario. La probabilidad de que la humanidad sobreviva más allá del tiempo τ es 1 – FT(τ) = e-μτ. Nuestra función de probabilidad de μ es:
Esta expresión de verosimilitud también puede derivarse utilizando la propiedad sin memoria de la exponencial. Cabe destacar que el modelo de tiempo fijo es un caso límite tanto para el modelo de tasa creciente como para el modelo de pasos múltiples. Tomando el límite del modelo 2 como k → ∞ se obtiene un modelo de tiempo fijo con τ = θ-1. De forma similar, el Modelo 3 converge a un modelo de tiempo fijo a medida que el número de pasos aumenta y el tiempo esperado de cada paso disminuye (teniendo infinitamente muchos pasos en el límite, cada uno de los cuales es infinitamente corto).
Resultados de los modelos de sesgo muestral
Evaluamos la probabilidad de tasas de extinción entre 10-8 y 10-2, dado un tiempo de supervivencia humana de 200 kyr y un amplio rango de diferentes tasas en las que podrían originarse los observadores (Fig. 2). Lo primero que hay que destacar de los tres primeros modelos es que, cuando las tasas de observadores son lo suficientemente rápidas, la función de probabilidad converge a la versión insesgada de la sección anterior. Esto se puede comprobar tomando límites: para todos los modelos a medida que θ → ∞ (o τ → 0 en el caso del modelo de tiempo fijo), \({\mathcal L} }^{\\ast}(\mu |T > t)\a {e}^{-\mu t}\). Si se espera que la condición de observador ocurra rápidamente, entonces podemos tomar un registro de supervivencia de 200 kyr en su valor nominal y estimar la tasa de extinción sin sesgo de selección de observación.
Sin embargo, a medida que las tasas de observación disminuyen hasta el punto en que el tiempo de observación esperado se acerca a un orden de magnitud cercano a 200 kyr, surge el sesgo de selección de observadores. A las tasas que antes eran descartadas por nuestro historial de supervivencia se les asignan mayores probabilidades, ya que una parte del historial es una necesidad para los observadores (Fig. 2). Por ejemplo, en el modelo 1, cuando θ = 2 × 10-4 (correspondiente a un tiempo de observación esperado de 20 kyr), la probabilidad relativa de μ = 6,9 × 10-5 se incrementa en un factor de 2,3 (de 10-6 a 2,3 × 10-6). Para obtener una probabilidad de 10-6 (correspondiente al límite superior más conservador), la tasa debe fijarse en 7,3 × 10-5 (véanse todos los límites editados en la Tabla 2). Sin embargo, es interesante observar que este efecto es limitado. Incluso cuando las tasas de observación se ralentizan hasta el punto de que el tiempo de observación esperado supera ampliamente los 200 kyr (por ejemplo, superando los 20.000 millones de años), los límites superiores revisados se mantienen dentro de un factor de 2 de los límites originales. Cuanto más estricto es el límite, más débil es el sesgo potencial: por ejemplo, el límite de probabilidad de 10-6 sólo cambia en un factor de aproximadamente 1,2 en el límite a medida que θ → 0. Aunque habría un cierto sesgo de la muestra, hay un límite duro sobre cuánto puede distorsionarse nuestro historial de supervivencia por efectos de selección de la observación.
La razón por la que las tasas lentas de observación tienen un impacto limitado en nuestras estimaciones es porque si la tasa de extinción fuera excepcionalmente alta, los humanos afortunados que sobreviven con éxito a la condición de observador habrán alcanzado tal estatus inusualmente rápido y, por tanto, seguirán observando un historial de supervivencia muy corto. Por lo tanto, un largo historial de supervivencia sigue siendo suficiente para descartar las altas tasas de extinción combinadas con bajas tasas de observación. Podemos demostrarlo examinando el tiempo típico que tardan los supervivientes afortunados en alcanzar la condición de observador, suponiendo una tasa de extinción alta y una tasa de observación baja. Por ejemplo, en el modelo de tasa constante de un solo paso, cuando θ = 10-6 (correspondiente a un tiempo de observación esperado de 1 Myr) y μ = 10-3 (correspondiente a un tiempo de extinción típico de 1000 años), el tiempo de observación esperado condicionado a estas altas tasas de extinción es de 1000 años. Por tanto, un observador típico seguirá teniendo un historial de supervivencia muy corto. Los modelos con tasas crecientes o escalones múltiples presentan la misma propiedad, aunque el sesgo es mayor dependiendo del parámetro k. Tanto para el modelo 2 como para el 3, con θ = 10-6, μ = 10-3 y k = 2 (parámetros que normalmente corresponden a un tiempo de observación esperado de 830 kyr para el modelo 2 y de 2 Myr para el modelo 3), las altas tasas de extinción seguirán dando lugar a que un observador típico emerja de forma inusualmente temprana y tenga sólo un historial de supervivencia de unos 2000 años. Esto también puede verse en la Fig. 2, donde para los modelos 1, 2 y 3, la probabilidad de altas tasas de extinción que exceden de 10-4 todavía se asignan con baja probabilidad, independientemente de θ.
Sin embargo, en los modelos 2 y 3 puede ocurrir un sesgo severo de selección de observadores a medida que k se hace más grande, dando forma a la distribución de la condición de observador de tal manera que la condición de observador temprano es muy poco probable y la condición de observador tardío está casi garantizada. En el caso más extremo, esto está representado por el modelo de tiempo fijo, en el que la probabilidad de ser observador salta de 0 a 1 cuando t = τ (el modelo de tiempo fijo es también el caso límite cuando k → ∞). Si esa cantidad de tiempo fijo es lo suficientemente larga (digamos que supera los 190 o 195 kyr), un historial de supervivencia de 200 kyr ya no es suficiente para descartar tasas de extinción superiores a 10-4. Este resultado se produce porque el modelo de tiempo fijo prohíbe cualquier posibilidad de que la observancia se produzca con una rapidez inusitada. Cualquier linaje de Homo sapiens lo suficientemente afortunado como para sobrevivir lo suficiente como para obtener el estatus de observador debe tener necesariamente un tiempo de supervivencia mayor que τ, lo que significa que ser un observador con un tiempo de supervivencia de τ transmite cero información sobre la tasa de extinción.
Por numerosas razones, encontramos que el modelo de tiempo fijo es inverosímil. Prácticamente todos los procesos biológicos y culturales implican algún grado de contingencia, y no hay ninguna razón fundamental para pensar que la obtención de la capacidad de hacer observaciones científicas sería diferente. Para ilustrar una comparación, consideremos un mundo en el que la tasa de extinción es de 10-4 (con una media de una extinción cada 10.000 años), pero la condición de observador tarda unos 200 kyr fijos. Según este modelo, que la humanidad sobreviva lo suficiente como para alcanzar el estatus de observador es un acontecimiento con una probabilidad de 1 entre 200 millones. Dado el sesgo de selección de la observación, no podemos descartar la posibilidad de que se produzcan eventos raros que sean necesarios para nuestras observaciones. Pero podríamos preguntarnos por qué un evento con una probabilidad de 1 entre 200 millones no podría incluir también la posibilidad de que los observadores humanos modernos surgieran inusualmente rápido. El lenguaje, la escritura y la ciencia moderna son quizás muy poco probables de desarrollar en un plazo de diez mil años desde los primeros humanos modernos, pero parece excepcionalmente excesivo poner las probabilidades en menos de 1 entre 200 millones.
Una línea de razonamiento similar puede aplicarse para determinar si los modelos de tasa creciente y de pasos múltiples con k alto son razonables. Probamos esto preguntando qué parámetros serían necesarios para esperar un historial de supervivencia de 200 kyr con una tasa de extinción en nuestro límite superior conservador de μ = 6,9 × 10-5. Para el modelo de tasa creciente, se espera que haya observadores después de 203 kyr con θ = 10-7 y k = 14 y para el modelo de pasos múltiples, se espera que haya observadores después de 190 kyr con θ = 10-7 y k = 16. Aunque estos modelos no asignan una probabilidad estrictamente nula a los primeros tiempos de observación, las probabilidades siguen siendo muy pequeñas. Con una tasa creciente y estos parámetros, la condición de observador tiene menos de una probabilidad entre un trillón de ocurrir dentro de 10.000 años (3,4 × 10-14), y alrededor del 1% de ocurrir dentro de 100.000 años. Con múltiples pasos y estos parámetros, la condición de observador tiene menos de una probabilidad entre un trillón de ocurrir dentro de 10.000 años (5,6 × 10-17), y menos de un 0,02% de ocurrir dentro de 100.000 años. De forma similar al modelo de tiempo fijo, creemos que estos modelos muestran niveles de confianza poco realistas en los tiempos de observación tardía.
Aunque la plausibilidad de los modelos de tiempo fijo (o casi fijo) es difícil de probar directamente, la amplia variación en la aparición del comportamiento humano moderno a través de la geografía ofrece una fuente de datos que puede probar su plausibilidad. La transición del Paleolítico Superior se produjo alrededor de 45 kya en Europa y Asia occidental, y estuvo marcada por la aparición generalizada de comportamientos humanos modernos25 (por ejemplo, obras de arte simbólico, hojas geométricas, ornamentación). Sin embargo, existen pruebas sólidas de la aparición esporádica de este comportamiento humano moderno mucho antes en algunas partes de África26,27, incluyendo pruebas de obras de arte y herramientas avanzadas ya en 164 kya28. Aunque numerosos factores podrían haber impedido que la transición del Paleolítico Superior se produjera rápidamente, el hecho de que algunas comunidades humanas hicieran esta transición más de 100 kyr antes que el resto de la humanidad indica que una trayectoria de desarrollo mucho más temprana no es del todo descartable.
En resumen, es poco probable que los efectos de selección del observador introduzcan un sesgo importante en nuestro historial de supervivencia siempre que permitamos la posibilidad de observadores tempranos. Pueden producirse historiales de supervivencia engañosamente largos si la probabilidad de observadores tempranos es excepcionalmente baja, pero estos modelos nos parecen inverosímiles. La amplia variación del comportamiento humano moderno es una fuente de datos que sugiere que es poco probable que nuestro historial esté gravemente sesgado. También podemos recurrir a otras fuentes de datos indirectos para comprobar el sesgo de selección de los observadores.