la chica bajo la curva (dating pool)

Hace poco más de un año, como muchos de ustedes seguramente, leí esta simpática tira de XKCD. En ese momento empecé a buscar datos sobre la población para ver que tan real era ello. La pseudo-investigación se fue de cause y terminé en cualquier parte hasta que lentamente perdí el rumbo sin la más mínima intención de retomarlo.

Un par de semanas atrás, y por razones que no viene al caso, volví al tema desde cero. En este caso llegué a cosas medianamente concretas (dentro del delirio, claro). Así que aquí están algunos de los resultados que me gustaría compartir con ustedes.

Introducción:

Para aquellos que no tienen idea de los que estoy hablando, una breve introducción. En la famosa tira cómica se plantea una sencilla hipótesis que puede resumirse en la siguiente pregunta: "¿a partir de qué edad tus posibilidades de tener pareja empiezan a bajar?"

Para esto tengamos en cuenta dos elementos:

  • A mayor edad, menores las posibilidades de soltería. Es decir, si una persona tiene 20 años es más probable de que esté soltera a que ocurra lo mismo con alguien de 40 años.
  • A mayor edad, mayor es el rango de edad de los candidatos. Para poner un ejemplo, no es lo mismo que una persona de 40 salga con otra de 55 que un joven de 18 salga con alguien de 33. Es claro no hay edades para el amor, pero estamos hablando de posibles candidatos. Incluso hablamos de las posibilidades de tener cosas en común, de fijarse en el otro. Randall Munroe, el autor de la tira, propone una fórmula a la que llama "standard creepiness rule" (algo así como "regla estándar de viejo-verdez", asquerosidad, o algo del estilo). Según él (y muchos parecen coincidir), las personas no salen con alguien que tenga la mitad de su edad más siete. Por ejemplo, en mi caso y con 27 años, mi cota inferior está dada por (27/2)+7=20.5, lo que parece bastante razonable o, al menos, políticamente correcto. Esta misma fórmula también sirve como cota superior, ya que uno es el límite inferior de alguien mayor. Para mi edad corresponde a 40 años porque 40=(27-7)*2. Nótese que para una persona de 20 años sus candidatos van entre 17 y 26, mientras que para alguien de 30 sus opciones van entre 22 y 46. Se supone que hay más personas entre el segundo rango que el primero, al menos hasta que la taza de mortalidad empieza a hacer de las suyas.

Primera aproximación:

Lo interesante de esta situación es la posibilidad de analizarla con datos reales. Son datos que existen, que se preguntan en los censos, pero que no siempre están disponibles para cualquier mortal. Por suerte el INDEC (Instituto Nacional de Estadística y Censos) provee la información de una forma que, aunque críptica para el recién llegado, resulta interesante cuando uno le encuentra la vuelta. Así que fue allí a donde fui, a buscar el universo de la población argentina.

Tomando toda la población mayor a 14 años, por edades simples y situación conyugal, calculé la cantidad de personas candidatas para cada edad, tiendo en cuenta los rangos de edades de esos posibles candidatos. Consideremos candidatos a las personas no casadas (solteros, divorciados, separados legales y viudos). Aquí el gráfico:

Nótese la forma de W-invertida de la gráfica. El máximo absoluto se encuentra a los 27 años. Es decir, en este momento me encuentro en el cenit de la soltería. Es interesante observar, que después del punto de inflexión de los 41, a los 47 vuelve a haber un máximo. Llamemos a este punto El club de la divorciadas ;). Las estadísticas demuestran que la frase "la vida da revancha" tiene fundamento estadístico.

Pero los valor absolutos siempre me parecieron lejanos. Soy de los que disfruta hablar en términos de porcentaje, de probabilidades, es decir, en términos relativos. Así fue como generé este segundo gráfico, con la intención de responder a la pregunta "Si conozco a 100 personas dentro de mi rango de edad, ¿cuántas estarán no-casadas?":

Así, la cantidad de personas sin compromisos maritales dentro de un rango, sobre la cantidad total de personas de ese rango da un porcentaje de disponibilidad para cada edad. Acá la cosa se pone algo más pesimista, asegurando una clara caída hasta los 44 años, edad desde la cual se inicia un tímido y poco constante ascenso.

Segunda aproximación:

Esta visión es más egocentrista y está pensada en términos totalmente propios. En lo personal, estoy interesado por personas de género femenino, que no solo no estén casadas, sino que además no convivan en pareja (las considero personas en relaciones lo suficientemente fuertes como para quitarlas del conjunto de candidatas). A estas limitaciones le sumaré la restricción geográfica de que tenga residencia dentro de mi ciudad natal y alrededores, por lo que solo tendré en cuenta personas dentro de Buenos Aires y conurbano bonaerence. La ubicación geográfica puede acarrear cambios culturales que tengan efectos en la situación conyugal de las personas, por lo que considero importante tenerlo en cuenta.

Felizmente INDEC tiene una forma rápida de filtrar por estas restricciones, así que seleccioné las regiones geográficas y construí un filtro donde solo se refiera a personas de sexo femenino que no estén conviviendo con una pareja.

Nuevamente, las mismas gráficas:


Esta vez la W-invertida refleja un máximo absoluto muy diferente al inicial, 53 años. Tal vez se parezca más al modelo que, creo que intuitivamente, proponía Munroe. En el gráfico de porcentajes, la caída es mucho más brusca y profunda, perdiendo más de una decena de puntos en su mínimo, que además se da bastante antes, a los 38 años. La pendiente de ascenso es empinada y termina por provocar mayores valores hacia el final de la esperanza de vida que la aproximación anterior.

Suposiciones y limitaciones:

Estos análisis son un emporio de suposiciones y limitaciones. Después de todo, dicen que la estadística es la ciencia del prejuicio. Acá una lista de suposiciones que pueden ser ampliamente discutibles:

  • Los homosexuales y religiosos existen en cantidades despreciables. Así que todo hombre soltero busca una mujer y viceversa.
  • Las personas con alguna relación de pareja no convivientes son consideradas disponibles. El INDEC no pregunta acerca de estado amoroso de las personas.
  • La cantidad de personas con n y medio edad es la mitad de la cantidad de personas con n edad.
  • La fórmula "standard creepiness rule" es válida. Aunque posiblemente pueda repetirse la experiencia con fómulas que mejor se ajusten a cada cultura. En lo personal, creo tener poco en común con alguien de 40 años. De hecho, formulas independientes para el hombre y la mujer creo que serían más aplicables. Tal vez los hombres tiene un target más orientado a la izquierda del eje. Pero es medio que gusto de cada uno.
  • La información del censo corresponde a datos de 2001. Extrapolarlos no tiene sentido, ya que insertaría muchísimo error. Lo dicho, lo interesante son los números en proporciones.
  • La definición de "candidato" esta dada por edad, género, posición geográfica y estado conyugal. No se contempló gustos y esas cosas de esas que hace que las parejas funcionen... o eso dicen :P.

Todo lo necesario para repetir la experiencia se encuentra acá. Enjoy it ... que yo voy a estar buscando a esa chica bajo la curva :)

9 thoughts on “la chica bajo la curva (dating pool)”

  1. la chica bajo la curva??
    o la chica con curvas??
    o la chica bajo tu curva?, mmmmm......
    jaja lu, muy bueno tu análisis, pero yo no encajo en ninguna estadística ;-)
    ya lo hablamos en la fiesta de la eko donde estuviste haciendo "reportaje" para tu trabajo ;-)
    esa curva puede ser que esté bien, yo estaría entre las divorciadas, oka, varias veces divorciada sin casarme...
    pero no estoy buscando pareja
    tampoco macheo con el rango de personas con las que salgo/saldría, es mayor a la mitad mas 7....
    y mis amigos/as también están en ese rango....
    y son muchos, o sea que todos no estarán equivocados, soy yo la que está fuera de lugar??
    me encanta estarlo....
    ;-)
    coincido en que tampoc tengo que ver en muchas cosas con gente de más de 40, la generalidad....
    y la frase que te dije el otro día
    yo soy más joven, tengo más años de joven que vos!!!
    viví más años de joven, no?
    besos, alexa

  2. En lo personal me gusta verlo como una búsqueda de compañía, no de pareja en formato marido/mujer ni mucho menos. Las personas que disfrutan de su soledad al punto de no buscar esta compañía también podemos sumarla al conjunto de personas en cantidades despreciables :) (habría que agregar más preguntas para el próximo censo :P)

    Con respecto a la fórmula, ¿cuál crees que te calce mejor? Yo estoy pensando en agregarle un factor de corrección a mi cota superior de (0.1*x). Así, la mayor edad de alguien con quien salir sería:
    2*(x-7)-(0.1*x)

    ¿Opiniones? Vamos.. tengamos en cuenta que es simplemente una racionalización excesiva de algo puramente sentimental, y no debe ser un limitante para la vida real... está dicho "no hay edad para el amor" (o para la compañía, si se quiere).

  3. Que seas un debian developer, o
    que seas un criptomaniaco que descubre el bug mas loco jamas visto, o
    cualquier otra cosa porque no se mas :P ,

    nada te hace mas geek que esto!

  4. Lo que mas me hace dudar de la validez de los resultados es que en “Si conozco a 100 personas dentro de mi rango de edad, ¿cuántas estarán no-casadas?” los porcentajes son demasiado "buenos" sobre todo ese 40% entre los 40 a 70 años.

    Estoy totalmente de acuerdo cuando dices que la SCR es útil pero daría mejores resultados si se le ajusta según preferencia culturales, Incluso la SCR es tan útil que de cierta forma explica por que la gente se ruboriza cuando les cuento que excedo mi cuota inferior por 0.5

    Es una lastima que no halla disponibilidad de información sobre noviazgos, pues esto es actualmente mas de mi interés, que el matrimonio :(

    Por cierto buena entrada :)

  5. jajaja, está bien lo de la corrección
    para vos está bien esa ecuación
    pero si es la misma variable, casi no hay cambios para edades grandes.....
    me sumo, con x1 y x2 mejor, y x2 tendiendo a 200
    sino mi cota superior me queda como de 70!!!
    y sino coincido con los de 40 y pico, coincidiré con uno de 70???
    ;-)
    buenisimo el post..y el análisis.....
    pero somos humanos y no hay reglas que nos rijan, todos somos excepciones, al menos los que leemos estos blogs y los seguimos.....
    somos gente rara??
    para los demás, no para nosotros......
    somos una tribu?

  6. Luciano:

    Yo llevo años buscando esa chica bajo la curva. Acabé con lo más parecido - una que acepta mi estado geek sin pretensas de cambiarme, pero que lamentablemente no comparte ese estado tan maravilloso (y mira que desvelarse buscando la desviación estándar de una gráfica tiene sus encantos, particularmente cuando buscas distraerte de tu tarea ;)).

    Lamentablemente ya no pude saludarte en México, pero estuve en tu conferencia en la Universidad y quería decirte que me pareció buena tu plática. Buena no solo en el sentido tradicional, sino también en el sentido de que es importante concientizar acerca de este tipo de temas a la comunidad en general - a fin de cuentas, no todos tienen la predisposición de atender a listas de correo de ssh/debian/etc... :D

    Saludos, y espero verte en alguna otra vuelta que te des por acá.

Comments are closed.