Tus datos te conocen mejor que vos mismo
Dataclismo (Dataclysm, 2014) — Christian Rudder, cofundador de OkCupid y matemático de Harvard, revela lo que millones de perfiles online dicen sobre el amor, el racismo, la belleza y la identidad.
Internet como espejo sin filtros
¿Te pasó que decís una cosa y hacés otra? Que en público sos tolerante, abierto, moderno… pero en privado actuás diferente. Pues bien: los datos lo saben. Y Rudder lo muestra con números.
Rudder pasó años analizando los datos de OkCupid y cruzándolos con Facebook, Twitter, Reddit y Google. Lo que encontró no es solo información sobre citas: es un retrato de cómo somos cuando nadie nos está mirando. O cuando creemos que nadie nos mira.
El libro importa hoy más que cuando salió, en 2014. Vivimos en una era donde cada clic, cada búsqueda y cada like es un dato sobre quiénes somos. Dataclismo es el manual para entender qué dice ese rastro sobre nosotros.
📌 Contexto del autor
Christian Rudder es matemático por Harvard y cofundador de OkCupid, una de las plataformas de citas más grandes del mundo. No habla de datos en abstracto: los vivió, los recopiló y los analizó durante más de una década. Eso hace que el libro tenga un peso que los libros de divulgación sobre Big Data suelen carecer.
La ley de Wooderson: lo que los hombres dicen que quieren vs. lo que realmente buscan
Rudder llama «Ley de Wooderson» (por el personaje de Matthew McConaughey en Movida del 76) a un patrón brutal: sin importar la edad del hombre, la mujer que prefiere en sus búsquedas privadas tiene alrededor de 21 años. La preferencia no madura con él.
Las mujeres, en cambio, buscan hombres de su propia edad hasta los 30, y los que tienen 40 alcanzan su pico de atractivo percibido. Los datos dicen cosas distintas según si se pregunta, se observa lo que la gente vota en privado, o lo que realmente hace al enviar mensajes.
Lo que los hombres dicen querer
Mujeres de su misma edad o ligeramente menores. Madurez, compatibilidad, intereses comunes.
Lo que los datos muestran
Hombres de 40, 50 años siguen contactando preferentemente a mujeres de 20-22. La brecha entre discurso y conducta es gigante.
«Cuanto más mayor se hace un hombre, el punto de vista de ellas se adapta a él. Él envejece y las expectativas de sus contrapartes femeninas también maduran, prácticamente año a año.»
— Christian Rudder, Dataclismo
Sobredosis de «ni fu ni fa»: por qué es mejor que la mitad te odie
Rudder descubrió algo contraintuitivo en los datos de OkCupid: las mujeres que más mensajes reciben no son las que generan consenso. Son las que generan opiniones divididas. Aquellas que algunos califican con 5 estrellas y otros con 1 reciben hasta un 70% más de mensajes que las mujeres percibidas como «agradables pero del montón».
Lo llama el «método de John Waters»: dividir la opinión atrae más fanáticos que gustar a todos por igual. En las citas, en el arte, en las redes sociales, el consenso mata el interés.
⚡ Dato provocador
Una mujer con una valoración promedio baja pero muy polarizada recibe los mismos mensajes que una mujer con valoración alta pero sin controversia. El atractivo no es solo cuestión de belleza convencional: es también cuestión de cuántos «fanboys» podés generar.
El sesgo racial que nadie admite pero todos ejercen
Esta es la parte más incómoda del libro. Rudder analiza los datos de contacto entre usuarios de distintas razas en OkCupid, Match.com y DateHookup. El patrón es consistente en los tres sitios, con millones de usuarios: las mujeres negras reciben sistemáticamente valoraciones y mensajes un 25-27% por debajo de las de otras razas, independientemente de quién las evalúa.
La ironía que Rudder señala: el 84% de los usuarios de OkCupid respondió que nunca saldría con alguien que tenga «sesgo racial». Esos mismos usuarios son los que generan los datos de discriminación. Las palabras y los actos no coinciden.
Caso real del libro
La paradoja de los usuarios «progresistas»
Los usuarios de OkCupid son, en promedio, más jóvenes, más urbanos, más educados y más liberales que la población general. Son exactamente el tipo de persona que uno esperaría que fuese menos racista.
Sin embargo, los datos de valoración racial son prácticamente idénticos en OkCupid que en sitios con demografías más conservadoras como Match.com. El sesgo no es ideológico: es automático, inconsciente y universal. «No estoy describiendo ninguna pesadilla de la América profunda rural», escribe Rudder. «Estoy describiendo nuestro mundo, el mío y el tuyo.»
El experimento que demostró que la belleza importa menos de lo que creemos
El 15 de enero de 2013, OkCupid hizo algo radical: quitó todas las fotos de perfil durante siete horas. Llamaron al evento «Día del amor ciego». Lo que pasó fue inesperado.
Sin fotos, las conversaciones fluyeron mejor. Las respuestas aumentaron un 40%. El 24% de las parejas que estaban hablando ya habían intercambiado datos de contacto para cuando volvieron las imágenes. El número proyectado sin el experimento era menos de la mitad.
Pero cuando volvieron las fotos, muchas conversaciones se cortaron abruptamente. La duración media de esos intercambios cayó. El aspecto físico interrumpió conexiones que ya estaban funcionando. El libro cruza esto con datos de citas presenciales (app Crazy Blind Date): cara a cara, el atractivo casi no importaba para la satisfacción con la cita. Online, era determinante. La preselección visual nos hace rechazar gente que en persona nos encantaría.
🧪 Lo que el experimento reveló
En citas presenciales, el 83-85% de los hombres y el 75% de las mujeres quedaban satisfechos, independientemente de la diferencia de atractivo entre ambos. Online, el atractivo físico determinaba casi todo. Rudder concluye: «Las personas eligen a partir de la información que les proporcionamos porque pueden, no necesariamente porque deban.»
Las palabras que revelan quiénes somos
Rudder construyó un algoritmo para analizar 3.200 millones de palabras escritas por usuarios de OkCupid en sus perfiles. La idea era detectar qué palabras son características de cada grupo étnico, género y orientación sexual sin preguntar directamente.
Los resultados son reveladores y a veces sorprendentes. Los hombres blancos se distinguen por mencionar «mis ojos azules», caza y pesca, y bandas como Phish. Los hombres negros: soul, reggae, referencias culturales afroamericanas. Los hombres asiáticos mencionan su país de origen, películas de Hong Kong, el K-pop. Los latinos: su música (cumbia, bachata, merengue) y referencias a sus países.
Lo que revela el análisis es que la identidad cultural se expresa con más claridad en la autopresentación informal que en cualquier encuesta diseñada. Los datos encuentran los clichés que nosotros no nos animaríamos a nombrar.
Ejemplo del libro
El haiku de Carrie Underwood
Rudder lista las cinco frases más típicas de una mujer blanca en OkCupid: «mis ojos azules», «pelirrojo y», «conducir un todoterreno», «chica de campo» y «me encanta el aire libre». Luego escribe: «¿Es un haiku de Carrie Underwood o son datos? ¡Tú eliges!»
El punto detrás del chiste: ningún investigador habría formulado preguntas tan específicas en una encuesta. Pero los datos se formularon solos. Los patrones emergen cuando hay suficiente volumen.
Google sabe lo que nunca le dirías a nadie
Siguiendo el trabajo del investigador Seth Stephens-Davidowitz, Rudder muestra cómo las búsquedas de Google revelan lo que las encuestas no pueden capturar: lo que la gente piensa cuando nadie la juzga.
La palabra racista más buscada en Google aparece 7 millones de veces por año en EEUU. En proporción, es más buscada que «apple pie». Las búsquedas relacionadas no vienen de los estados o regiones que uno esperaría. La geografía del racismo digital no coincide con la del racismo declarado.
Cuando Obama ganó las elecciones en 2008, las búsquedas de ese término aumentaron. Los estados con mayor aumento no eran los del sur profundo. El dato obliga a repensar los prejuicios sobre los prejuicios.
💡 Clave del libro
La deseabilidad social (decir lo que se espera que digas) contamina todas las encuestas. Google, OkCupid en modo privado, y las búsquedas nocturnas son los pocos espacios donde la gente actúa sin ese filtro. Ahí es donde los datos son honestos. Y lo que muestran no siempre es cómodo.
Para quién es Dataclismo
Curiosos del comportamiento humano
Si te interesan la psicología social, los sesgos cognitivos y la brecha entre lo que la gente dice y lo que hace, este libro es oro.
Gente de datos y tecnología
Si trabajás con datos o querés entender qué se puede (y qué no se puede) concluir a partir de ellos, Rudder da lecciones implícitas muy valiosas.
Interesados en raza, género e identidad
Para quienes quieran ver estas discusiones respaldadas con datos reales y no solo con anécdotas o teoría. No es cómodo, pero es sólido.
Preocupados por la privacidad digital
El libro cierra con una reflexión honesta sobre qué revelan nuestros datos y qué significa eso para la privacidad. Esencial para entender el mundo en que vivimos.
🤔 10 preguntas para hacerse después de leer este libro
- ¿Cuánto de mi comportamiento online refleja mis valores reales y cuánto refleja lo que creo que se espera de mí?
- ¿Qué harían mis datos si los pusiera en un libro como este? ¿Me gustaría lo que mostrarían?
- ¿En qué áreas de mi vida creo ser más abierto o tolerante de lo que realmente soy cuando actúo en privado?
- ¿Las plataformas que uso están diseñadas para que tome decisiones informadas o para que tome decisiones rápidas y superficiales?
- Si el atractivo físico importa mucho menos en una cita presencial que online, ¿estoy usando el filtro correcto para elegir personas?
- ¿Qué me dicen mis búsquedas de Google sobre lo que realmente me preocupa o me interesa?
- ¿Cuánto de mi identidad cultural o de grupo se expresa inconscientemente en cómo me presento y qué palabras elijo?
- ¿Qué datos dejo disponibles sin querer, y quién los puede usar y para qué?
- Si pudiera ver los patrones estadísticos de mi red social (mis amigos, mis contactos), ¿qué revelarían sobre la fortaleza de mis relaciones más importantes?
- ¿El hecho de que algo sea común o estadísticamente predominante lo hace normal o deseable? ¿Dónde está la línea entre describir y prescribir?
Los datos no mienten. Pero tampoco cuentan toda la historia.
Rudder tiene el mérito de no usar los datos para sacar conclusiones fáciles. Muestra patrones, señala tendencias y deja que el lector saque sus propias conclusiones. Eso lo distingue de muchos libros de Big Data que prometen revelar «la verdad sobre los humanos» y terminan siendo simplificaciones.
El libro tiene limitaciones: los datos son principalmente de usuarios de habla inglesa en EEUU, con un sesgo demográfico claro (jóvenes urbanos). Y ya tiene diez años, lo que en el mundo digital es mucho. Algunas plataformas mencionadas ya no existen.
Pero las preguntas que plantea siguen siendo urgentes. Seguimos dejando rastros digitales. Seguimos siendo juzgados por ellos. Y seguimos sin entender bien lo que revelan sobre nosotros. Dataclismo es un buen punto de partida para empezar a entenderlo.









