En la serie de tv Elementary, Sherlock Holmes dice: individualmente, es casi imposible saber lo que harán las personas; colectivamente, es asombrosamente sencillo prever lo que hará un grupo numeroso. Juan Pérez, que vive en Ecatepec, toma todos los días el metro Indios Verdes al trabajo; es imposible saber si tomará el metro de las 06:30 o el de las 06:37, pero en cambio, podemos decir con absoluta certeza que esos dos metros vendrán llenos a toda su capacidad. Si renuncio al orgullo de predecir los movimientos de Juan Pérez, me queda el valiosísimo dato del número de personas que van a tomar ese metro, todos los días de lunes a viernes.

Lo que hay detrás de aquella sencilla predicción son estadísticas: el metro lleva 20 años moviendo N millones de personas de lunes a viernes, por lo tanto es prácticamente una certeza de que el siguiente lunes hábil moverá esa misma cantidad. Nadie se ofende por este uso de las estadísticas: al contrario, las exigimos. Mi argumento es que exactamente la misma técnica matemática puede utilizarse para estudiar asuntos de bienestar común, como el metro, como para favorecer las conveniencias de empresas y de grupos políticos. Tampoco eso es cuestionable por sí, la empresa o partido político que no toma en cuenta las preferencias del público está condenada al fracaso. Mi objeción va por otro lado, y responde a esta pregunta: ¿de dónde obtienen información empresas y grupos políticos?

Lo pueden hacer al viejo estilo de observación directa y encuestas, pero una y otra presentan problemas logísticos y de costos demasiado grandes para aplicarse, por ejemplo, al lanzamiento de un producto masivo nuevo o a una campaña política. O lo pueden hacer al estilo contemporáneo, preguntando a los grandes agregadores de datos personales: fb, twitter, google, yahoo, Instagram, whatsapp, etc. En estos sitios se guarda una buena parte de la historia de cada persona: edad, sexo, estudios, estado civil, escolaridad, gustos, preferencias sexuales, hábitos de consumo, opiniones sobre gran cantidad de temas, correspondencia, declaraciones y pleitos de amor, si le van al PRI, al PAN, o a Morena; todo el problema es a) saber dónde está esa información, b) saber cómo obtener esa información, c) saber interrogar a esas bases de datos.

En la película Fuego contra fuego, Robert de Niro planea su próximo gran golpe hablando con un contacto, Tom Noonan, quien le informa de que en cierto lugar habrá 12 millones de dólares disponibles. “¿De dónde obtuviste esa información?”, pregunta de Niro.  “Me llegó del aire. La información está ahí flotando, nada más tienes que saber tomarla”, le responde Noonan. La película es de 1995, y muestra ahí una maravillosa anticipación de lo que ahora es evidente para todos: la información está ahí flotando, nada más tienes que saber tomarla.

Una de las grandes virtudes de los sitios mencionados es que son gratis, cualquiera se registra y tiene un lugarcito guardado en la nube, que se seguro porque no se pierde la información y que es inseguro porque ahí está la información. También decía Sherlock Holmes, refiriéndose a candados: “lo que un hombre inventó para cerrarse, otro podrá abrirlo”, y es exactamente lo que está sucediendo ahora. Cambridge Analytica es una empresa nominalmente británica y realmente apátrida, como corresponde a toda organización de altos vuelos: ¿dónde hay negocios?, ¿dónde se pagan menos impuestos?, son las preguntas fundamentales para determinar su nacionalidad. CA hace tratos con Facebook, con Google y con Twitter, otros miembros del mismo clan, y obtiene acceso a sus bases de datos para analizar y tratar de influir en las elecciones presidenciales de EEUU. Posiblemente no obtuvieron nombre y apellido de los usuarios de Facebook y Twitter (el buscador Google nada más tiene la dirección IP), pero consiguieron lo demás, de unos 50 millones de usuarios de fb. Con esta información, recurrieron a los servicios israelíes de intelligence gathering, que aproximadamente significa: 1) saber agrupar los datos de millones de usuarios, 2) saber hacer las preguntas pertinentes, 3) poder estimar preferencias y tendencias sobre los temas de interés. Una red de computadoras de escritorio puede manejar esos 50 millones de usuarios, todo el problema es disponer de la información y saber interrogarla.

Uno podría preguntarse cómo es posible que la inocente información que uno guarda en fb puede proporcionar esos resultados, y recomiendo el artículo de El País en donde un excolaborador de CA explica lo que hacen ahí. El secreto, cómo decía arriba, es saber preguntar y saber inferir. Imagínese usted que tiene una enorme base de datos, los mexicanos suscritos a fb, con todas sus acciones en el sitio relacionadas con las elecciones: si le dieron “like” a tal candidato, si leyeron artículos que atacan o favorecen a alguien, si escribieron que Anaya es hipócrita o que AMLO no tienen ningún plan de gobierno, si echaron pestes del PRI, si le hicieron “link” a Proceso o a El Economista. Hablemos de una revista R que apoya al candidato X. Es cierto que la lectura de un artículo en R no es un indicador definitivo de que Juan Pérez va a votar por X, pero como decía al principio: individualmente la conducta humana es impredecible, colectivamente es predictible. Si 50 millones de mexicanos hacen link a partir de fb a un artículo de R en donde se elogia a X, ese sería un fuerte indicativo de que existe la tendencia a considerarlo como candidato, y de esos 50 millones, yo me quedaría con 25 millones seguros, atreviéndome a decir: los datos muestran una gran tendencia en favor de X candidato[1].

Facebook, Google y Twitter son gratis, sí, pero tú te has convertido en su mercancía. Si creíamos que todos esos negocios viven de la publicidad exclusivamente, hemos estado equivocados. Ellos pueden utilizar nuestros datos como se les ocurra –no sé si es legal, pero técnicamente es posible-, en particular para venderlos a CA, para que ésta sea contratada por los grupos que apoyaron a Trump (allegedly), o por los rusos (allegedly) para favorecer a Trump haciendo el mejor uso posible de esa información. El refrán español dice en el amor y en la guerra todo se vale; la versión moderna, puesto que las guerras abiertas como la de 1939 son más escasas, debería ser en el amor y en la política todo se vale.

El manejo inteligente de información es mil veces más importante cuando las campañas políticas son reñidas, como la presidencial de EEUU y México. En los buenos tiempos del PRI o del Partido Comunista de la URSS, CA hubiera quebrado, pero ahora que las luchas son cerradas y que la decisión la toman los indecisos, es importante saber cómo influir en ellos. El caso de la revista abiertamente favorable a un candidato es apenas un primer paso. OK, ya tenemos 25 millones de voto duro, ¿cómo convencemos al resto? Otra maravilla del intelligence gathering es que en una campaña política hay tiempo de aprender: si quiero convencer al resto de los votantes, contrato a tres escritores, a tres merolicos y a tres payasos para que hagan propaganda a mi candidato, todos con su respectiva página en fb. Después de que hicieron su trabajo, analizo la respuesta del público: de los tres escritores, apenas se pararon las moscas con dos, el otro mereció muchos likes; a los tres merolicos nadie les hizo caso; dos payasos tuvieron mucho éxito, al otro le llovieron críticas. Conclusión, mi siguiente paso es contratar al escritor que recibió likes y a los payasos de éxito. Dadas mis recién adquiridas habilidades de intelligence gathering, todo el problema radica en convencer a Facebook que cuando aceptaste suscribirte, te convertiste en mercancía.

[1] También puede consultar http://www.pnas.org/content/110/15/5802, que analiza cómo puede predecirse la conducta humana a partir de información en fb.

[comment]