Big Data, redes sociales y espionaje: el riesgo de caer en la dictadura de la información

Martin Hilbert, experto alemán en redes digitales, analizó en una entrevista los riesgos que atraviesan las sociedades actuales ante la explosión de los datos. Cuánto saben las empresas de nosotros, qué hacen con nuestros datos y qué tiene que ver el triunfo de Donald Trump con Facebook son algunos de los temas que aborda.

Big Data, redes sociales y espionaje: el riesgo de caer en la dictadura de la información

Según Martin Hilbert, con 250 me gusta que demos en Facebook, los algoritmos comprenderán nuestra personalidad mejor que nosotros mismos.

Tecnología

Unidiversidad

Unidiversidad

Publicado el 03 DE FEBRERO DE 2017

Martin Hilbert (39), es un alemán doctorado en Ciencias Sociales y PhD en Comunicación. Trabajó en Chile como miembro de la Cepal durante varios años y actualmente se encuentra en la Universidad de California. Su nombre saltó a la “fama” en el mundo de la ciencia porque logró calcular la cantidad de información que hay en el mundo.

En una entrevista concedida al portal chileno The Clinic online, Hilbert desarrolla un abanico de descripciones sobre el “Big Data” y su impacto en el mundo actual, el espionaje, la utilización de la inteligencia artificial para la toma de decisiones y el marketing político. Pero también aborda una de sus máximas preocupaciones: la transformación de la democracia en una dictadura de la información al hacer del ciudadano una burbuja distinta.

¿Cuánta información hay en el mundo?
La última vez que actualicé este estudio, hace dos años, había 5 zetabytes. Un ZB es un 1 con 21 ceros (1 000 000 000 000 000 000 000), lo cual no te dirá mucho. Pero si tú pones esta información en libros, convirtiendo las imágenes y todo eso a su equivalente en letras, podrías hacer 4500 pilas de libros que lleguen hasta el sol. O sea, hay mucha información.

¿Y a qué ritmo está creciendo?
A un ritmo exponencial. Se duplica cada dos años y medio. Entonces, ahora probablemente son 10 ZB.

O sea, 8000 pilas de libros que llegan al sol.
Ocho mil o 9000 pilas, sí. Piensa en esto: desde 2014 hasta hoy creamos tanta información como desde la prehistoria hasta 2014. Y lo más impresionante, para mí, es que la información digital va a superar en cantidad a toda la información biológica que existe en el planeta. La vida es procesamiento de información, ¿no? Toma del ambiente moléculas normalmente muertas, toma fotones del sol y los convierte en estructuras complejas de información con un código base que es el ADN. Y ya existe más información digital que código genético humano. Aun contando cada copia de ADN en las trillones de células de cada persona en el mundo, en la humanidad hay como 1 ZB de información. Y durante este siglo, la información digital va a superar a toda la información genética que existe en la biósfera. Todo lo cual lleva a muchas preguntas sobre el futuro de la humanidad, ¿no?

Parece que la pregunta existencial más importante va a ser cómo interpretamos tantos datos.
Y la respuesta es que la única manera de interpretarlos es con máquinas también. Este procesador (apunta a su cerebro) no aguanta eso, sabe hacer otras cosas. Ahora, lo bueno es que la información crece muy rápido, pero nuestro poder de computación crece tres veces más rápido. Se duplica en menos de un año. Porque la tecnología siempre es mejor pero también porque tenemos muchas más máquinas, ¿no? Tú mismo tienes ahora un celular, un computador, etcétera, que interpretan muchos datos por ti. Y ahí viene toda la cuestión de la inteligencia artificial [en adelante, IA] y el deep learning, que ahora es lo más importante.

¿Qué es el deep learning?
Es la manera como se hace la IA hoy en día. Son redes neuronales que funcionan de manera muy similar al cerebro, con muchas jerarquías. Todo esto que hacen Apple y Google y todas las Siri en el teléfono, todo usa deep learning. Es una IA superpoderosa que descubrimos hace cinco años y ya todo el mundo la usa, porque es muy superior a todo lo que habíamos encontrado.

Y la otra pregunta existencial: ¿qué tan espiados estamos?
Nooo, ¡superespiados! Todo está espiado. Y es muy interesante, porque después de Edward Snowden la gente dijo: “¡Qué es esto, pueden ver mis fotos desnudo! Ya, bueno, qué tanto”. Nadie se fue a protestar a la calle, la cosa siguió tal cual. La NSA confesó que hizo un par de cosas demasiado ilegales y, bueno, esas cosas se arreglaron, pero las otras no, y cada vez te van a espiar más. Yo no digo que esto sea bueno o malo, pero la gente tiene que saber. Y si la gente sabe que está espiada y no le importa, está perfecto. Ahora, la pregunta delicada es qué pasa si esos datos llegan a las manos de alguien que pueda abusar de ellos. En Silicon Valley no están muy contentos con que sus herramientas ahora las pueda usar Donald Trump. Están muy decepcionados, la verdad.

¿Qué cosas de nosotros se pueden saber de un momento a otro?
De partida, dónde estás y dónde has estado. Si tienes Gmail en tu celular con wifi, puedes ver en Google Maps un mapa mundial que muestra dónde estuviste cada día, a cada hora, durante los últimos dos o tres años (ver www.google.com/maps/timeline). Es una información que tú les permites coleccionar al aceptar los términos de licencia cuando instalas la aplicación.

Lo que uno nunca lee...
Exactamente. Y en muchos casos tú puedes optar porque no lo hagan, pero nadie se fija. Ahora, lo interesante es que con estos datos de movilidad se pueden hacer estudios. Y ya sabemos, por ejemplo, que se puede predecir con casi el 90 % de probabilidad dónde vas a estar tú en cada momento de cada día del año que viene. Imagínate lo que vale esa información para una empresa que hace marketing, por ejemplo.

Y en el caso de las empresas de Internet que nos prestan servicios gratuitos, ¿qué tan importante es para su negocio la información que tienen de nosotros?
Todo, eso es todo lo que tienen. Facebook vale billones de dólares por la información, no por otra cosa. De las diez empresas del mundo tasadas a un precio más alto, yo creo que cinco son proveedoras de información. Y la gente siempre dice: “No, hay que regular todo eso, proteger a los usuarios”. Pero la demanda más extrema que he escuchado en todas esas conferencias a las que voy, es que necesitamos derechos de propiedad de datos, como los de propiedad intelectual, para que tú puedas vender tus datos y no regalarlos. Y yo voy con este reclamo donde mis amigos en Silicon Valley y me dicen: “Pero hueón, ¡si ya lo estamos haciendo! Tú sigues siendo dueño de tus datos, pero aceptas que yo también lo sea al aprobar los términos de licencia. Y a cambio puedes usar Google Maps gratis y te ahorras una hora de taco al día, ¿no es fantástico?”. Ahí llegamos al fin de la discusión, no hay nada más que hacer. Incluso ante las propuestas más progresistas, Silicon Valley ya tiene respuesta. Y la verdad es que la gente se beneficia tanto de eso que no le molesta.

 

 

¿A quién le sirven?
¡A mucha gente! Si tú quieres abrir una tienda de corbatas en una estación de metro, te vale mucho saber cuántos hombres caminan en cada salida del metro, entonces compras estos datos de Telefónica. Y también los puedes usar en tiempo real: saber a qué hora pasa la gente, e incluso si se detiene o no a ver el anuncio de oferta que pusiste afuera. Y lo más impresionante es que esto convirtió a las ciencias sociales, de las que siempre se burlaron, en la ciencia más rica en datos. Nosotros nunca tuvimos datos, y por eso nunca funcionaban las políticas públicas. Y de la noche a la mañana, el 95 % de los sujetos que estudiamos pasó a tener un sensor de sí mismo 24 horas al día. Los biólogos siempre dijeron: “Eso no es ciencia, no tienen datos”. Pero ellos no saben dónde están las ballenas en el mar. Hoy nosotros sí sabemos dónde están las personas, pero también sabemos qué compran, qué comen, cuándo duermen, cuáles son sus amigos, sus ideas políticas, su vida social. Se puede abusar también, como Obama y Trump lo hicieron en sus campañas, como Hillary no lo hizo y por eso perdió. Pero el gran cambio es que estamos conociendo a la sociedad como nunca antes y podemos hacer predicciones con un nivel científico. ¡Lo de antes era arte, no era ciencia!

Entiendo que algunos estudios ya han logrado predecir un montón de cosas a partir de nuestra conducta en Facebook.
Claro, esos son los datos que Trump usó. Teniendo entre 100 y 250 likes tuyos en Facebook, se puede predecir tu orientación sexual, tu origen étnico, tus opiniones religiosas y políticas, tu nivel de inteligencia y de felicidad, si usas drogas, si tus papás son separados o no. Con 150 likes, los algoritmos pueden predecir el resultado de tu test de personalidad mejor que tu pareja. Y con 250 likes, mejor que tú mismo. Este estudio lo hizo Kosinski en Cambridge. Luego un empresario que tomó esto creó Cambridge Analytica y Trump contrató a Cambridge Analytica para la elección.

¿Qué hizo con eso?
Usaron esa base de datos y esa metodología para crear los perfiles de cada ciudadano que puede votar. Casi 250 millones de perfiles. Obama, que también manipuló mucho a la ciudadanía, en 2012 tenía 16 millones de perfiles, pero acá estaban todos. En promedio, tú tienes unos 5000 puntos de datos de cada estadounidense. Y una vez que clasificaron a cada individuo según esos datos, lo empezaron a atacar. Por ejemplo, en el tercer debate con Clinton, Trump planteó un argumento, ya no recuerdo sobre qué asunto. La cosa es que los algoritmos crearon 175 mil versiones de este mensaje –con variaciones en el color, en la imagen, en el subtítulo, en la explicación, etc.– y lo mandaron de manera personalizada. Por ejemplo, si Trump dice “estoy por el derecho a tener armas”, algunos reciben esa frase con la imagen de un criminal que entra a una casa, porque es gente más miedosa, y otros que son más patriotas la reciben con la imagen de un tipo que va a cazar con su hijo. Es la misma frase de Trump y ahí tienes dos versiones, pero aquí crearon 175 mil. Claro, te lavan el cerebro. No tiene nada que ver con democracia. Es populismo puro, te dicen exactamente lo que quieres escuchar.

¿Y qué hizo Obama?
Obama fue como el pionero en esto. En la campaña de 2012, para su reelección, invirtió en esto 1000 millones de dólares, mucho más que en comerciales de TV. Y con eso contrató a un grupo de cuarenta nerds, de Twitter, de Google, de Facebook, de Craigslist, tres profesionales de póker, otro que trabaja con células madres, en fin. A esos cuarenta nerds los puso en un sótano, les dio 1000 millones de dólares y un número para el servicio de pizza, ¿no? Y ahí en el sótano crearon los 16 millones de perfiles que les interesaban, los votantes indecisos. Sacaron datos de todos lados. Incluso tuvieron acceso a las Setup-Boxes (los decodificadores de la televisión satelital) que registra cómo tú ves televisión. Si tienen acceso a eso, ya saben lo que te interesa, y empezaron a llevar comerciales individualizados. Lo más delicado es que no sólo pueden mandarte el mensaje como más te va a gustar: también pueden mostrarte sólo aquello con lo que vas a estar de acuerdo. Si Obama tiene sesenta compromisos de campaña, puede que 58 te parezcan mal, pero al menos con dos vas estar de acuerdo. Digamos que estás a favor del desarrollo verde y a favor del aborto. Bueno, empezaron a mostrarte en Facebook sólo estos dos mensajes.

 

Para leer la nota completa ingresá aquí.

tecnología, big data, espionaje, whatsapp, facebook, google,