Datos: el nuevo oro

LA @

DATOS: el nuevo oro

¿CUÁNTO PAGARÍA por una bola de cristal con la que predecir lo que le comprará un cliente? ¿Por qué partido votará alguien? ¿Es posible acertar con un diagnóstico médico? Todo depende de los datos y de la inteligencia artificial necesaria para procesarlos. Lo consiguen todo: desde aprobarle su hipoteca a ubicar la caída del próximo rayo. Con razón la llaman la cuarta revolución industrial. Y es que solo hay algo mejor que un dato: otro más.

GABRIEL CRUZ

@Gabrielcruztv
[email protected]

EL CAMPO DE LA INTELIGENCIA artificial es tan amplio que llega a todos los lugares. También al salón de su casa, o ¿no se ha planteado por qué cuando termina de ver una película en una plataforma esta le ofrece otra semejante a la que estaba viendo? En este caso, el responsable es un algoritmo que se llama “filtro colaborativo” y que se basa en la semejanza de los gustos de diferentes clientes. Es decir, si Manuel ha seleccionado una película que le gusta también a Gabriel, es más probable que a Manuel también le gusten otras películas que le hayan gustado a Gabriel. Dicho así, le parecerá demasiado simple para que acierte con sus predicciones. Pero es que la plataforma tiene la capacidad para analizar decenas de millones de usuarios y cuantos más datos tiene de ellos, más acierta. Ahí es donde nos damos cuenta de que, aunque creamos que somos únicos, en el fondo somos parecidos a los demás. Esta es la base principal de muchos algoritmos de las redes sociales.

Un algoritmo es una serie de pasos que se realizan para resolver un problema. Por ejemplo, una receta de cocina o unas instrucciones de bricolaje. A estos les llaman algoritmos cualitativos o los “paso a paso”. Pero hay muchos más: los algoritmos dinámicos, de reverso, oportunistas, de marcaje, aleatorios, etc. Por haber, hay un tipo denominado de “fuerza bruta” que efectúa muchas combinaciones y que por tanto necesita de mucha potencia de procesamiento. Este tipo de algoritmo fue el que utilizó el ordenador ‘Deep Blue’ en las partidas de ajedrez contra el maestro Kasparov. La primera, en 1996, la perdió, pero en 1997 venció al humano.

Panda y Pingüino. Aparte, cada empresa tiene los suyos, como Google con Hummingbird (Colibrí) que es el que busca la información cuando usted lo hace en su web. Recientemente ha sido mejorado porque ya no sólo busca por coincidencias de palabras sino también por el contexto. Pero Google tiene otros más, por ejemplo Panda y Pingüino, que penalizan aquellas webs que intentan manipular los resultados de búsqueda. Pero entonces, ¿es lo mismo un algoritmo que un programa informático? No, el algoritmo puede estar escrito en nuestro lenguaje, (la receta de una cocina que apuntamos en una libreta) mientras que el programa es la traducción de ese lenguaje al de la computadora para que ésta lo ejecute.

Los datos son la energía que hace que un algoritmo funcione. Y cuantos más tenga, mejor, porque así puede hacer lo que tanto queremos de ellos: crear patrones y previsiones. Cuando se empiezan a desarrollar todos los algoritmos de IA fallan bastante. Pero se les va educando a base de datos, de la misma forma que se hace con un niño cuando se le enseñan los colores. Y será por datos… Actualmente hay millones de millones: cuando da un like, navega por la web, su posicionamiento… Pero no solo los facilita usted a través del teléfono. También se envían datos a través del “internet de las cosas” (coches, electrodomésticos, supermercados…).

Las posibilidades son infinitas. Incluso es posible predecir dónde caerán (aproximadamente) los rayos. Así lo ha desarrollado la escuela politécnica de Suiza recopilando datos de las estaciones meteorológicas. ¿Se imaginan que en el futuro se perfeccione este sistema para aprovechar la energía de los relámpagos?

En el mundo jurídico parece que las cosas van lentas. Si bien se producen millones de datos, el problema está en procesarlos adecuadamente por la ambigüedad del lenguaje humano según sea el contexto. Es mucho más complicado de analizar que un “me gusta” de una red social. Como las sentencias están en nuestro lenguaje humano (aunque viendo la complejidad de algunas nos surjan las dudas), el ordenador debe realizar un proceso de conversión para entenderla. Lo hace a través del Procesamiento del Lenguaje Natural (PLN o LNP) el campo de la inteligencia artificial que investiga cómo pueden hacer que las palabras de las personas las entienda la máquina.

Distinguir la Covid. Salvo algunas dificultades como la anterior, no hay campo que se le escape a la inteligencia artificial. La Universidad de Tsinghua en Pekín (China), ha desarrollado un sistema para distinguir la Covid‐19 de la gripe en menos de tres segundos. ¿Cómo? Con un algoritmo que digirió 11.356 tomografías computarizadas de 9.025 individuos.

¿Qué ha pasado para que se produzca esa revolución? Primero, el abaratamiento del almacenamiento de datos. En este sentido aún hoy se sigue repitiendo la afirmación que hizo Fabrizio Salvador, profesor de IE business school, en 2014. El experto aseguraba en su estudio sobre big data que almacenar “toda la música del mundo cabría en un dispositivo de 600 dólares”. De hecho, si en 1980 se pagaban 100.000 dólares por gigabyte, en 2015 era menos de 10 centavos.

Aparte de la capacidad de almacenar también ha mejorado la capacidad de refinar ese petróleo que son los datos. Así, China, que es potencia mundial en este campo, tiene una supercomputadora (el Tianhe‐3, vía láctea en Chino) que realiza un trillón de cálculos en un segundo, lo que permitirá encontrar respuestas a grandes enigmas de la medicina o la naturaleza. Las posibilidades dan vértigo y esto no ha hecho más que empezar.

 

Película ‘Her’


(2013) director, Spike Jonze; protagonista, Joaquin Phoenix.

¿PUEDE LLEGAR LA INTELIGENCIA artificial, si sabe tanto de nosotros, a enamorarnos? Es lo que plantea esta película que ganó un Oscar al mejor guión. Después de lo que ha leído: ¿qué es lo cree que quiere un sistema operativo con voz de mujer para ser conquistado? ¿Salir a cenar? No, datos.

Y en Twitter qué opinan

 

EN ESPAÑA:
@SEDIAgob Secretaría de Estado de Digitalización e Inteligencia Artificial. Vicepresidencia de Asuntos Económicos y Transformación Digital.

@Spain_AI_Spain Asociación sin ánimo de lucro que busca crear una comunidad colaborativa sobre Inteligencia Artificial en España.

@BigDataMagazine Primera revista española especializada en datos. Muy completa, incluyendo una serie de podcast de lo más variado.

EN EL EXTRANJERO:
@kirkdborne 272.000 seguidores. Elegido como el top de los influentes (influencers si quiere maltratar el idioma). Es un científico de datos. Fue durante doce años profesor de Astrofísica y Ciencias Computacionales.

MARK STEVENSON:
@TheDataAgent 55,1 mil Seguidores. Para los que creen que ya no se puede reciclar. Él es licenciado en Políticas e Historia y se ha transformado en un especialista del impacto del big data en el mundo laboral.

Policías cibernéticos

EL JEFE DE LA COMISARIA local de Las Rozas (Madrid), Manuel López, nos recibe en su despacho. Entre los objetos que tiene dispersos por él, está una expendedora de billetes de autobús, conocidas como churreras. “Es del año que trabajé en la EMT en 1990, todavía funciona”, nos señala dando la vuelta a la manivela. Bajamos un piso para acercarnos al verdadero motivo de nuestra visita: la sala de control de cámaras del municipio. Aquí uno espera ver a policías pendientes de las pantallas, pero no es así porque el propio sistema lo está por ellos. “Funciona con inteligencia artificial, nos salta una alarma si detectan una matrícula de un coche robado, los identifica por su tipología, color, marca, etc.”, señala López. Este tipo de tecnología también identifica el recorrido de un sospechoso. Por ejemplo, es capaz de ver por dónde ha pasado una persona con cazadora marrón. También avisan a los policías en caso de que alguien sufra un desmayo (el programa reconoce que una persona ha caído) e incluso puede predecir, aunque sea por segundos, si se va a producir un delito al detectar armas, una mochila abandonada o un rostro cubierto con pasamontañas.