Miguel Pelaez: ‘EL BIG DATA NO CREA NUEVOS PROBLEMAS, AMPLIFICA LOS QUE COMO SOCIEDAD NO HEMOS CONSEGUIDO RESOLVER’.

Miguel Pelaez Fernandez trabaja como Data Scientist para Tecnatom. También es el director de Clubes de ciencia en España una asociación cuyo objetivo es el mentoring científico. En esta entrevista veremos su opinión e impresiones sobre el Big Data.


P:¿Qué entiende usted por el término Big data? 

R: Esto es un término que se acuña para nombrar una serie de cosas que están ocurriendo en el mundo en general y en el económico y de negocios en particular. La palabra en sí es vacua, carece de significado salvo el literal, sin embargo la usamos para referirnos a todo lo que engloba. ¿Y que engloba? Pues, la digitalización, el usar analiticas avanzadas sobre grandes cantidades de datos, la aplicación de algoritmos de inteligencia artificial, aplicaciones nuevas en sectores nuevos, nuevos modelos de negocio. En principio engloba cosas de este estilo que estamos viviendo, y experimentando  como usuarios, pero en realidad no es una técnica en concreto, ni nada por el estilo. Nomen est omen que decían los romanos. 

P:¿Cómo definiría su trabajo y cuál es su relación con el Big Data?

R: Mi trabajo es el de buscar cómo resolver problemas de negocio o automatizar procesos, usando datos del negocio o del proceso como activo y algoritmos de inteligencia artificial o analiticas avanzadas como herramientas para resolverlos. Esas dos combinaciones de palabras, datos = activos y algoritmos = herramientas son clave para entender el trabajo que tiene que hacer uno. La denominación de perfiles como el mío son data scientist. Científico de datos. Como indica el nombre, soy un científico que me dedico a usar los datos de la empresas o afines a la empresa para resolver problemas, realizar experimentos, etc., con objeto de ayudar a la empresa.

P:¿Qué aplicaciones tiene actualmente el Big Data? ¿Y en el futuro?

R: En cualquier ámbito que exista datos o que se puedan recabar datos usando otras tecnologías sensoriales. El futuro seguirá siendo así y las aplicaciones estarán moldeadas por la creatividad de la gente por un parte y las necesidades sociales a medida que van evolucionando nuevos modelos de negocio asociados a la explotación de datos. No creo que haya respuestas concretas hacia el futuro, salvo que el camino se va a hacer con una motivación similar a la actual y las herramientas para caminar van a ser cada vez más potentes y versátiles que ahora pero similares en concepto.

P:¿Cuál es el mayor reto tecnológico que afronta el Big Data?

R: Los retos de llevar el Big Data a que permee más de lo que lo hace actualmente vienen dados por los facilitadores tecnológico: el 5g, mejores capacidades de cómputo, alcanzar con wifi a mayores partes del planeta. Por otra parte, está la parte de algoritmos de IA. Estos algoritmos están limitados por la capacidad de cómputo también pero en este caso el cómputo que se demanda es incluso más intensivo. Sin embargo, la puerta tecnológica que se abre aquí como facilitadora son las tecnologías GPU, que ya se llevaban usando en el mundo de los videojuegos, la computación cuántica (cuando llegue) o los microprocesadores hibridos material-luz que se están proponiendo como soluciones muy sostenibles para las demandas de computación de algoritmos de IA. 

P:En un futuro cercano, ¿cuáles crees que serán los avances en la adquisición, tratamiento y análisis de datos?

R: Se están proponiendo herramientas de IA que aprendería a crear algoritmos de IA. Me explico, el actual trabajo de un machine learning engineer o de un data scientist, es el de procesar datos, realizar análisis y luego plantear un modelo de IA que pueda automatizar o resolver un problema. En este sentido, Google, por poner un ejemplo, desde 2018 comercializa una aplicación denominada AutoML que es un sistema que aprende a generar esos algoritmos que vendrían a ser el modelo óptimo de IA. En esta línea se va a avanzar por el interés empresarial mucho. Sobre la adquisición de datos se avanzará más en el mundo de los átomos (a diferencia del de los bits), el mundo físico, para desarrollar mejores sensores, con mayor autonomía y más versátiles en su despliegue, o sea en el mundo del IOT (Internet of Things).

P:¿Qué problemas puede acarrear para la sociedad el uso del Big Data?

R: El uso del Big Data en la sociedad no acarrea nuevos problemas sociales, salvo por el hecho que los globaliza y los escala. En principio mi respuesta sería que amplificaría los problemas que ya existen en la sociedad y que como sociedad no hemos sido capaces de resolver. Por poner un ejemplo, el sesgo sobre los géneros. En este sentido más nos vale aprender a resolverlos en el mundo offline, que intentar enseñar a algoritmos que aprendan a no sesgar. Esta última es una postura ridícula que parece es el mainstream desde el punto de vista tecnológico, y no digo que esté mal, sin embargo la raíz del problema se esconde con esa postura.

P:¿De qué manera puede ayudar el Big Data a la divulgación científica?

R: Yo no soy muy partidario de la divulgación científica. Es cierto que consumo algo de manera tangencial, pero por lo general me gusta aprender de gente que no se considera divulgador aunque por su propia presencia en medios de difusión o plataformas llega a mucha gente. El Big Data usado desde el punto de vista de personalización de contenido, a través de los mecanismos de recomendación, me parece que va a conseguir crear burbujas individuales de realidad donde al final por la exposición que cada uno tiene a la realidad, personalizada, va a tener una visión divergente con otras personas. No tengo claro si eso es bueno o malo, quizás es bueno para el movimiento postmoderno, y malo para la ciencia, como disciplina de acercarse a la verdad de manera objetiva y universal, pero el Big Data usado en ese sentido pienso que va a personalizar cualquier contenido que se consuma individualmente incluido el de la divulgación científica.

P:¿Qué herramientas se utilizan en el procesamiento de datos actualmente?

R:El espectro de herramientas es muy amplio. Es cierto que se convergen a tres o cuatro herramientas más estandarizadas. Por ejemplo, en cuanto a lenguajes de programación lidera Python. Aunque en cuanto a procesamiento de datos de una manera veloz se han creado lenguajes específicos para poder procesar de manera distribuida, en paralelo, como Spark o Scala. Las plataformas de la nube,  google cloud, amazon web service, azure por nombrar las más populares son en sí un espacio donde tienes a disposición herramientas para el procesamiento casi más como un servicio que como un producto.

P:¿Conoce algún caso (cercano o no) de un mal uso de la Big Data?

R: Depende de como se mire. ¿El uso en China del Big Data en la vigilancia de los ciudadanos es bueno? En China, país comunista filosóficamente hablando está más que justificado. ¿El uso de datos vendidos por Facebook a a terceros, Cambridge Analytica, para usarlos en la opinión de voto y casi que en el voto de la gente y así manipular resultados de un proceso democrático es un mal uso? Pues al menos legalmente sí que lo tenemos claro que es y por lo tanto si podríamos decir que es un mal uso. Pero al final el bien y el mal es relativo sin un filtro legal por encima. Cuando yo trabajaba en una empresa americana de marketing digital, donde en USA las leyes son diferentes a Europa, era legal tener información del historial de navegación de ciertos cookies que además teníamos información de quién era o de sus perfiles demográficos. Esto que parece muy intrusivo mucha gente puede opinar que es un mal uso del Big Data para conocer los intereses de la gente a través de la páginas que visita y crear modelos de recomendación de publicidad pero la realidad es que es muy relativo a la cultura, en el sentido que en USA la gente está en pro de recibir publicidad personalizada mientras que en Europa somos contrarios y regulamos muchísimo más estas situaciones.

P:¿Cree que la legislación vigente cubre todos los aspectos del Big Data o hay algún vacío legal?

R: No cubre ni de lejos todo lo que se necesita e incluso se están enfrentando a temas que requiere de un cambio de paradigma en sus forma tradicional de pensar. Sin embargo, y esto lo he hablado con un miembro de la comisión europea de legislacion en IA y robótica, pienso que es la primera vez en la historia que los legisladores (no los políticos si no los profesionales del derecho) están siendo proactivos en vez de reactivos. Me explico, es la primera vez que se enfrentan a una situación en la que tienen que redefinir nuevos marcos legales no solo fijándose en lo que hoy en día está ocurriendo si no posicionándose 20 años en adelante para valorar la situación proactivamente. Esto es una gran noticia y yo se lo aplaudo. Además creo que tienen muy presente, aunque la realidad en Europa es lamentablemente muy conservadora, que no pueden acotar mucho con sus leyes por que eso está en contra de la innovación y la civilización se encuentra en un momento donde la innovación necesita estar presente como mecanismo impulsor socioeconómico.

Deja un comentario

Diseña un sitio como este con WordPress.com
Comenzar