En una entrada anterior de este blog se definía qué son la ciencia del Big Data y la figura del data scientist. El Big Data ha llegado para quedarse y está cambiando el mundo en el que vivimos. Pero ¿cuáles son los pilares del éxito del Big Data, en los cuales se descompone esta ciencia?
En primer lugar, la VELOCIDAD, que se refiere al ritmo al que los datos son generados, recibidos y analizados en grandes cantidades. Estos datos no solo se transmiten cada vez a mayor velocidad, sino que la tecnología del Big Data permite procesarlos casi en el mismo momento que están siendo producidos, sin necesidad de almacenarlo en ninguna base de datos.
Otra ventaja del Big Data es la VARIEDAD, los diferentes tipos de datos de los que podemos hacer uso. Hasta hace poco, los datos eran estructurados y podían organizarse en una simple tabla de datos, como tu nombre, tu dirección o tu número de teléfono. No obstante, con el auge del Big Data, los datos que circulan también son desestructurados: fotos o vídeos que compartimos por Internet, actualizaciones que hacemos en nuestras redes sociales o cualquier otro tipo de datos que puedas imaginar.
Como su propio nombre indica, Big Data se caracteriza por el enorme VOLUMEN de datos no estructurados que maneja. Y el volumen de estos datos es crucial, cuando es muy grande estos pueden ser considerados Big Data. Algunos ejemplos son la frecuencia con la que tocas la pantalla de tu móvil al utilizar una aplicación determinada o el rastro que dejas visitando distintos enlaces en Google.
La VERACIDAD es otro factor que el Big Data ha de tener en cuenta. La gran dimensión de los datos con los que opera, el hecho de tener tantos datos (que pueden ser inconsistentes y/o falsos en ocasiones) y de tipos tan distintos puede complicarlo todo, y la calidad y precisión de estos datos es difícil de controlar.
Finalmente, manejar esta descomunal masa de datos no sirve para nada si no se convierten en algo con VALOR, un valor que debe ser descubierto. Este descubrimiento pasa por plantearse las preguntas correctas e identificar patrones, para tomar decisiones informadas y predecir comportamientos.
