Índice de contenidos
Para comprender mejor la definición de qué es Big Data es importante mencionar las características generales que tiene. Estas características son conocidas como Las siete V del Big Data.
Doug Laney, analista experto en datos, presento en 2001 las tres propiedades principales que posee el Big Data: Volumen, Velocidad y Variedad. Posteriormente a la aportación de Laney, se han planteado, por parte de diferentes autores, el uso de otras V’s que complementan a la definición original, para mejorar su amplia y compleja interpretación. Estas son: Veracidad, Visualización, Viabilidad y Valor.
1ª V del Big Data: Volumen
Es la característica que más se asocia al término Big Data. Son los grandes volúmenes de datos generados que deben ser procesados. Estos datos pueden provenir de diferentes fuentes, como redes sociales, clicks en páginas web, en los “likes”, las búsquedas, los mensajes… Hoy en día y gracias a la evolución de la tecnología, podemos optar a nuevas formas de almacenaje que nos permiten guardar esa cantidad de datos fácilmente y a un precio asequible, como el almacenaje en la nube o Apache Hadoop.
2ª V del Big Data: Velocidad
Esta difusión de datos origina, como hemos mencionado antes, una gran cantidad de datos que son recibidos de forma continua y que debemos procesar. El ritmo y constancia a la que se reciben esos datos es la velocidad.
El ciclo de vida de los datos es más bien corto, ya que continuamente se están produciendo, por lo que es necesario realizar de forma eficaz su procesamiento y evitar así un desfase en los datos.
3ª V del Big Data: Variedad
La información que nos proporcionan esos datos proviene de fuentes diferentes, pueden ser desde búsqueda de imágenes hasta datos de temperatura de un lugar concreto. Sus formas y estructuras son diferentes (Pueden ser estructurados, no estructurados y semiestructurados) lo que supone que cada uno de ellos necesiten ser tratados con herramientas específicas capaces de “leer” esos datos y transformarlos para que podamos comprenderlos.
4ª V del Big Data: Veracidad
La veracidad es la calidad y fiabilidad de los datos que recibimos. Hoy, es complejo garantizar que toda la información obtenida tiene una gran fiabilidad y son de una óptima calidad. Para ello, es necesario invertir cierto tiempo en tratar de hacer una limpieza y eliminar aquellos datos que no sean correctos.
5ª V del Big Data: Valor
Esta característica quizás sea la más valorada por las organizaciones y negocios que buscan mejorar. Una vez que hemos obtenido los datos y que los hemos transformado para que sean legibles es el momento de tomar decisiones útiles y provechosas que nos puedan ayudar.
Por ello, el valor es la información que se obtiene a partir de los datos, con la que podemos mejorar los beneficios y el rendimiento del negocio.
6ª V: Visualización
Tras el procesado de datos, la visualización es la manera en la que presentamos los datos, con el objetivo de que esta representación se realice de forma sencilla para que cualquier persona pueda acceder a estos datos. Gracias a esa representación es posible detectar patrones ocultos que no habríamos detectado anteriormente.
7ª V: Viabilidad
La viabilidad es la capacidad que tiene la empresa para gestionar y manejar el gran número de datos que disponemos. Es necesario que tengan las competencias adecuadas, para que su uso sea lo más provechoso posible, tanto con programas tecnológicos apropiados como equipos de trabajo eficientes.