Big Data Núm. 6 | Junio 2013

Algunos ejemplos del mundo real


Fuente: SAS, IBM y McKinsey Global Institute

Crecimiento de los datos: ¿Qué ocurre en un minuto en internet?


Fuente: Intel: What Happens in an Internet Minute?

Esto no ha hecho más que empezar


Fuente: Intel

Y ya ha captado la atención de mucha gente


Fuente: Google Trends | Abril 2013

La oportunidad de mercado

Según la reciente presentación de Gartner “Top Technology Predictions for 2013 and Beyond”:

  • En todo el mundo las compañías contratarán a muchos expertos en información empresarial para dar apoyo a la creciente cantidad, variedad y velocidad de los datos
  • La demanda de gastos en servicios de Big Data se calcula que alcanzará los 132.300 millones de dólares en 2015
  • En 2015 la demanda de Big Data supondrá 4,4 millones de puestos de trabajo en todo el mundo, pero sólo un tercio de ellos estarán cubiertos
  • La demanda generará 550.000 empleos en servicios externos durante los próximos tres años
  • Otros 40.000 empleos los generarán vendedores de software durante los próximos tres años

Fuente: Gartner | Top Technology Predictions for 2013 and Beyond, Febrero 2013

Una definición

Big Data es el término que se emplea hoy en día para describir el conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios datos encierran. Esto se puede lograr tanto a través de una mejora en la eficiencia gracias al análisis de los datos (una visión más tradicional), como mediante la aparición de nuevos modelos de negocio que supongan un motor de crecimiento. Se habla mucho del aspecto tecnológico, pero hay que tener presente que es crítico encontrar la forma de dar valor a los datos para crear nuevos modelos de negocio o de ayudar a los existentes.

Fuente: BBVA New Technologies

Características: A Big Data le caracterizan las tres "V": volumen, variedad y velocidad:

  • Volumen

- El volumen de los datos almacenados en los depósitos de las empresas ha pasado de ocupar megabytes y gigabytes a “petabytes”.

- Por ejemplo, el volumen de datos procesado por corporaciones ha crecido significativamente. Google procesa 20 petabytes al día.

- En 2020 se espera que se generen 420.000 millones de pagos electrónicos.

- La Bolsa de Nueva York genera un terabyte de datos al día, frente a Twitter, que genera 8 terabytes al día (o 80MB por segundo).

  • Variedad

- La variedad de datos ha explotado, pasando de ser datos almacenados y estructurados, guardados en bancos de datos empresariales, a ser desestructurados, semiestructurados, audio, video, XML, etc.

- Datos en streaming, cotizaciones bursátiles, medios sociales, máquina a máquina, datos de sensores... Una creciente variedad de datos necesitan ser procesados y convertidos en información.

  • Velocidad

- La velocidad del movimiento, proceso y captura de datos dentro y fuera de la empresa ha aumentado significativamente.

- Los modelos basados en inteligencia de negocios generalmente suelen tardar días en procesar, frente a las necesidades analíticas “casi” en tiempo real de hoyen día debido al flujo de datos a alta velocidad.

- eBay, por ejemplo, se enfrenta al fraude a través de PayPal analizando cinco millones de transacciones en tiempo real al día.

Fuentes y tipos

Las fuentes de datos son internas y externas y los tipos de datos son estructurados y desestructurados:

Fuente: Booz & Company | Bene?tting from Big Data, 2012.

El camino hacia la productividad

En conjunto, Big Data está entrando en un “abismo de desilusión".

"MapR, HortonWorks y Cloudera estaban debatiendo el estado de Hadoop. Y yo había oído desde el mismo centro del movimiento Hadoop que MapReduce siempre ha sido el techo de Hadoop o que Hadoop está ya anticuado".

Mira este vídeo para ver las señales que sugieren "el inicio de la desilusión (y de paso consigue mucha información útil). Enhorabuena, ¡la tecnología de Big Data está madurando con rapidez!"

Se trata de resultados empresariales

En cierto sentido, Big Data puede tener las respuestas a todas nuestras preguntas. Algunos incluso dicen que es el fin de la teoría. Las empresas y las organizaciones que puedan hacer las preguntas adecuadas (en el momento adecuado) ganarán en ventaja competitiva. Desde el punto de vista de los negocios, actualmente estamos yendo del "data science" (ciencia de datos) al "data intelligence" (inteligencia de datos).

Desde el punto de vista de las tendencias, lo siguiente a explorar es la búsqueda de valor empresarial y de resultado de negocio con Big Data. En otras palabras: veamos en dónde está el valor del modelo de negocio. ¿Qué puedo hacer en mi negocio con Big Data? ¿Qué puedo hacer con Big Data para crear nuevos modelos de negocio?