¿QUÉ ES BIG DATA?

El Big Data es el análisis masivo de datos. Una cuantía de datos, tan sumamente grande, que las aplicaciones de software de procesamiento de datos que tradicionalmente se venían usando no son capaces de capturar, tratar y poner en valor en un tiempo razonable.

Igualmente, el mismo término se refiere a las nuevas tecnologías que hacen posible el almacenamiento y procesamiento, además de al uso que se hace de la información obtenida a través de dichas tecnologías.

¿DE DÓNDE VIENEN LOS DATOS?

 

 La información disponible a nivel mundial han crecido de manera exponencial en los últimos tiempos. Pero… ¿de dónde vienen esos datos? Hay múltiples fuentes. Destacaremos las siguientes:

· Producidos por personas. Mandar un email, escribir un comentario en Facebook, contestar a una encuesta telefónica, meter información en una hoja de cálculo, responder a un WhatsApp, coger los datos de contacto de un cliente, hacer clic en un enlace de Internet… Infinidad de acciones que realizamos en el día a día suponen una fuente de datos inmensa.

 · Entre máquinas. Sí, entre máquinas también se comparten datos directamente, en lo que se conoce igualmente como M2M, que viene del inglés «machine to machine». Así, los termómetros, parquímetros y sistemas de riego automático de las ciudades, los GPS de vehículos y teléfonos móviles, las máquinas expendedoras de bebidas y alimentos en un hospital, o los contadores de electricidad de las viviendas, por poner unos pocos ejemplos, se comunican a través de dispositivos con otros aparatos, a los que transmiten los datos que van recogiendo. Las redes de comunicación para llevar a cabo estas acciones son muy variadas. Entre las más conocidas están el Wifi, el ADSL, la fibra óptica y el Bluetooth.

· Biométricas. Los datos que tienen como origen artefactos como sensores de huellas dactilares, escáneres de retina, lectores de ADN, sensores de reconocimiento facial o reconocimiento de voz. Su uso es muy extendido en materia de seguridad en todas sus variantes (privada, corporativa, militar, policíaca, de servicios de inteligencia, etcétera).

· Marketing web. Nuestros movimientos en la Red están sujetos a todo tipo de mediciones que tienen como objeto estudios de marketing y análisis de comportamiento. Por ejemplo, cuando se realizan mapas de calor basados en el rastreo del movimiento del cursor por parte de los usuarios de una web, en la detección de la posición de la página, o en el seguimiento de desplazamiento vertical a lo largo de esta. Con esos datos se llega a conclusiones tales como qué partes de una página atraen más al usuario, dónde hace clic o en qué zona de esta pasa más tiempo.

· Transacciones de datos. El traspaso de dinero de una cuenta bancaria a otra, la reserva de un billete de avión o añadir un artículo a un carrito de compra virtual de un portal de comercio electrónico, serían algunos ejemplos.

Así, con todas estas fuentes de datos descritas, puedes imaginar que la cuantía de ellos es tremenda. Y aún así, probablemente te quedes corto en tus cálculos.

Para que te hagas una idea, y centrándonos únicamente en una pequeñísima porción de los datos producidos por las personas, en el año 2017, durante un solo minuto, de promedio y a nivel global, se enviaron 156 millones de correos electrónicos, se realizaron 3 millones y medio de búsquedas en Google, se mandaron 16 millones de SMS, se postearon 46.200 nuevos contenidos en Instagram, se generaron 452.000 tuits y se publicaron 1,8 millones de snaps en Snapchat.

¡En un minuto! Multiplica eso por los 525.600 minutos que tuvo el año y añádele los miles de ejemplos adicionales que no hemos puesto aquí. ¿Parece inabarcable verdad? Pues lo iba a llegar a ser, y en previsión de evitarlo, ante una necesidad nueva, apareció una solución nueva: el Big Data.

TIPOS DE DATOS SEGÚN SU ESTRUCTURA

Además de por su procedencia, es importante saber que se pueden clasificar los datos según su tipo de estructura en 3 clases:

 

Volumen: como hemos comentado, la cantidad de datos generados está aumentando. Según crecen las bases de datos, también lo han de hacer las aplicaciones y arquitectura construida para soportar la recogida y almacenamiento de datos cada vez más variados. Además, se han reducido los costes de almacenamiento propiciando almacenar grandes cuantías de información a un precio mucho más reducido que antiguamente.

Veracidad: saber la fiabilidad de la información recogida es importante para obtener unos datos de calidad e, incluso, dependiendo de las aplicaciones que se le vaya a dar a misma, se convierte en fundamental. Es un factor que puede influir mucho en conseguir una ventaja competitiva en la explotación del Big Data.

Visualización: Convertir cientos de hojas de información en un único gráfico que muestre claramente unas conclusiones predictivas es un ejemplo de cómo mostrar los resultados de forma clara y sencilla en un evidente ejercicio de sintetización.

CARACTERÍSTICAS PRINCIPALES

 

Sus características se acuñan popularmente como las «V» del Big Data, por comenzar todas estas propiedades por dicha letra del alfabeto. No hay un consenso sobre cuántas “V” han de ser tomadas en consideración y de hecho la lista de estas se ha ido ampliando, pero podemos afirmar que las 7 «V» del Big Data más extendidas son:

Velocidad: nuestro concepto de inmediatez ha cambiado en los últimos tiempos y se busca información que llegue prácticamente al instante. Noticias que no llegan al día de antigüedad, en simple cuestión de horas y, en ocasiones, minutos, pueden haber perdido interés. Así, la velocidad de análisis requerida por la sociedad actual es una de las características fundamentales que tienen los datos a gran escala, donde los datos en constante movimiento procesados a tiempo real cobran protagonismo, ejecutando algoritmos cada vez más complejos en menos tiempo.

Variedad: los datos sobre los que trabajan las técnicas de macrodatos son diversos pues, como hemos visto, proceden de numerosas fuentes y se encuentran en distintos formatos. Además, continúa en aumento la cuantía de datos no estructurados en proporción a los tradicionales. Igual que pasaba con el volumen, esta entrada en escena con fuerza de los datos no estructurados requiere nuevos tratamientos de la información, necesitando de nuevas metodologías y tecnologías para poder ser analizadas.

Valor: una gran cuantía de datos frecuentemente extrae pequeñas informaciones de valor. Cómo conseguir dicha información de manera eficiente es uno de los retos que afronta día a día el área de la inteligencia de datos. El valor es sin duda una cualidad fundamental en el análisis.

Variabilidad: en un entorno tan cambiante como el de los macrodatos, la información varía mucho. Y también han de hacerlo los modelos o tratamientos que se aplican en torno a esta, pues no son fijos en el tiempo y requieren de un control periódico.

EL CICLO DE GESTIÓN DE INFORMACIÓN EN 4 FASES

Conoces ya de dónde vienen los datos, los tipos de ellos que existen y sus características principales. Lo siguiente es cómo gestionarlos:

BENEFICIOS DEL BIG DATA

 

Y todo ese proceso puede que te preguntes, ¿qué beneficios aporta? Pues unos cuantos, la verdad. Algunos de ellos son:

– Es un conjunto de tecnologías muy ágiles y flexibles.

– Es escalable por lo que, si tienes más datos, puedes poner más máquinas e incluir nuevas analíticas y más información. Así, la infraestructura puede crecer al mismo tiempo que tu empresa o proyecto.

– Es rápido y económico respecto a la infraestructura de almacenamiento. Por ejemplo, a través de servicios de computación en la nube, puedes pagar únicamente por lo que consumes.

– La mayoría de aplicaciones pertenecen a la comunidad Open Source, software de código abierto o que forma parte del dominio público. Con esto, además del ahorro económico evidente que nuevamente entra en escena, también tenemos a nuestra disposición una gran comunidad de desarrolladores que trabajan diariamente en mejorar sistemas y procesos de estos recursos, como la comunidad Open Source de Apache, donde también resuelven dudas que surgen a diversos usuarios en todo el mundo.

– Y para el final, la gran ventaja: a través del Big Data y habiendo seguido correctamente el ciclo de gestión de información que culmina con la puesta en valor de los datos, habrás conseguido un objetivo previamente marcado. Este puede ser ganar más dinero o ahorrarlo a través de mejoras de costes, adquisición de nuevos clientes o retención de los actuales, avanzar en una investigación científica, obtener una ventaja competitiva respecto a nuestros competidores anticipándonos a lo que deparará el mercado a través de análisis predictivos, optimizar nuestros procesos de producción…

En definitiva, podremos sacar conclusiones con una base más sólida y unos conceptos que se orienten a la toma de decisiones efectivas. Y todo ello, aplicando no únicamente variables del pasado, sino predicciones a futuro mucho más fundamentadas en una base científica que hasta hace unos pocos años.

CASOS PRÁCTICOS DE APLICACIÓN Y ÉXITO EMPRESARIAL

 

AMAZON

La compañía de referencia a nivel mundial, en lo que a comercio electrónico se refiere, basa buena parte de su éxito en conocer de antemano lo que necesitan sus clientes. Así, es muy probable que si entras en la página de esta empresa, te sugiera artículos que van a ser de gran interés para ti. ¿Cómo? A través de la inteligencia de datos analizan muchos factores de carácter individual del usuario como sus hábitos de compra o intereses y otros más generales como tendencias del momento o pautas de conducta de otros usuarios que adquirieron productos similares. Juntan todo en la coctelera del Big Data y ofrecen una serie de productos sugeridos o relacionados con compras que el cliente ya ha hecho o se ha planteado hacer.

NETFLIX

Uno de los grandes factores del éxito de la popular empresa estadounidense Netflix, es su magistral uso de los macrodatos para crear nuevos contenidos para sus usuarios, cuyos hábitos de consumo y preferencias son observados al detalle para descubrir qué es lo que van a querer ver a continuación en base a patrones predictivos. Así crearon, por ejemplo, la serie House of Cards: observaron que a muchos de sus usuarios les gustaban contenidos que incluyeran poder, política, drama y sensualidad entre sus características principales. Y también que les gustaba como actor Kevin Spacey. Así, dieron con la fórmula y mezclaron en la trama todos estos ingredientes poniendo a protagonizar a Spacey la misma. Igual proceso para Stranger Things y otros grandes éxitos de audiencia.

T-MOBILE

Esta empresa de telecomunicaciones alemana es un ejemplo de uso de los datos masivos como mejor arma de retención de clientes. Analizando a fondo las conversaciones, reclamaciones y descontentos que sus clientes dejaban en redes sociales, crearon soluciones específicas para cada uno de ellos y consiguieron reducir la fuga de clientes a otras empresas en un 50%, con lo que el retorno de la inversión realizada en Big Data fue compensado con creces.

SPOTIFY

Bajar hasta los datos individualizados más llamativos para lanzar con ellos una campaña global masiva. Eso hizo en Reino Unido la compañía sueca Spotify, que ofrece reproducción de música vía streaming. Su plan consistió en buscar la complicidad del gran público. Y lo consiguieron mostrando curiosidades o rarezas del comportamiento de algunos de sus usuarios que habían detectado a través de los macrodatos. Así, en grandes carteles publicitarios, colocaron anuncios como estos:

«Querida persona que reprodujo “Sorry” 42 veces en el Día de San Valentín, ¿qué hiciste?»

«Queridas 3.749 personas que reprodujeron “It’s the end of the world as we know it” el día del Brexit, estamos con vosotros»

«Querida persona en el Theater District que escuchó la banda sonora de Hamilton 5.376 veces este año, ¿puedes conseguirnos tickets?

 

NIKE

Los dispositivos electrónicos de su línea NikePlus (relojes inteligentes, pulsómetros, dispositivos con sensores que conectan sus zapatillas con un teléfono…) recogen cantidades masivas de información de millones de usuarios. Información que sirve a la empresa de ropa deportiva estadounidense para buscar la fidelización de los usuarios a través de retos y objetivos que apelan a la capacidad de superación de estos, creando un vínculo con la marca más allá de la simple venta de material deportivo. 

 

EL BIG DATA EN OTROS ÁMBITOS

 

Más allá del ámbito empresarial, existen múltiples sectores públicos y privados en los que la inteligencia de datos juega un papel referencial: avances científicos, selección de deportistas para clubes de élite, seguridad privada, administración pública, defensa antiterrorista, detección de fraudes bancarios, prevención de crisis medioambientales… Ante la gran variedad existente, vamos a poner dos ejemplos algo más desarrollados de cómo la inteligencia de datos ayuda en una campaña electoral y en materia de medicina preventiva.

El Big Data se ha convertido en los últimos años en una herramienta muy útil dentro de los procesos electorales. Permiten seguir el sentimiento de los electores y la percepción que tienen los votantes sobre los candidatos en cada momento, haciendo que las campañas se basen en datos de una forma mucho más dinámica que antaño. De hecho, la forma de hacer campaña cambia: ya no son tan decisivos los grandes mítines, sino un acercamiento mucho más segmentado que tiende a individualizar a los votantes para conseguir llegar con un mensaje más personal, cercano y directo a cada uno de ellos. Uno de los grandes ejemplos del uso de la inteligencia de datos en campaña electoral con éxito es el del político Barack Obama para lograr su segundo mandato como presidente de los Estados Unidos de América.

En el campo médico, hay múltiples avances que pueden ser posibles gracias a los datos a gran escala. Podremos un ejemplo de entre los numerosos estudios, técnicas y procedimientos que gracias al Big Data están cambiando para mejor los tratamientos sanitarios: el estudio del material genético de los organismos, permite conocen cómo funcionan los genes y su influencia en las enfermedades. Analizando los genes de una persona a través de los macrodatos, se puede aplicar de forma individual una medicina preventiva mucho más eficaz, con un diseño de tratamientos a la carta adaptados a cada paciente.

 

 

CONCLUSIÓN

 

Como puedes ver, en múltiples ámbitos con objetivos muy diversos, el análisis de datos masivos es la herramienta fundamental para alcanzar sus metas, con especial foco en el ámbito empresarial.

Así, el aumento de ventas de Amazon a través de su acierto en la venta cruzada, el acierto en el lanzamiento de nuevos contenidos de Netflix, la retención de clientes de T-Mobile, la provocación de un sentimiento en el receptor de un anuncio de Spotify o la fidelización de Nike que hemos puesto entre los ejemplos, simbolizan muchas facetas distintas e importantes de la relación de las empresas con sus clientes o usuarios que trascienden los niveles conocidos hasta ahora.

El Big Data está en todas partes, y todavía no hay tantos expertos como demanda de éstos, que sigue en aumento imparable. Por tanto, ha llegado el momento de los datos a gran escala. No te quedes fuera y aprovecha la oportunidad, formándote con la garantía de un líder de la educación como la Universidad Complutense de Madrid. ¡Preincríbete en el Máster en Big Data y Business Analytics de la UCM!