Tecnologías del Big Data

El alumno aprenderá a descubrir y valorar oportunidades presentes en el día a día del ciudadano y de la empresa.

Internet de las cosas como servicio, conectividad con fuentes de datos heterogéneas a través de brókers de mensajes y hubs con dispositivos, Hadoop, Spark y diversas técnicas de visualización y análisis de información por parte de los usuarios finales. Aproximación a la aportación del IOT al mundo del macrodato.

Conectividad con fuentes de datos heterogéneas a través de bróker de mensajes y hubs con dispositivos
• ETL as a Service.
• Gobierno de los datos as a Service.
• Stream Analytics, CEP análisis en memoria en tiempo real en los eventos complejos as a Service.

Índice de contenidos

Hadoop:
• Introducción a Hadoop, entorno de trabajo que soporta diversas aplicaciones distribuidas bajo una licencia libre.
• Almacenamiento HDFS para grandes volúmenes de datos en Apache Hadoop
• Acceder a los datos almacenados en HDFS como si fuera una base de datos: introducción a HIVE

Spark
• Introducción a Spark, sistema de computación basado en el paradigma de Hadoop que destaca por su velocidad gracias al almacenamiento de datos en memoria
• Clúster de Spark
• Desarrollo de aplicaciones con Spark
• RDD, Datasets y transformaciones
• Spark Streaming

Tecnologías Big Data en Google Cloud

• Ingesta y procesamiento en batch: Cloud Dataproc
• Ingesta en streaming: Cloud PubSub
• Almacenamiento de ficheros: Google Cloud Storage
• Almacenamiento de datos: BigQuery
• Desarrollo y ejecución de pipelines: Cloud Data Fusion
• Visualización de datos: Cloud Data Studio
• Analítica avanzada de datos: Vertex AI
• Orquestación de datos: Cloud Composer
• Catálogo y gobierno del dato: Cloud Dataplex 

¿Te interesa?