Programa
Máster Big Data, Data Science & Inteligencia Artificial
Máster formación permanente de la Universidad Complutense de Madrid
Máster Edición 2024-2025
Módulo I: GNU/Linux y Git
El entorno de trabajo con Linux y Git, conocimiento esencial para preparar a los estudiantes en el uso de herramientas fundamentales para la gestión de proyectos y el análisis de datos a gran escala.
Módulo II: Bases de Datos SQL
Diseño y modelización de base de datos y lenguaje de consulta estructurada, más conocido como SQL (Structured Query Language). El modelo entidad-relación, el modelo relacional, la implementación relacional con SQL.
Módulo III: Business Intelligence con Tableau
Introducir al concepto de Business Intelligence, diferenciando éste, del concepto de Machine Learning o de Data Science, su relación con los nuevos paradigmas de Big Data. Para pasar a un enfoque completamente práctico en el que el alumno aprenderá a utilizar Tableau.
Módulo IV: Programación Python
Características, tipos de datos, estructuras de control de flujo, funciones, parámetros, manipulación de cadenas, estructuras de datos…
Módulo V: Bases de datos NoSQL
Se aprenderá a utilizar y modelar los sistemas de gestión de bases de datos noSQL y sus principales operaciones. Introducción a MongoDB, operaciones CRUD, dominar el Find o proyectar los campos en resultados de búsqueda.
Módulo VI: Fundamentos de estadística
Consolidación de conocimientos de estadística necesarios para formar una base que ayudan a seguir el resto de bloques del máster. Entre los conceptos a tratar: estadística descriptiva, probabilidad e inferencia tendrán un destacado espacio.
Módulo VII: Minería de datos y modelización predictiva
A lo largo de este bloque, los alumnos adquirirán los conceptos necesarios para el desarrollo de la modelización predictiva. Para ello, detectarán patrones basados en grandes volúmenes de datos, a través de diversas técnicas de Data Mining.
Módulo VIII: Machine Learning
El Deep Learning es una rama de la inteligencia artificial que utiliza redes neuronales artificiales para aprender y realizar tareas complejas.
En este módulo los estudiantes aprenderán técnicas de Deep Learning, incluyendo la arquitectura y funcionamiento de las redes neuronales.
Módulo IX: Visualización avanzada
Aprenderán acerca de las visualizaciones para comunicar y para confundir. Se explorarán herramientas para visualización de datos con librerías como matplotlib y seaborn, entre otras, y se discutirá la gramática de los gráficos, la cual es importante para la comprensión de cómo se construyen y comunican los gráficos.
Módulo X: Inteligencia Artificial con Deep Learning
Introducción y fundamentos de las redes neuronales. Descubre cómo las redes convolucionales (CNN) revolucionan el procesamiento de imágenes y cómo las redes recurrentes (RNN) optimizan la predicción de series temporales. Este módulo también introduce el fascinante mundo de la Inteligencia Artificial Generativa, explorando aplicaciones avanzadas en procesamiento de lenguaje natural (NLP), los últimos avances en Modelos de Lenguaje de Gran Escala (LLMs). Además, se abordarán los modelos generativos y su capacidad para crear contenido.
Módulo XI: Hadoop y Spark
Tras describir el manejo de HDFS (Hadoop Distributed File System), el curso se centrará en Apache Spark, sin duda la tecnología más demandada para procesamiento de grandes volúmenes de datos. Se usará Dataproc de Google Cloud para desplegar un cluster de Spark.
Módulo XII: Tecnologías del Big Data
Internet de las Cosas como servicio, conectividad con fuentes de datos heterogéneas a través de brokers de mensajes y hubs con dispositivos, Hadoop, Spark y diversas técnicas de visualización y análisis de información por parte de los usuarios finales.
Módulo XIII: Productivizar un modelo
Productivizar un modelo es esencial para aplicar de manera adecuada los conocimientos adquiridos durante los anteriores módulos del máster, así como los modelos de machine learning de manera eficiente y efectiva en el mundo real.
Módulo XIV: Data science aplicada a la empresa
Visión integral de las empresas orientadas al dato, creación de equipos de científicos de datos y estructuración de un proyecto Data Science. Este módulo aborda igualmente aspectos de la comunicación personal con individuos, la pública ante grupos, y la mediática para audiencias.
Trabajo final Máster
Asimilados todos los conceptos previos, llega el momento de poner a prueba todos los conocimientos adquiridos en el máster. El alumno planteará una estrategia global de inteligencia de datos para una empresa, basándose en diferentes técnicas y software de apoyo de entre los existentes en el mercado.