Los datos abiertos son aquellos que están a disposición pública sin restricciones de uso ni necesidad de permisos. Tampoco están sujetos a patentes de ningún tipo.

Se analizarán diversas fuentes de datos abiertos existentes en la actualidad, con un repaso a la tendencia creciente de permitir el acceso libre a datos tradicionalmente restringidos al ámbito corporativo y gubernamental.

El saber no únicamente acceder a esos datos sino también cómo tratarlos para sacar de ellos conclusiones interesantes y factores de valor que estén alineados con nuestros intereses, serán lo que realmente dote de una utilidad a este tipo de datos más allá del componente meramente informativo.

En cualquier caso, la apertura de los datos al gran público no está exenta de polémicas y posiciones encontradas. Elementos a tener en cuenta como el posible uso de información personal sobre individuos específicos o ciertos datos que puedan ser considerados sensibles de suponer una amenaza de seguridad si se dan a conocer (por poner dos ejemplos), son parte de un debate que genera interés y sobre el cual habrá que ver cómo evoluciona el mundo de los datos abiertos.

 

Entrando más en detalle en ciertos aspectos que se van a tratar en este módulo, encontramos:

– Open data gubernamental, con las tendencias en gobierno abierto, participación y transparencia. Se expondrá a través de ejemplos el cambio que se está experimentando en muchas instituciones públicas que previamente restringían el acceso a sus datos y actualmente, bajo la premisa de actuar bajo una mayor transparencia por su parte, facilitan parte de la información de la cual disponen, tradicionalmente de uso interno, para su consulta pública.
– Otras fuentes de datos abiertos, identificando las principales fuentes, incluidas las no gubernamentales (APIs).
– Fuentes de algoritmos abiertos: Los concursos (en especial Kaggle) son una fuente de acceso a algoritmos de última generación.
– Ejemplos de código reproducible.

Profesores del módulo

Luis Fernando

Llana Díaz

Profesor titular en la UCM

Luis es profesor de la Universidad Complutense de Madrid desde hace más de veinte años. Dirige estudios de Big Data y Análisis de Datos con Hadoop y Spark en la UCM, e igualmente ha estado a cargo del grupo de investigación universitario Design and Testing of Reliable Systems.

Santiago

Mota Herce

Corporate Advisor

Consultor freelance para empresas del calibre de Bankia, Vodafone, Teradata o The Boston Consulting Group. Está especializado en inteligencia de negocio, estrategia y Machine Learning, lo que le dota de una amplia visión del Big Data a nivel empresarial.

¿Te interesa?