En esta asignatura se aprenderá cómo realizar aplicaciones para afrontar la explotación de gran cantidad de datos provenientes de diferentes fuentes de datos. Se conocerá cuando es necesario utilizar tecnologías de Big Data, qué tecnologías existen para consultar, analizar y visualizar conocimiento extraído de los datos.

Módulo: Ingeniería de Datos

5 ECTS

Tecnologías utilizadas:

Ecosistema Hadoop (HDFS, Hive, Sqoop, Pig), Nifi, Apache Zeppelin, Apache Spark (Spark SQL, MLlib, Spark Streaming, GraphX)

Impartido por:
María Teresa Gómez López (Universidad de Sevilla - Lenguajes y Sistemas Informáticos)

María Teresa Gómez López es profesora doctora del departamento de Lenguajes y Sistemas Informáticos de la Escuela de Ingeniería Informática de la Universidad de Sevilla. En los últimos 10 años ha participado en formación sobre gestión de la información en titulaciones de grado, másteres, cursos de postgrado y escuelas de verano. Es Investigadora Principal del grupo de investigación IDEA, donde coordina proyectos de investigación relacionados con Big Data. Además, tiene experiencia en proyectos privados sobre gestión de grandes volúmenes de información en el sector eléctrico, aeronáutico, gestión documental y turismo.

María del Mar Martínez (Universidad de Sevilla - Lenguajes y Sistemas Informáticos)

María del Mar Martínez Ballesteros es profesora doctora del departamento de Lenguajes y Sistemas Informáticos de la Escuela de Ingeniería Informática de la Universidad de Sevilla. Tiene experiencia docente sobre análisis de datos en titulaciones de grado, análisis de grandes volúmenes de datos en master, así como ciencia de datos en cursos de posgrado. Sus líneas de investigación se han centrado en la extracción de conocimiento en grandes volúmenes de datos (Big Data) en diferentes dominios participando en varios proyectos nacionales y privados. También posee la Certificación Oficial de Cloudera Certified Developer for Apache Hadoop (CCDH).