Esta asignatura pretende presentar la disciplina de la ciencia de los datos, introducir conocimientos básicos de terminología y estadística, y el proceso asociado con el tratamiento y análisis de los datos. Nos centraremos en las fases iniciales del proceso, incluyendo el pre-procesamiento, análisis exploratorio, y visualización de los datos.

Módulo: Ingeniería de Datos

5 ECTS

Tecnologías utilizadas:

Lenguaje estadístico R, R-Studio, R-Markdown, Shiny

Impartido por:
Cristina Rubio (Universidad de Sevilla - Lenguajes y Sistemas Informáticos)

Investigadora en el área de Data Science con más de 10 años de experiencia. Su área de especialidad es la aplicación de técnicas inteligentes para el análisis de datos de origen biológico o médico, aunque ha colaborado en otros campos como el medio ambiente y ciencias de los materiales. Fruto de esta investigación ha publicado multitud de artículos en revistas de alto prestigio, dirigido proyectos nacionales y autonómicos con temática de Data Science y participado en contratos con empresas.

José Antonio Parejo (Universidad de Sevilla - Lenguajes y Sistemas Informáticos)

Investigador en el área de la ingeniería del software basado en búsqueda y la ingeniería del software empírica, con 7 años de experiencia como desarrollador, ingeniero software y jefe de proyectos. También ha realizado proyectos de transferencia de conocimiento en el área de análisis de datos y predicción de clicks para márketing digital.