Estructuración de proyectos de analítica
El curso presenta las principales metodologías utilizadas en la industria para la estructuración y ejecución de proyectos que involucran procesos de analítica de datos. El curso cubre cada una de las fases típicas de un proyecto de esta índole (comprensión del problema, comprensión de los datos, preparación de los datos, modelado, evaluación, y despliegue), proporcionando a los asistentes de las metodologías y herramientas necesarias para llevar a cabo satisfactoriamente cada una de dichas etapas. El curso se complementa con aplicaciones prácticas e implementación de algoritmos en el lenguaje de programación Python 3.Este curso hace parte del programa Programa Proyectos de analítica en Python. Ver más aquí.
Dirigido a
El curso está diseñado para directores y gerentes en contacto constante con datos estructurados y no estructurados de sus organizaciones. Está dirigido para los profesionales encargados de encontrar oportunidades para explotar la data y generar conocimiento a partir de ella, de modo que desarrollen las habilidades requeridas para diseñar y ejecutar exitosamente un proyecto que involucre procesos de analítica de datos. Se espera que los asistentes cuenten con conocimientos previos básicos del lenguaje de programación Python, y conceptos básicos de probabilidad y estadística.Objetivos
El curso tiene por objetivo presentar a los asistentes el ciclo de vida usual de un proyecto estándar de analítica de datos, así como las principales metodologías utilizados en cada una de estas etapas. Al finalizar el curso, se espera que sus asistentes desarrollen las siguientes habilidades:- Diseño, estructuración y planeación de proyectos de analítica de datos.
- Identificación de oportunidades y aplicación de técnicas de aprendizaje de máquinas.
- Preprocesamiento y estructuración de bases de datos.
- Principales modelos de aprendizaje supervisado y no supervisado.
- Métricas de evaluación de modelos.
- Implementación de algoritmos en Python.
- Despliegue y uso de resultados como insumo para la toma de decisiones.
Metodología
El curso se compone de sesiones teóricas en las que se presentan y desarrollan las principales herramientas y metodologías necesarias para ejecutar exitosamente cada fase que acarrea usualmente un proyecto estándar de analítica de datos. En adición, se discuten los principales retos y obstáculos que comúnmente se presentan en la ejecución de este tipo de proyectos y sus posibles soluciones. Finalmente, el curso se complementa con aplicaciones prácticas que consisten en el diseño e implementación de algoritmos y rutinas de código (en el lenguaje de programación Python 3) útiles para el preprocesamiento y estructuración de los datos, desarrollo de modelos de aprendizaje de máquinas, su evaluación y puesta en producción.Contenido
Sesión 1: Metodologías para el desarrollo de proyectos de Analítica de DatosSEMMA.
DMAMC.
CRISP-DM.
Sesión 2: Analítica descriptiva
Conceptos de estadística.
Visualización de datos.
Pruebas estadísticas (normalidad, significancia, diferencia de medias).
Sesión 3: Formulación del problema
Correlación vs. causalidad.
Análisis supervisado vs. no supervisado.
Sesgo vs. varianza.
Interpretabilidad vs. poder predictivo.
Sesión 4: Comprensión y Preprocesamiento de datos
Tipos de variables.
Datos estructurados y no estructurados.
Transformación de datos.
Detección de anomalías.
Sesión 5: Estructuración de bases de datos
Tipos de bases de datos.
Integración de bases de datos públicas.
APIs.
Web scrapping.
Sesión 6: Principales modelos de aprendizaje supervisado y no-supervisado
Modelos de regresión.
Modelos de clasificación.
Métricas de desempeño.
Reducción de dimensionalidad.
Métodos de agrupamiento.
Reglas de asociación.
Sesión 7: Presentación de resultados y despliegue
Interpretación.
Storytelling.
Herramientas de implementación
Condiciones
Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.
La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.