Estructuración de proyectos de analítica (Grupo 2)

Curso

Estructuración de proyectos de analítica (Grupo 2)

Facultad de Economía
Inicio / Programas / Estructuración de proyectos de analítica (Grupo 2)

Estructuración de proyectos de analítica

El curso presenta las principales metodologías utilizadas en la industria para la estructuración y ejecución de proyectos que involucran procesos de analítica de datos. El curso cubre cada una de las fases típicas de un proyecto de esta índole (comprensión del problema, comprensión de los datos, preparación de los datos, modelado, evaluación, y despliegue), proporcionando a los asistentes de las metodologías y herramientas necesarias para llevar a cabo satisfactoriamente cada una de dichas etapas. El curso se complementa con aplicaciones prácticas e implementación de algoritmos en el lenguaje de programación Python 3.
 

Este curso hace parte del programa Programa Proyectos de analítica en Python. Ver más aquí.

Dirigido a

El curso está diseñado para directores y gerentes en contacto constante con datos estructurados y no estructurados de sus organizaciones. Está dirigido para los profesionales encargados de encontrar oportunidades para explotar la data y generar conocimiento a partir de ella, de modo que desarrollen las habilidades requeridas para diseñar y ejecutar exitosamente un proyecto que involucre procesos de analítica de datos. Se espera que los asistentes cuenten con conocimientos previos básicos del lenguaje de programación Python, y conceptos básicos de probabilidad y estadística. 
 

Objetivos

El curso tiene por objetivo presentar a los asistentes el ciclo de vida usual de un proyecto estándar de analítica de datos, así como las principales metodologías utilizados en cada una de estas etapas. Al finalizar el curso, se espera que sus asistentes desarrollen las siguientes habilidades:
  • Diseño, estructuración y planeación de proyectos de analítica de datos.
  • Identificación de oportunidades y aplicación de técnicas de aprendizaje de máquinas.
  • Preprocesamiento y estructuración de bases de datos.
  • Principales modelos de aprendizaje supervisado y no supervisado.
  • Métricas de evaluación de modelos.
  • Implementación de algoritmos en Python.
  • Despliegue y uso de resultados como insumo para la toma de decisiones.

Metodología

El curso se compone de sesiones teóricas en las que se presentan y desarrollan las principales herramientas y metodologías necesarias para       ejecutar exitosamente cada fase que acarrea usualmente un proyecto estándar de analítica de datos. En adición, se discuten los principales retos y obstáculos que comúnmente se presentan en la ejecución de este tipo de proyectos y sus posibles soluciones. Finalmente, el curso se complementa con aplicaciones prácticas que consisten en el diseño e implementación de algoritmos y rutinas de código (en el lenguaje de programación Python 3) útiles para el preprocesamiento y estructuración de los datos, desarrollo de modelos de aprendizaje de máquinas, su evaluación y puesta en producción.
 

Contenido

Sesión 1: Metodologías para el desarrollo de proyectos de Analítica de Datos
SEMMA.
DMAMC.
CRISP-DM.
Sesión 2: Analítica descriptiva
Conceptos de estadística.
Visualización de datos.
Pruebas estadísticas (normalidad, significancia, diferencia de medias).
Sesión 3: Formulación del problema
Correlación vs. causalidad.
Análisis supervisado vs. no supervisado.
Sesgo vs. varianza.
Interpretabilidad vs. poder predictivo.
Sesión 4: Comprensión y Preprocesamiento de datos
Tipos de variables.
Datos estructurados y no estructurados.
Transformación de datos.
Detección de anomalías.
Sesión 5: Estructuración de bases de datos
Tipos de bases de datos.
Integración de bases de datos públicas.
APIs.
Web scrapping.
Sesión 6: Principales modelos de aprendizaje supervisado y no-supervisado
Modelos de regresión.
Modelos de clasificación.
Métricas de desempeño.
Reducción de dimensionalidad.
Métodos de agrupamiento.
Reglas de asociación.
Sesión 7: Presentación de resultados y despliegue
Interpretación.
Storytelling.
Herramientas de implementación

Profesores

Juan Sebastián Moreno Pabón.

Economista y Magíster en Economía de la Universidad de los Andes. Se desempeña como profesor magistral del Taller de R en la misma universidad y de Economía Matemática en la Universidad del Rosario. Además, ha servido como profesor complementario para los cursos de Macroeconomía 3, Pensando Problemas y de Econometría y el aprendizaje de máquinas. Trabajó en el Ministerio de Hacienda y Crédito Público en temas de riesgo sobre los pasivos de la nación. Se desempeñó como investigador en el CESED (Centro de Estudios sobre Seguridad y Drogas) de la Universidad de los Andes donde se especializó en temas de cultivos de coca y sus determinantes. Actualmente trabaja como investigador senior en Quantil (www.quantil.co) donde trabaja sobre temas de Machine Learning, procesamiento del lenguaje natural y Deep Learning. Entre sus intereses se encuentran las matemáticas aplicadas y minería de datos aplicada a políticas públicas. Ha trabajado en proyectos de predicción de desafiliación de clientes de cooperativas, modelos de minería de texto aplicados a documentos legales y redes sociales, predicción de admisiones en urgencias hospitalarias, análisis espacial para la ubicación de nuevos equipamientos policiales, modelos de segmentación y detección de anomalías para entidades financieras, creación de bases de datos estructuradas a partir de textos, análisis de datos de transporte público para métricas de desempeño y evaluaciones de impacto de regulaciones estatales entre otros. Actualmente se encuentra investigando modelos predictivos de crimen de Deep Learning a partir de imágenes.

Mateo Dulce Rubio

Economista y matemático de la Universidad de los Andes, y Magíster en Economía de la misma universidad, título en que obtuvo el grado Cum Laude. Se ha desempeñado como profesor asistente en la Universidad de los cursos de Cálculo integral y ecuaciones diferenciales, Álgebra lineal, y Macroeconomía y finanzas internacionales. En adición, fue asistente de investigación en la Facultad de Economía en el estudio de sistemas dinámicos para modelar el comportamiento criminal en Bogotá. En la actualidad se desempeña como Director del área de Minería de Datos en Quantil | Matemáticas Aplicadas, donde se dedica al diseño, desarrollo e implementación de modelos matemáticos y de aprendizaje automático para la resolución de problemas prácticos de la industria, el gobierno, y la academia. Cuenta con amplia experiencia en minería de texto y procesamiento del lenguaje natural trabajando en el desarrollo de algoritmos para la extracción de información de textos, análisis de sentimiento, construcción de tópicos de conversación, y aprendizaje de máquinas en documentos jurídicos, contratos, redes sociales, entre otros. Ha sido el desarrollador líder en la implementación de modelos de matemáticas aplicadas a la seguridad ciudadana para la predicción de puntos calientes, ubicación de nuevos equipamientos policiales, y priorización de sistemas de videovigilancia. Adicionalmente, ha implementado modelos de análisis estadístico para la predicción de desafiliación de clientes bancarios, análisis espacial y de aparición y progresión de enfermedades de alto costo en Colombia, análisis de datos de transporte público para métricas de desempeño de los operadores, entre otros.

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.