Machine Learning para Business intelligence (Grupo 2)

Curso

Machine Learning para Business intelligence (Grupo 2)

Facultad de Economía
Home / Programs / Machine Learning para Business intelligence (Grupo 2)

Machine Learning y Business Intelligence

Este curso trata las metodologías más famosas de machine learning (aprendizaje de máquinas) y sus aplicaciones orientadas a business intelligence. Se va a cubrir la teoría y el código en Python de cada una de las técnicas estudiadas, entre las cuales se encuentran análisis supervisado, no supervisado, introducción a aprendizaje profundo y, finalmente, desarrollo de aplicaciones para el despliegue de resultados en Dash. Se enfatizará en el análisis de los resultados obtenidos en cada modelo, técnicas tradicionales para mejorar su desempeño y comprensión de supuestos para hacer conclusiones acertadas sobre el negocio en cuestión. Al final de este curso los estudiantes podrán desarrollar proyectos de principio a fin de ciencia de datos, desde la formulación de preguntas, limpieza de datos, modelación, extracción de patrones en los datos, y generación de reportes y creación de simples aplicaciones.

Importante: Se espera que los estudiantes tengan conocimientos básicos de programación en Python.
 

This course is part of the Programa Proyectos de analítica en Python program. View more here.

Addressed to

El curso está dirigido a personas que deseen desarrollar y aprender habilidades analíticas a partir de modelos de aprendizaje estadístico, en particular los analistas que estén en contacto con los datos de sus organizaciones. Se espera que los estudiantes se familiaricen y mejoren sus habilidades en Python. Se espera que el curso sea tomado por personas en el entorno laboral que deseen generar un impacto positivo en sus organizaciones por medio de generación de valor agregado a partir de técnicas de Machine Learning. Por último, el curso les dará las herramientas necesarias para desarrollar proyectos de ciencia de datos dentro de sus respectivas organizaciones, llegando a crear y responder preguntas que le aporten al futuras acciones y decisiones de sus empresas. Los temas del curso cubren desde la realización de las preguntas interesantes de analítica, pasando por su desarrollo y finalmente el despliegue a través de creación de reportes y aplicaciones.

Importante: Se espera que los estudiantes tengan conocimientos básicos de programación en Python.

Goals

  • Enseñar a los conceptos básicos de Machine Learning.
  • Familiarizar a los estudiantes con Python y sus paquetes más famosos para la analítica.
  • Repasar los tipos de problemas y sus soluciones a partir de Machine Learning
  • Familiarizar a los estudiantes con la interpretación de resultados y los supuestos de cada modelo.
  • Enseñar la aplicación de los modelos más famosos de Machine Learning en Python.
  • Orientar los temas comprendidos en el curso a aplicaciones de BI.

Methodology

El curso se realizará en salas habilitadas para el uso de computadores y cada sesión estará dividida en dos módulos. A su vez, cada módulo estará dividido en dos partes, durante la primera parte de cada módulo el profesor introducirá la teoría e interpretabilidad de cada modelo. Posteriormente, en la segunda parte de la clase los estudiantes trabajaran en Python para desarrollar los temas enseñados en la primera parte, aplicados a un tema relacionado a business intelligence (segmentación de clientes, retención de afiliados, procesos operativos, …).
 

Content

Sesión 1: Conceptos estadísticos introductorios a Machine Learning
Análisis multivariado.
Análisis descriptivo.
Álgebra Lineal.
Probabilidad y estadística.
Sesión 2: Visualización, estructuración y preprocesamiento de datos
Tipos de datos.
Tratamiento de datos estructurados y no estructurados.
Limpieza e imputación de datos.
Teoría de visualización.
Tipos de gráficos.
Matplotlib y Plotly.
Sesión 3: Modelos de regresión y clasificación
Mínimos cuadrados ordinarios.
Regresión polinomial.
Árboles de regresión.
Métricas de evaluación: R-cuadrado, MSE, MAPE.
Regresión Logística.
Linear Discriminant Analysis
Regularización L1 y L2
Sesión 4 y 5: Modelos de Clasificación
K-Vecinos más cercanos.
SVM.
Árboles de clasificación.
Random Forest.
Boosting de árboles.
Métricas de evaluación: curva ROC, exactitud, precisión, sensibilidad, puntaje F1.
Sesión 6: Análisis no supervisado
Técnicas de reducción de dimensionalidad (PCA, MCA, …).
Detección de anomalías (Mixturas Gaussianas, One-class SVM, Isolation trees).
Reglas de asociación.
Análisis de clústeres.
Sesión 7: Minería de texto
Procesamiento de textos.
Expresiones regulares (regex).
Análisis descriptivo de textos.
Matriz término-documentos
Modelos de tópicos (Latent Dirichlet Allocation).
Análisis de sentimiento.
Modelos de clasificación a partir de textos.
Sesión 8: Introducción a Deep Learning
Introducción a Redes Neuronales.
Algoritmo de Backpropagation.
Optimizadores (Gradiente descendiente y estocástico, Adam, …).
Redes Convolucionales.
Redes Recurrentes.
Sesión 9: DASH
Creación de aplicaciones interactivas y despliegue de lo visto en el curso en Python.

Professors

Paula Rodríguez

Matemática e Ingeniera Industrial de la Universidad de Los Andes y actualmente Investigadora de Minería de Datos en Quantil. Trabajó en análisis de datos funcionales para sus proyectos de grado: "Regresión con Proyecciones Aleatorias para Datos Funcionales" y "Estudio del crecimiento de rosas desde el análisis de datos funcionales". En el 2018 fue asistente de investigación en la Universidad de Cornell donde desarrolló funciones para la implementación de Principal Analysis by Conditional Estimation (PACE) en datos funcionales para el paquete FDA de R junto con el profesor Giles Hooker. Como investigadora en Quantil ha desarrollado e implementado modelos de credit scoring para instituciones financieras y de estimación de demanda de productos masivos. Además, fue profesora asistente del curso de Minería de Datos y sus Aplicaciones de la maestría en Economía y profesora complementaria de Cálculo Integral y Álgebra Lineal en la Universidad de Los Andes. También fue Trainee de Ciencia de Datos en Data Pop Alliance donde desarrolló tutoriales en este mismo campo trabajando también con Web Scraping y datos espaciales.

Mateo Dulce Rubio

Economista y matemático de la Universidad de los Andes, y Magíster en Economía de la misma universidad, título en que obtuvo el grado Cum Laude. Se ha desempeñado como profesor asistente en la Universidad de los cursos de Cálculo integral y ecuaciones diferenciales, Álgebra lineal, y Macroeconomía y finanzas internacionales. En adición, fue asistente de investigación en la Facultad de Economía en el estudio de sistemas dinámicos para modelar el comportamiento criminal en Bogotá. En la actualidad se desempeña como director del área de Minería de Datos en Quantil | Matemáticas Aplicadas, donde se dedica al diseño, desarrollo e implementación de modelos matemáticos y de aprendizaje automático para la resolución de problemas prácticos de la industria, el gobierno, y la academia. Cuenta con amplia experiencia en minería de texto y procesamiento del lenguaje natural trabajando en el desarrollo de algoritmos para la extracción de información de textos, análisis de sentimiento, construcción de tópicos de conversación, y aprendizaje de máquinas en documentos jurídicos, contratos, redes sociales, entre otros. Ha sido el desarrollador líder en la implementación de modelos de matemáticas aplicadas a la seguridad ciudadana para la predicción de puntos calientes, ubicación de nuevos equipamientos policiales, y priorización de sistemas de videovigilancia. Adicionalmente, ha implementado modelos de análisis estadístico para la predicción de desafiliación de clientes bancarios, análisis espacial y de aparición y progresión de enfermedades de alto costo en Colombia, análisis de datos de transporte público para métricas de desempeño de los operadores, entre otros.

Johan Felipe García Vargas

Matemático y magíster en matemáticas de la Universidad Nacional. Candidato a doctor en la Universidad de los Andes. Se ha desempeñado como docente por más de 7 años en las universidades: Nacional, de Antioquia y de los Andes, entre otras. En matemáticas puras tiene interés en lógica, álgebra y teoría de categorías; su tesis doctoral estudia una generalización de la teoría de Galois a grupos cuánticos. En matemáticas aplicadas tiene interés por el análisis estadístico, la programación funcional, el procesamiento de imágenes y la minería de datos. Actualmente se desempeña como investigador en Quantil, donde ha desarrollado proyectos como: modelos de minería de texto sobre diagnósticos de cáncer, modelos de scoring para predecir probabilidad de impago de facturas, priorización y diagnóstico de necesidades de analítica en entidades, entre otros.

Conditions

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.