Machine learning y principios de inteligencia artificial

Curso

Machine learning y principios de inteligencia artificial

Facultad de Economía
Inicio / Programas / Machine learning y principios de inteligencia artificial
En este curso se estudiarán las metodologías más famosas de machine learning (aprendizaje de máquinas) y sus aplicaciones orientadas a responder preguntas de negocio (business intelligence). Se cubrirá la teoría y el código en R de cada una de las técnicas estudiadas, entre las cuales se encuentran modelos supervisado y no supervisado para el análisis predictivo. Se enfatizará en el análisis de los resultados obtenidos en cada modelo, técnicas tradicionales para mejorar su desempeño y comprensión de supuestos para hacer conclusiones acertadas sobre el negocio en cuestión. Al final de este curso los estudiantes podrán desarrollar proyectos de principio a fin de ciencia de datos, desde la formulación de preguntas, limpieza de datos, modelación, extracción de patrones en los datos, y generación de reportes y creación de simples aplicaciones. 

Nota: se sugiere que el estudiante interesado en el curso cuente con un computador de 4GB de RAM pero preferiblemente 8GB en adelante. El software que usará es R y RStudio. Las instrucciones de instalación serán remitidas al inicio del programa.

En el módulo de inteligencia artificial (IA) los estudiantes obtendrán un contexto general de las aplicaciones y propiedades del estado del arte en la IA contemporánea, sus potenciales de aplicación y limitaciones. En esta parte del curso no vamos a programar. Por el contrario, vamos a explorar las formas en que la IA es útil en diferentes contextos, de modo que los estudiantes puedan desarrollar la competencia de asociar problemas con técnicas se solución, conociendo las nociones básicas.
 

Dirigido a

El curso está dirigido a personas que deseen desarrollar y aprender habilidades analíticas a partir de modelos de aprendizaje estadístico, en particular los analistas que estén en contacto con los datos de sus organizaciones. Se espera que los estudiantes se familiaricen y mejoren sus habilidades en R. Se espera que el curso sea tomado por personas en el entorno laboral que deseen generar un impacto positivo en sus organizaciones por medio de generación de valor agregado a partir de técnicas de Machine Learning. Por último, el curso les dará las herramientas necesarias para desarrollar proyectos de ciencia de datos dentro de sus respectivas organizaciones, llegando a crear y responder preguntas que le aporten al futuras acciones y decisiones de sus empresas. Los temas del curso cubren desde la realización de las preguntas interesantes de analítica, pasando por su desarrollo y finalmente el despliegue a través de creación de reportes y aplicaciones. 

Importante: Se espera que los estudiantes tengan conocimientos básicos de programación en R.

Objetivos

•    Enseñar los conceptos básicos de Machine Learning.
•    Familiarizar a los estudiantes con R y sus paquetes más famosos para la analítica.
•    Repasar los tipos de problemas y sus soluciones a partir de Machine Learning
•    Familiarizar a los estudiantes con la interpretación de resultados y los supuestos de cada modelo.
•    Enseñar la aplicación de los modelos más famosos de Machine Learning en R.
•    Orientar los temas comprendidos en el curso a aplicaciones de BI.
•    Generar en los estudiantes las siguientes competencias asociadas a la IA:
•    Reconocer las diferencias entre las ramas de la inteligencia artificial contemporánea.
•    Identificar situaciones en las organizaciones para las cuales la inteligencia artificial puede resolver o mejorar el desempeño relacionado a algún reto o problema.
•    Proponer técnicas o aproximaciones a retos concretos con una comprensión general de referentes y casos de estudio pertinentes.
 

Metodología

El curso se realizará de manera virtual con sesiones sincrónicas y cada sesión estará dividida en dos módulos, los cuales a su vez estarán divididos en dos partes. Durante la primera parte de cada módulo el profesor introducirá la teoría e interpretabilidad de cada modelo. Posteriormente, en la segunda parte, los estudiantes trabajarán en R para desarrollar los temas aprendidos aplicándolos a un tema relacionado con business intelligence (segmentación de clientes, retención de afiliados, procesos operativos, entre otros).

Nota: se sugiere que el estudiante interesado en el curso cuente con un computador de 4GB de RAM pero preferiblemente 8GB en adelante. El software que usará es R y RStudio. Las instrucciones de instalación serán remitidas al inicio del programa.

En el módulo de inteligencia artificial se seguirá una metodología similar, salvo que no se programará. En lugar de esto, las sesiones intercalarán presentaciones y experiencias interactivas, como demostraciones en vivo, sondeos y discusiones. Al final del curso, se desarrollará un corto taller de co-creación con el objetivo de identificar un reto en la organización en particular que los estudiantes puedan llevarse para trabajar por su cuenta y que pueda beneficiarse de las metodologías de Machine Learning o inteligencia artificial.
 

Contenido

Módulo de Machine Learning – 24 horas 
Sesión 1: Conceptos estadísticos introductorios a Machine Learning
•    Análisis multivariado.
•    Análisis descriptivo.
•    Álgebra Lineal.
•    Probabilidad y estadística.
Sesión 2: Visualización, estructuración y preprocesamiento de datos
•    Tipos de datos.
•    Tratamiento de datos estructurados y no estructurados.
•    Limpieza e imputación de datos.
•    Tipos de gráficos.
•    Visualización: ggplot y plotly.
Sesión 3, 4 y 5: Modelos de regresión y clasificación
•    Mínimos cuadrados ordinarios.
•    Regresión polinomial.
•    Predicción dentro/fuera de muestra
•    Sobre-ajuste y validación cruzada
•    Métricas de evaluación: R-cuadrado, MSE, MAPE.
•    Regularización L1 y L2 
•    Red elástica
•    Regresión Logística.
•    Linear Discriminant Analysis
•    K-Vecinos más cercanos.
•    SVM.
•    Árboles de clasificación.
•    Random Forest.
•    Boosting de árboles.
•    Métricas de evaluación: curva ROC, exactitud, precisión, sensibilidad, puntaje F1.
Sesión 6: Análisis no supervisado
•    Técnicas de reducción de dimensionalidad (SVD,PCA)
•    Medidas de similaridad
•    Análisis de clústeres
•    K-medias 
•    Agrupamiento jerarquizado
Sesión 7: Minería de texto
•    Procesamiento de textos.
•    Expresiones regulares (regex).
•    Análisis cuantitativo de textos.
•    Estrategias de selección
•    Matriz término-documentos
•    Análisis de sentimiento.
•    Modelos de clasificación a partir de textos.
Sesión 8: Análisis de redes y análisis espacial
•    Redes y matriz de proximidad
•    Detección de comunidades
•    Descomposición de k-núcleos
•    Datos espaciales
•    Modelo de rezagos espaciales
Web scrapping y Markdown
•    Scrapping y sus reglas de juego
•    Analizando HTML 
•    Creación de informes en R Markdown y despliegue de lo visto en el curso en R
Módulo de principios de Inteligencia Artificial - 6 horas 
Sesión 9: IA: en qué mundo vivimos
•    Presentación – aprendizaje de máquinas vs inteligencia artificial vs aprendizaje profundo (deep learning). Una definición de los campos.
•    Discusión estructurada – Los mitos de la inteligencia artificial (presentación con sondeos y discusión).
•    Presentación – Donde estamos: IA débil vs IA fuerte. El futuro de la IA. Los riesgos éticos, sesgos y seguridad en el largo plazo. 
IA predice el futuro: es precisa, es eficiente
•    Demostración interactiva y presentación – Personajes de juegos inteligentes. Autonomía en carros que se conducen solos. Aprendizaje por refuerzo.
•    Presentación – Agricultura, predicciones y optimización de procesos bajo incertidumbre.
•    Presentación – Aplicaciones en robótica, visión por computadores. Robots de alta precisión.
Sesión 10: IA es capaz de procesar grandes cantidades de información
•    Presentación – Un poco de arte. La inteligencia artificial en procesos creativos. Redes generativas.
•    Presentación – AI para el mercadeo.
IA automatiza cosas
•    Demostración interactiva – Red neuronal recursiva: predicción de lenguaje, aplicaciones en soporte al cliente.
•    Presentación – Procesamiento de lenguaje natural: texto a voz, síntesis de lenguaje. Asistentes artificiales.
Pensemos en IA
•    Taller de co-creación – Identificando retos con IA en nuestra organización.
•    Comentario y discusión final – clasificación de enfermedades oculares donde no hay médicos suficientes.
 

Profesores

Jacob Muñoz

Economista con opción en Matemáticas y Magíster en Economía de la Universidad de los Andes. Trabaja como científico de datos en la Subdirección de Mecanismos de Resolución de Fogafín, donde ha llevado a cabo al sistematización y estandarización de reportes frecuentes relacionados con el Formato de Depósitos Individuales. Allí ha trabajado también en la implementación de métodos de agrupación de aprendizaje de máquinas para la predicción de la trayectoria de largo plazo de crecimiento de depósitos del sistema financiero. Actualmente se encuentra implementando modelos de aprendizaje de máquinas en la detección de depositantes informados a un proyecto de determinación de cobertura óptima de esquemas de seguro de depósitos y participa en el proyecto de detección de inconsistencias de documentos de identidad para la mitigación de riesgo operativo en las dispersiones de pagos. Completó Data Science and Data Engineering Bootcamp de DSD en Washington D.C. En el momento, es también profesor asistente del curso Big Data and Machine Learning for Applied Economics y profesor complementario del curso Microeconomía Avanzada, ambos en la Universidad de los Andes.

Alfredo Orozco Quesada

Economista de la Universidad de los Andes. Desarrollador web con experiencia en proyectos para facilitar la interacción entre individuos. Su principal interés radica en la innovación educativa ejecutada mediante el diseño de experiencia, el desarrollo tecnológico y la investigación rigurosa. Ha trabajado en la construcción de plataformas para la recolección de datos en procesos de investigación científica como experimentos comportamentales o aplicaciones android para trabajo de campo sin conexión a internet. Ha sido profesor asistente de microeconomía de la misma Universidad y ha liderado procesos de traducción académica para el proyecto CORE Economics. Actualmente, trabaja como asistente del Comité de Docencia de la Facultad de Economía de la Universidad de los Andes. Además, apoya los procesos de reacreditación y regsitro calificado de las maestrías y especializaciones ante el Ministerio de Educación Nacional en la misma Facultad.