Machine learning en R y principios de inteligencia artificial

Curso

Machine learning en R y principios de inteligencia artificial

Facultad de Economía
Inicio / Programas / Machine learning en R y principios de inteligencia artificial

Machine learning en R y principios de inteligencia artificial

En este curso se estudiarán las metodologías más famosas de Machine Learning (aprendizaje de máquinas) y sus aplicaciones. Se cubrirá la teoría y el código en R de cada una de las técnicas estudiadas, entre las cuales se encuentran modelos supervisados y no supervisados para el análisis predictivo. Se enfatizará en el análisis de los resultados obtenidos en cada modelo, técnicas tradicionales para mejorar su desempeño y comprensión de supuestos para hacer conclusiones acertadas. Al final de este módulo los estudiantes podrán entender proyectos de ciencia de datos desde la formulación de preguntas, limpieza de datos, modelación, extracción de patrones en los datos. 

En el módulo de inteligencia artificial (IA) los estudiantes obtendrán un contexto general de las aplicaciones y propiedades del estado del arte en la IA contemporánea, sus potenciales de aplicación y limitaciones. En esta parte del curso, en lugar de programar, vamos a explorar las formas en que la IA es útil en diferentes contextos, de modo que los estudiantes puedan desarrollar la competencia de asociar problemas con técnicas de solución, conociendo las nociones básicas.

Nota: se sugiere que el estudiante interesado en el curso cuente con un computador de 4GB de RAM pero preferiblemente 8GB en adelante. El software que usará es R y RStudio. Las instrucciones de instalación serán remitidas al inicio del programa.
 

Dirigido a

El curso está dirigido a personas que deseen desarrollar y aprender habilidades analíticas a partir de modelos de aprendizaje estadístico. En particular los analistas que estén en contacto con los datos de sus organizaciones. Se busca que los estudiantes mejoren sus habilidades en R. Se espera que el curso sea tomado por personas en el entorno laboral que deseen generar un impacto positivo en sus organizaciones por medio de generación de valor agregado a partir de técnicas de Machine Learning. Por último, el curso les dará las herramientas necesarias para desarrollar proyectos de ciencias de datos dentro de sus respectivas organizaciones para crear y responder preguntas que aporten a futuras acciones y decisiones en sus empresas. Los temas del curso cubren desde el planteamiento de las preguntas interesantes de analítica hasta su desarrollo.  

Importante: Se espera que los estudiantes tengan conocimientos de programación en R tales como la definición de variables, manejo de condicionales (if, else), ciclos de código iterado (for loop), carga de bases de datos en DataFrames, exploración básica de los datos mediante estadísticas descriptivas (media, varianza, etc.) y selección de columnas o filas. Además, que tengan familiaridad con el entorno de programación RStudio, sus componentes y la instalación de librerías o paquetes adicionales. 
 

Objetivos

•    Enseñar los conceptos básicos de Machine Learning.
•    Exponer a los estudiantes a los paquetes más famosos para la analítica en R.
•    Repasar los tipos de problemas y sus soluciones a partir de Machine Learning
•    Familiarizar a los estudiantes con la interpretación de resultados y los supuestos de cada modelo.
•    Enseñar la aplicación de los modelos más famosos de Machine Learning en R.
•    Orientar los temas comprendidos en el curso a aplicaciones de BI.
•    Reconocer las diferencias entre las ramas de la inteligencia artificial contemporánea.
•    Entrenar para identificar situaciones en las organizaciones para las cuales la inteligencia artificial puede resolver o mejorar el desempeño relacionado a algún reto o problema.
•    Proponer técnicas o aproximaciones a retos concretos con una comprensión general de referentes y casos de estudio pertinentes.
 

Metodología

El curso se realizará de manera virtual con sesiones sincrónicas y se divide en dos módulos: ML e IA.  En el módulo de ML, cada sesión estará dividida en dos partes. Durante la primera parte el profesor introducirá la teoría e interpretación de cada modelo y en la segunda parte los estudiantes trabajarán en R para desarrollar los temas aprendidos aplicándolos a un tema relacionado con business intelligence. En el módulo de inteligencia artificial (IA) las sesiones intercalan presentaciones y experiencias interactivas, como demostraciones en vivo, sondeos y discusiones. 

Al final de cada módulo, se desarrollará un taller corto con el objetivo de aprender a identificar retos en las organizaciones de los participantes. La idea es que los estudiantes puedan llevarse estas metodologías para trabajar por su cuenta y comenzar a observar aplicaciones del Machine Learning y la inteligencia artificial en su entorno.
 

Contenido

Módulo de Machine Learning – 21 horas 

Sesión 1: Conceptos estadísticos introductorios a Machine Learning
•    Principios de Machine Learning
•    Repaso: Álgebra Lineal, probabilidad y estadística

Sesión 2: Visualización, estructuración y preprocesamiento de datos

•    Tipos de datos
•    Tratamiento de datos estructurados y no estructurados
•    Limpieza e imputación de datos
•    Tipos de gráficos
•    Visualización

Sesión 3: Predicción y Modelos de regresión

•    Análisis predictivo
•    Regresión lineal y polinomial
•    Regularización L1 y L2 
•    Red elástica
•    Regresión logística

Sesión 4: Modelos de clasificación
•    KNN
•    LDA
•    SVM
•    Árboles de clasificación
•    Random Forest y Boosting

Sesión 5: Métricas de evaluación
•    Predicción dentro/fuera de muestra
•    Métricas de evaluación para regresión: R-cuadrado, MSE, MAPE
•    Métricas de evaluación para clasificación: curva ROC, exactitud, precisión, sensibilidad, puntaje F1
•    Sobre-ajuste y validación cruzada

Sesión 6: Análisis no supervisado

•    Reducción de dimensionalidad
•    Medidas de similitud
•    Análisis de clústeres
•    K-medias 
•    Agrupamiento jerarquizado

Sesión 7: Minería de texto

•    Procesamiento de textos.
•    Expresiones regulares (regex).
•    Análisis cuantitativo de textos.
•    Estrategias de selección
•    Matriz término-documentos
•    Modelos de clasificación a partir de textos.

Módulo de principios de Inteligencia Artificial - 6 horas 

Sesión 8: IA: en qué mundo vivimos
•    Aprendizaje de máquinas vs inteligencia artificial vs aprendizaje profundo (deep learning). Una definición de los campos.
•    Los mitos de la inteligencia artificial (presentación con sondeos y discusión).
•    Donde estamos: IA débil vs IA fuerte. El futuro de la IA. Los riesgos éticos, sesgos y seguridad en el largo plazo. 

IA predice el futuro: es precisa, es eficiente
•    Personajes de juegos inteligentes. Autonomía en carros que se conducen solos. Aprendizaje por refuerzo.
•    Agricultura, predicciones y optimización de procesos bajo incertidumbre.
•    Aplicaciones en robótica, visión por computador. Robots de alta precisión.

Sesión 9: IA es capaz de procesar grandes cantidades de información

•    Un poco de arte. La inteligencia artificial en procesos creativos. Redes generativas.
•    AI para el mercadeo.

IA automatiza cosas

•    Red neuronal recursiva: predicción de lenguaje, aplicaciones en soporte al cliente.
•    Procesamiento de lenguaje natural: texto a voz, síntesis de lenguaje. Asistentes artificiales.

Pensemos en IA
•    Taller: identificando retos con IA en nuestras organizaciones.
•    Reflexión final. Clasificación de enfermedades oculares donde no hay médicos suficientes.
 

Profesores

Jacob Muñoz

Economista con opción en Matemáticas y Magíster en Economía de la Universidad de los Andes. Trabaja como científico de datos en la Subdirección de Mecanismos de Resolución de Fogafín, donde ha llevado a cabo al sistematización y estandarización de reportes frecuentes relacionados con el Formato de Depósitos Individuales. Allí ha trabajado también en la implementación de métodos de agrupación de aprendizaje de máquinas para la predicción de la trayectoria de largo plazo de crecimiento de depósitos del sistema financiero. Actualmente se encuentra implementando modelos de aprendizaje de máquinas en la detección de depositantes informados a un proyecto de determinación de cobertura óptima de esquemas de seguro de depósitos y participa en el proyecto de detección de inconsistencias de documentos de identidad para la mitigación de riesgo operativo en las dispersiones de pagos. Completó Data Science and Data Engineering Bootcamp de DSD en Washington D.C. En el momento, es también profesor asistente del curso Big Data and Machine Learning for Applied Economics y profesor complementario del curso Microeconomía Avanzada, ambos en la Universidad de los Andes.

Alfredo Eleazar Orozco Quesada

Economista de la Universidad de los Andes. Profesional de relaciones corporativas y nuevos negocios en la Fundación Panamericana para el Desarrollo. Desarrollador y consultor con experiencia en diseño de soluciones tecnológicas, de entrenamiento corporativo y estratégicas en organizaciones privadas y no gubernamentales. Proyectos previos incluyen plataformas web (servidores y clientes) para la recolección de datos en procesos de investigación científica, diseño e implementación de espacios virtuales online, y aplicaciones Android. Experiencia docente en microeconomía, programación e inteligencia artificial. Página web: https://www.alfredo-orozco.co/

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.