Machine learning en R y principios de inteligencia artificial
En este curso se estudiarán las metodologías más famosas de Machine Learning (aprendizaje de máquinas) y sus aplicaciones. Se cubrirá la teoría y el código en R de cada una de las técnicas estudiadas, entre las cuales se encuentran modelos supervisados y no supervisados para el análisis predictivo. Se enfatizará en el análisis de los resultados obtenidos en cada modelo, técnicas tradicionales para mejorar su desempeño y comprensión de supuestos para hacer conclusiones acertadas. Al final de este módulo los estudiantes podrán entender proyectos de ciencia de datos desde la formulación de preguntas, limpieza de datos, modelación, extracción de patrones en los datos.En el módulo de inteligencia artificial (IA) los estudiantes obtendrán un contexto general de las aplicaciones y propiedades del estado del arte en la IA contemporánea, sus potenciales de aplicación y limitaciones. En esta parte del curso, en lugar de programar, vamos a explorar las formas en que la IA es útil en diferentes contextos, de modo que los estudiantes puedan desarrollar la competencia de asociar problemas con técnicas de solución, conociendo las nociones básicas.
Nota: se sugiere que el estudiante interesado en el curso cuente con un computador de 4GB de RAM pero preferiblemente 8GB en adelante. El software que usará es R y RStudio. Las instrucciones de instalación serán remitidas al inicio del programa.
Dirigido a
El curso está dirigido a personas que deseen desarrollar y aprender habilidades analíticas a partir de modelos de aprendizaje estadístico. En particular los analistas que estén en contacto con los datos de sus organizaciones. Se busca que los estudiantes mejoren sus habilidades en R. Se espera que el curso sea tomado por personas en el entorno laboral que deseen generar un impacto positivo en sus organizaciones por medio de generación de valor agregado a partir de técnicas de Machine Learning. Por último, el curso les dará las herramientas necesarias para desarrollar proyectos de ciencias de datos dentro de sus respectivas organizaciones para crear y responder preguntas que aporten a futuras acciones y decisiones en sus empresas. Los temas del curso cubren desde el planteamiento de las preguntas interesantes de analítica hasta su desarrollo.Importante: Se espera que los estudiantes tengan conocimientos de programación en R tales como la definición de variables, manejo de condicionales (if, else), ciclos de código iterado (for loop), carga de bases de datos en DataFrames, exploración básica de los datos mediante estadísticas descriptivas (media, varianza, etc.) y selección de columnas o filas. Además, que tengan familiaridad con el entorno de programación RStudio, sus componentes y la instalación de librerías o paquetes adicionales.
Objetivos
• Enseñar los conceptos básicos de Machine Learning.• Exponer a los estudiantes a los paquetes más famosos para la analítica en R.
• Repasar los tipos de problemas y sus soluciones a partir de Machine Learning
• Familiarizar a los estudiantes con la interpretación de resultados y los supuestos de cada modelo.
• Enseñar la aplicación de los modelos más famosos de Machine Learning en R.
• Orientar los temas comprendidos en el curso a aplicaciones de BI.
• Reconocer las diferencias entre las ramas de la inteligencia artificial contemporánea.
• Entrenar para identificar situaciones en las organizaciones para las cuales la inteligencia artificial puede resolver o mejorar el desempeño relacionado a algún reto o problema.
• Proponer técnicas o aproximaciones a retos concretos con una comprensión general de referentes y casos de estudio pertinentes.
Metodología
El curso se realizará de manera virtual con sesiones sincrónicas y se divide en dos módulos: ML e IA. En el módulo de ML, cada sesión estará dividida en dos partes. Durante la primera parte el profesor introducirá la teoría e interpretación de cada modelo y en la segunda parte los estudiantes trabajarán en R para desarrollar los temas aprendidos aplicándolos a un tema relacionado con business intelligence. En el módulo de inteligencia artificial (IA) las sesiones intercalan presentaciones y experiencias interactivas, como demostraciones en vivo, sondeos y discusiones.Al final de cada módulo, se desarrollará un taller corto con el objetivo de aprender a identificar retos en las organizaciones de los participantes. La idea es que los estudiantes puedan llevarse estas metodologías para trabajar por su cuenta y comenzar a observar aplicaciones del Machine Learning y la inteligencia artificial en su entorno.
Contenido
Módulo de Machine Learning – 21 horasSesión 1: Conceptos estadísticos introductorios a Machine Learning
• Principios de Machine Learning
• Repaso: Álgebra Lineal, probabilidad y estadística
Sesión 2: Visualización, estructuración y preprocesamiento de datos
• Tipos de datos
• Tratamiento de datos estructurados y no estructurados
• Limpieza e imputación de datos
• Tipos de gráficos
• Visualización
Sesión 3: Predicción y Modelos de regresión
• Análisis predictivo
• Regresión lineal y polinomial
• Regularización L1 y L2
• Red elástica
• Regresión logística
Sesión 4: Modelos de clasificación
• KNN
• LDA
• SVM
• Árboles de clasificación
• Random Forest y Boosting
Sesión 5: Métricas de evaluación
• Predicción dentro/fuera de muestra
• Métricas de evaluación para regresión: R-cuadrado, MSE, MAPE
• Métricas de evaluación para clasificación: curva ROC, exactitud, precisión, sensibilidad, puntaje F1
• Sobre-ajuste y validación cruzada
Sesión 6: Análisis no supervisado
• Reducción de dimensionalidad
• Medidas de similitud
• Análisis de clústeres
• K-medias
• Agrupamiento jerarquizado
Sesión 7: Minería de texto
• Procesamiento de textos.
• Expresiones regulares (regex).
• Análisis cuantitativo de textos.
• Estrategias de selección
• Matriz término-documentos
• Modelos de clasificación a partir de textos.
Módulo de principios de Inteligencia Artificial - 6 horas
Sesión 8: IA: en qué mundo vivimos
• Aprendizaje de máquinas vs inteligencia artificial vs aprendizaje profundo (deep learning). Una definición de los campos.
• Los mitos de la inteligencia artificial (presentación con sondeos y discusión).
• Donde estamos: IA débil vs IA fuerte. El futuro de la IA. Los riesgos éticos, sesgos y seguridad en el largo plazo.
IA predice el futuro: es precisa, es eficiente
• Personajes de juegos inteligentes. Autonomía en carros que se conducen solos. Aprendizaje por refuerzo.
• Agricultura, predicciones y optimización de procesos bajo incertidumbre.
• Aplicaciones en robótica, visión por computador. Robots de alta precisión.
Sesión 9: IA es capaz de procesar grandes cantidades de información
• Un poco de arte. La inteligencia artificial en procesos creativos. Redes generativas.
• AI para el mercadeo.
IA automatiza cosas
• Red neuronal recursiva: predicción de lenguaje, aplicaciones en soporte al cliente.
• Procesamiento de lenguaje natural: texto a voz, síntesis de lenguaje. Asistentes artificiales.
Pensemos en IA
• Taller: identificando retos con IA en nuestras organizaciones.
• Reflexión final. Clasificación de enfermedades oculares donde no hay médicos suficientes.
Condiciones
Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.
La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.