El machine learning no supervisado capacita a las máquinas para aprender patrones y estructuras complejas sin necesidad de datos etiquetados. Al no utilizar anotaciones que indiquen cuál es la salida correcta para los datos, estos algoritmos deben descubrir por sí mismos las estructuras o relaciones inherentes en estos. Este tipo de aprendizaje es esencial para identificar patrones útiles que puedan ser utilizados en la toma de decisiones en una amplia gama de campos y aplicaciones, y contribuye en la construcción de otros tipos modelos a partir de datos.
Este curso explora en profundidad las técnicas fundamentales del aprendizaje no supervisado, como la agrupación, la reducción de la dimensionalidad y la detección de anomalías. Al finalizar el curso el estudiante estará en capacidad de aplicar estas técnicas para desarrollar soluciones alineadas con problemas específicos y las características de los datos disponibles. Se guiará a los estudiantes a través del proceso de aprendizaje a partir de datos, capacitándolos para abordar diversos casos de estudio en actividades prácticas y así interactuar con una amplia gama de contextos de aplicación.
Plataforma virtual: Este curso hace parte de la Maestría en Inteligencia Artificial de la Universidad de los Andes en la plataforma Coursera.
Contexto requerido:
Se espera que el estudiante posea un dominio en temas sobre programación en Python, probabilidad y estadística y algebra lineal, y que haya cursado Principios de machine learning y Matemáticas para machine learning.
Horario*:
Martes de 17:30 a 18:50 hora Colombia*.
*Estos horarios están sujetos a modificaciones.
Metodología:
El estudiante estará guiado por profesores y tutores expertos en el área, y tendrán apoyo con tecnologías, herramientas e infraestructura computacional de última generación, ofreciendo una experiencia de aprendizaje superior. La experiencia de aprendizaje incluirá clases semanales en vivo con profesores a través de Zoom, ejercicios con compañeros y módulos semanales a través de video; el contenido interactivo consiste en evaluaciones en línea, trabajos en grupo, presentaciones en línea, y más. Los cursos incluyen lecturas complementarias, tareas y foros de discusión que ayudan a generar conexiones con sus compañeros.
Los estudiantes tendrán la oportunidad de interactuar directamente con profesores y tutores durante clases sincrónicas semanales, así como a través de horarios de consulta, correo electrónico y foros. Los trabajos, exámenes y proyectos serán guiados y evaluados por los profesores para asegurarse de mantener el rigor de los estudiantes y estos puedan recibir retroalimentación personalizada y constante.
Proyecto:
En este curso realizarás actividades prácticas para probar los conocimientos teóricos adquiridos.
Idioma: Los cursos serán ofrecidos 100% en español. Sin embargo, es recomendable que tengas un buen nivel de compresión de lectura en inglés, pues muchos contenidos académicos serán presentados en este idioma.
Créditos académicos: 2
*Podrás inscribirte a este curso bajo la categoría Extensión, los cursos bajo esta modalidad otorgan créditos y notas, por tanto, pueden ser homologables una vez el estudiante sea admitido a la Universidad, de acuerdo con el reglamento de estudiantes y de homologaciones. La aprobación de los cursos de extensión no garantiza el ingreso a ningún programa regular de la Universidad.
Si deseas homologar cursos vistos por extensión en el programa de maestría, se requiere que:
1. La nota final individual de cada curso sea superior a 3.00
2. El total de créditos del conjunto total de cursos a homologar no sea superior a 16.
Nota: si tiene inquietudes de tipo académico podrá comunicarse a maia@uniandes.edu.co
Este curso hace parte del portafolio de materias de pregrado y posgrado de la Universidad abiertas a todo público.
Al participar en este curso podrás vivir la experiencia Uniandina, acceder a contenidos de calidad, tomar clases con estudiantes regulares, acceder al sistema de bibliotecas de Uniandes y participar en las actividades culturales que esta Universidad te ofrece.
Objetivos
El objetivo general de este curso es promover las competencias necesarias para la construcción de soluciones efectivas utilizando las técnicas de machine learning no supervisado. En este camino sabrá identificar los contextos de aplicación que les son propicios, así como el impacto de los sesgos en el proceso de toma de decisiones basadas en datos. Se espera que al finalizar el curso el estudiante esté en capacidad de:
- Reconocer los contextos de aplicación de las tareas asociadas con el machine learning no supervisado.
- Aplicar técnicas de machine learning no supervisado para construir soluciones alineadas con los objetivos del problema bajo estudio y las características de los datos disponibles.
- Identificar los sesgos inherentes en el proceso de aprendizaje a partir de datos y su impacto en la toma de decisiones y la ética de machine learning.
Contenido
Semana 1:
Definición de ML no supervisado. Los tipos de aprendizaje no supervisado: agrupación, reducción de la dimensionalidad, detección de anomalías, análisis de asociación. Ejemplos de aplicaciones. Revisión del ciclo de machine learning. Exploración y preparación de los datos. Preparación de datos complejos, como textos e imágenes.
Semana 2:
La tarea de agrupación y sus aplicaciones. Conceptos básicos y aspectos de diseño. Métricas de evaluación para modelos de agrupación. Interpretación de modelos de agrupación. Métodos basados en prototipos. Los algoritmos K-medias y K-medoides.
Semana 3:
Otros algoritmos de agrupación. Algoritmos basados en densidad (ejemplo: DBSCAN). Los métodos jerárquicos (ejemplo, aglomerativos). Medidas de enlace. Evaluación de modelos de agrupación basados en densidad y jerárquicos. Algoritmos “híbridos”: clústering espectral, mean shift y basados en particiones soft (fuzzy c-means). Resumen de las técnicas de agrupación.
Semana 4:
Reducción de la dimensionalidad. Algunos métodos de reducción, por selección y por transformación. Métodos lineales. El análisis de componentes principales (PCA) y sus variantes. Métodos no lineales. Concepto de manifold. Visualización y el algoritmo t-SNE. Otros algoritmos no lineales.
Semana 5:
Reducción de la dimensionalidad. Análisis de textos. Preparación de textos con el esquema de bolsa de palabras (BOW). Las incrustaciones de palabras en el modelado. Resumen de las técnicas de reducción de la dimensionalidad.
Semana 6:
Detección de anomalías. ¿Qué son las anomalías? Tipos de anomalías. Relación con la clasificación en contextos de una clase. Anomalías y la detección de novedad. Proceso para su detección. Métodos no supervisados: agrupación, PCA, estadísticos, LOF y Elliptic Envelop. Otros métodos: Isolation Forest, one-class SVM. Evaluación de modelos de detección de anomalías.
Semana 7:
Métodos neuronales no supervisados. Introducción a las redes neuronales. Autocodificador y sus aplicaciones en la reducción de la dimensionalidad y detección de anomalías. Los mapas autoorganizativos y sus aplicaciones en la agrupación y visualización. Resumen de las técnicas de detección de anomalías.
Semana 8:
Sesgos en el proceso de ML y sus implicaciones en el desarrollo de proyectos basados en datos. Estudio de casos. Cierre del curso.
Condiciones
Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.
La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.