Big data y Machine learning para economía aplicada
Esta microcredencial introduce las herramientas provenientes del Big Data y el Machine Learning para el uso en las ciencias sociales. Está dirigida a personas interesadas en la aplicación de estas herramientas para el análisis de datos grandes y no estructurados, y a aquellos interesados en la investigación aplicada.
A partir de la comprensión conceptual y la experiencia práctica, los estudiantes serán capaces de responder preguntas predictivas y causales en las ciencias sociales, con especial énfasis en la economía. A lo largo de la microcredencial los estudiantes ponen en práctica los conceptos teóricos adquiridos en aplicaciones sobre problemas reales utilizando encuestas de hogares, precios de propiedades, redes sociales, entre otras.
Al finalizar este proceso, obtendrás una Insignia digital que es una representación digital que se puede mostrar, acceder y verificar en línea. Incluye metadatos que brindan información detallada sobre la certificación que se otorga y que puede publicarse en redes sociales, plataformas profesionales de reclutamiento y empleos.
Las Microcredenciales son certificaciones que validan y reconocen una competencia, capacidad o habilidad específica, que se logra a través de un proceso formativo y que se verifica mediante evidencias y desempeños observables que cumplen con criterios previamente establecidos.
Competencia: Organizar y analizar datos anárquicos y espontáneos de gran escala, tipo y calidad para responder preguntas económicas y sociales, con especial énfasis en tareas predictivas utilizando los algoritmos del aprendizaje automático de máquinas.
El estudiante que curse y apruebe esta Microcredencial podrá homologar 4 créditos en la Maestría en Economía PEG, Maestría en Economía Aplicada – MEcA, la Especialización en Economía y programas ofrecidos por la Facultad de Economía. Para esta homologación, el estudiante deberá ser admitido a la Universidad de los Andes y cumplir con el Reglamento de Homologación y Validación de Materias, vigente al momento de realizar la solicitud.
Conoce la insignia digital que recibirás por aprobar esta microcredencial aquí.
Notas:
1. Los estudiantes regulares de la Universidad (estudiantes que estén cursando un pregrado o posgrado) no podrán inscribirse a través de la Dirección de Educación Continua a esta microcredencial. En caso de inscripción, la Dirección procederá con la devolución de esta.
Estos estudiantes podrán cursar esta microcredencial como parte de su semestre regular si aplica dentro del pensum del programa que estén cursando.
2. Esta Microcredencial de 4 créditos puede ser homologada en la Maestría en Economía PEG, Maestría en Economía Aplicada – MEcA y la Especialización en Economía y, programas ofrecidos por la Facultad de Economía.
3. Para realizar homologación, el estudiante deberá ser admitido a la Universidad de los Andes y cumplir con el Reglamento de Homologación y Validación de Materias, vigente al momento de realizar la solicitud.
Dirigido a
Esta microcredencial está dirigida a profesionales de programas cuantitativos (ingenierías, economía, matemáticas, administración, gobierno, entre otras), analistas de datos, y profesionales de cualquier disciplina que se encuentren interesados en el uso de herramientas de las herramientas de Big Data y Machine Learning para la solución de problemas de ciencias sociales y economía.
Se necesita experiencia en manejo de datos y en el software “R”. El curso se basará principalmente en “R”. Aquellos estudiantes sin experiencia en este software y con ganas y voluntad de aprender son bienvenidos a esta microcredencial previa consulta con el docente. ¡Estos programas (y todos) se aprenden utilizándolos!
Es necesario también contar conocimientos de grado de cálculo, estadística, álgebra lineal y econometría.
Objetivos
La microcredencial busca que los estudiantes sean capaces de organizar, relacionar, y analizar datos anárquicos y espontáneos de gran escala, tipo, y calidad para responder preguntas económicas y sociales, con especial énfasis en tareas predictivas.
1. Comprender las técnicas provenientes de la ciencia de datos, la ciencia computacional, y la estadística desde una visión de economistas.
2. Ser capaz de contrastar distintas técnicas econométricas y su conveniencia para contestar preguntas sociales y económicas.
3. Desarrollar habilidades técnicas para el manejo cuantitativo de datos que surgen de distintas fuentes: páginas web, encuestas, geoespaciales, texto, etc.
4. Desarrollar la capacidad manejar, analizar y sintetizar bases de datos con gran número de observaciones y variables para generar conclusiones y recomendaciones sobre preguntas relevantes a las ciencias sociales.
5. Aprender a manejar con fluidez distintas herramientas computacionales.
6. Capacidad de analizar críticamente los datos presentados, ya sean provenientes de textos académicos o de los ejercicios presentados en el cursado.
7. Trabajar y resolver situaciones en grupo.
8. Habilidad de exponer y defender el trabajo realizado.
Metodología
La microcredencial tiene una duración total de 192 horas distribuidas en 48 horas virtuales sincrónicas (24 horas con profesor magistral y 24 horas con profesor complementario) y 156 horas de trabajo asincrónico y autónomo del estudiante.
El tiempo de trabajo autónomo está contemplado para el estudio de recursos educativos digitales, la realización de talleres individuales o grupales y demás actividades relacionas con el curso. Estos tiempos serán gerenciados por los estudiantes y sus equipos de trabajo.
La metodología de la microcredencial combina lecturas, videos, clases magistrales y complementarias sincrónicas, quices y talleres.
La participación de los estudiantes es fundamental para sacar el mayor provecho del curso. Por lo tanto, se espera que los estudiantes asistan a todas las clases sincrónicas, lean y trabajen el material asignado asincrónico.
A su vez, los estudiantes realizarán quices individuales y trabajos prácticos grupales para evaluar su aprendizaje. Los talleres grupales harán especial énfasis especial en el análisis de datos reales, y la aplicación de metodologías especificas; ejemplos incluyen encuestas de hogares, precios de propiedades, datos de internet y redes sociales. Parte de la evaluación de los talleres estará dada por competencias de predicción entre los estudiantes.
Contenido
1. Introducción al aprendizaje estadístico: Predecir, explicar. Causalidad y predicción. Aprendizaje supervisado y no supervisado.
2. Regresión lineal. MCO. Propiedades numéricas. Teorema FWL. Sobreajuste. Métodos de resampleo y validación cruzada. Optimización. Modelos lineales, linealizables, y no lineales. Vecinos cercanos. Obtención de datos de la web: scraping y APIs.
3. Selección de modelos y regularización. Lasso y Ridge. Aplicaciones en inferencia causal.
4. Clasificación. Análisis discriminante. Clasificador de Bayes. Máxima verosimilitud. Regresión logística. Aprendizaje no Balanceado.
5. Árboles de decisión (CARTs). Bosques, Bagging, y Boosting. XGBoost, LightGBM, y Super Learners. Aplicaciones en inferencia causal.
6. Datos espaciales. Modelado de dependencia espacial, métodos no paramétricos y econometría espacial.
7. Texto como datos y aprendizaje no supervisado. Modelos de categorización de tópicos. Word Embeddings.
8. Introducción a aprendizaje profundo. Redes neuronales. Imágenes como datos.
Condiciones
Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.
La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.