Big data y Machine learning para economía aplicada

Microcredencial

Big data y Machine learning para economía aplicada

Facultad de Economía
Inicio / Programas / Big data y Machine learning para economía aplicada

Big data y Machine learning para economía aplicada

Este curso introduce las herramientas provenientes del Big Data y el Machine Learning para el uso en las ciencias sociales. Está dirigido a personas interesadas en la aplicación de estas herramientas para el análisis de datos grandes y no estructurados, y a aquellos interesados en la investigación aplicada. 

A partir de la comprensión conceptual y la experiencia práctica, los estudiantes serán capaces de responder preguntas predictivas y causales en las ciencias sociales, con especial énfasis en la economía. A lo largo del curso los estudiantes ponen en práctica los conceptos teóricos adquiridos en aplicaciones sobre problemas reales utilizando encuestas de hogares, precios de propiedades, redes sociales, entre otras.

Al finalizar este proceso, obtendrás una Insignia digital que es una representación digital que se puede mostrar, acceder y verificar en línea. Incluye metadatos que brindan información detallada sobre la certificación que se otorga y que puede publicarse en redes sociales, plataformas profesionales de reclutamiento y empleos.

Las Microcredenciales son certificaciones que validan y reconocen una competencia, capacidad o habilidad específica, que se logra a través de un proceso formativo y que se verifica mediante evidencias y desempeños observables que cumplen con criterios previamente establecidos.

Conoce la insignia digital que recibirás por aprobar esta microcredencial aquí.

Competencia: Organizar y analizar datos anárquicos y espontáneos de gran escala, tipo y calidad para responder preguntas económicas y sociales, con especial énfasis en tareas predictivas utilizando los algoritmos del aprendizaje automático de máquinas.

El estudiante que curse y apruebe esta Microcredencial podrá homologar 4 créditos en la Maestría en Economía PEG, Maestría en Economía Aplicada – MEcA, la Especialización en Economía y programas ofrecidos por la Facultad de Economía. Para esta homologación, el estudiante deberá ser admitido a la Universidad de los Andes y cumplir con el Reglamento de Homologación y Validación de Materias, vigente al momento de realizar la solicitud.

Dirigido a

Este curso está dirigido a profesionales de programas cuantitativos (ingenierías, economía, matemáticas, administración, gobierno, entre otras), analistas de datos, y profesionales de cualquier disciplina que se encuentren interesados en el uso de herramientas de las herramientas de Big Data y Machine Learning para la solución de problemas de ciencias sociales y economía.

Se necesita experiencia en manejo de datos y en el software “R”. El curso se basará principalmente en “R”. Aquellos estudiantes sin experiencia en este software y con ganas y voluntad de aprender son bienvenidos al curso previa consulta con el docente. ¡Estos programas (y todos) se aprenden utilizándolos!

Es necesario también contar conocimientos de grado de cálculo, estadística, álgebra lineal y econometría. 


Objetivos

El curso busca que los estudiantes sean capaces de organizar, relacionar, y analizar datos anárquicos y espontáneos de gran escala, tipo, y calidad para responder preguntas económicas y sociales, con especial énfasis en tareas predictivas.

1. Comprender las técnicas provenientes de la ciencia de datos, la ciencia computacional, y la estadística desde una visión de economistas. 

2. Ser capaz de contrastar distintas técnicas econométricas y su conveniencia para contestar preguntas sociales y económicas.

3. Desarrollar habilidades técnicas para el manejo cuantitativo de datos que surgen de distintas fuentes: páginas web, encuestas, geoespaciales, texto, etc. 

4. Desarrollar la capacidad manejar, analizar y sintetizar bases de datos con gran número de observaciones y variables para generar conclusiones y recomendaciones sobre preguntas relevantes a las ciencias sociales. 

5. Aprender a manejar con fluidez distintas herramientas computacionales. 

6. Capacidad de analizar críticamente los datos presentados, ya sean provenientes de textos académicos o de los ejercicios presentados en el cursado.

7. Trabajar y resolver situaciones en grupo. 

8. Habilidad de exponer y defender el trabajo realizado.


Metodología

El curso tiene una duración total de 192 horas distribuidas en 36 horas de trabajo sincrónico con el profesor y 156 horas de trabajo asincrónico y autónomo del estudiante.  

El tiempo de trabajo autónomo está contemplado para el estudio de recursos educativos digitales, la realización de talleres individuales o grupales y demás actividades relacionas con el curso. Estos tiempos serán gerenciados por los estudiantes y sus equipos de trabajo.

La metodología del curso combina lecturas, videos, clases magistrales y complementarias sincrónicas, quices y talleres. 

La participación de los estudiantes es fundamental para sacar el mayor provecho del curso. Por lo tanto, se espera que los estudiantes asistan a todas las clases sincrónicas, lean y trabajen el material asignado asincrónico. 

A su vez, los estudiantes realizarán quices individuales y trabajos prácticos grupales para evaluar su aprendizaje. Los talleres grupales harán especial énfasis especial en el análisis de datos reales, y la aplicación de metodologías especificas; ejemplos incluyen encuestas de hogares, precios de propiedades, datos de internet y redes sociales. Parte de la evaluación de los talleres estará dada por competencias de predicción entre los estudiantes.

Contenido

1. Introducción al aprendizaje estadístico: Predecir, explicar. Causalidad y predicción. Aprendizaje supervisado y no supervisado. 

2. Regresión lineal. MCO. Propiedades numéricas. Teorema FWL. Sobreajuste. Métodos de resampleo y validación cruzada. Optimización. Modelos lineales, linealizables, y no lineales. Vecinos cercanos. Obtención de datos de la web: scraping y APIs. 

3. Selección de modelos y regularización. Lasso y Ridge. Aplicaciones en inferencia causal.

4. Clasificación. Análisis discriminante. Clasificador de Bayes. Máxima verosimilitud. Regresión logística. Aprendizaje no Balanceado.

5. Árboles de decisión (CARTs). Bosques, Bagging, y Boosting. XGBoost, LightGBM, y Super Learners. Aplicaciones en inferencia causal.

6. Datos espaciales. Modelado de dependencia espacial, métodos no paramétricos y econometría espacial.

7. Texto como datos y aprendizaje no supervisado. Modelos de categorización de tópicos. Word Embeddings.

8. Introducción a aprendizaje profundo. Redes neuronales. Imágenes como datos.

Profesores

Ignacio Sarmiento-Barbieri

PhD en Economía de la Universidad de Illinois con especialización en Economía Urbana y Econometría. Realizó su postdoctorado en ciencia de datos en microeconomía aplicada en el Centro Nacional de Aplicaciones de Supercomputadoras (NCSA) de Estados Unidos. Actualmente es Profesor Asistente de la Facultad de Economía, miembro del programa de Catalistas del Berkeley Initiative for Transparency in the Social Sciences (BITSS) y profesor asociado del Centro de Investigación y Formación en Inteligencia Artificial. Su investigación combina herramientas econométricas tradicionales con avances en informática, big data, y aprendizaje automático para estudiar la economía pública y urbana. En particular, su interés está en la provisión de bienes públicos en ciudades de todo el mundo.

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.

Relacionados