Máquinas y científicos sociales: ¿Cómo usar el aprendizaje de máquinas a nuestro favor?

Curso

Máquinas y científicos sociales: ¿Cómo usar el aprendizaje de máquinas a nuestro favor?

Facultad de Ciencias Sociales
Inicio / Programas / Máquinas y científicos sociales: ¿Cómo usar el aprendizaje de máquinas a nuestro favor?

Modelos predictivos para ciencias sociales

Tarifas:

Con créditos académicos: 

*El valor del curso con créditos académicos es de $4.620.000 (COP) si te encuentras en Colombia.

*El valor del curso es de USD 1,390 si te encuentras en el exterior.

Para realizar el pago ingresa aquí.


Sin créditos académicos:

*El valor del curso sin créditos académicos es de $2.892.000 (COP) si te encuentras en Colombia.

*El valor del curso es de USD 880 si te encuentras en el exterior.

Para realizar el pago ingresa aquí.

Conoce como realizar tu pago aquí


Horarios: lunes, martes, miércoles, jueves y viernes 5:00 p.m. a 6:30 p.m. (hora Colombia). Sin clase el lunes 5 de julio y el martes 20 de julio de 2021.


Nota: los horarios y modalidad (virtual o semipresencial) de los cursos están sujetos a modificaciones de acuerdo a las disposiciones del Gobierno Nacional y Distrital para el manejo del COVID 19. Las fechas y horarios de las sesiones podrán ser consultados en mibanner.uniandes.edu.co


Los modelos predictivos son una de las herramientas centrales de la ciencia de datos, el “trabajo más sexy del siglo XXI.” Los modelos inferenciales, aquellos que se enseñan comúnmente, está enfocados en evaluar una relación simple entre un número limitado de predictores y una respuesta. Los modelos predictivos, en cambio, generan la mejor predicción posible para una respuesta dados unos datos. Con menos conocimiento a priori, los modelos predictivos permiten explorar nuevas hipótesis utilizando un mayor número de predictores y estructuras funcionales más complejas. Este curso provee una introducción a los modelos predictivos partiendo de qué son y para qué sirven en sociología, ciencia política y psicología. El curso cubre algunos de los modelos lineares y no lineares más populares en la academia y la industria. Lo/as estudiantes adquirirán las bases para entender, implementar y evaluar modelos predictivos. El énfasis es práctico—no teórico o matemático—y la implementación es en R. Para facilitar la transición desde otros softwares, el curso empieza con talleres sobre cómo limpiar y explorar datos en R y se estructura en torno a talleres prácticos.

Requisitos: estudiantes de posgrado con conocimientos básicos en métodos cuantitativos y conocimientos básicos de R.

Idioma: español.

Este curso hace parte del portafolio de materias de pregrado y posgrado de la Universidad  abiertas a todo público.

Al participar en este curso podrás vivir la experiencia Uniandina, acceder a contenidos de calidad, tomar  clases con estudiantes regulares, acceder al sistema de bibliotecas de Uniandes y participar en las actividades culturales que esta Universidad te ofrece.

Objetivos

Este curso busca:

  1. Que lo/as estudiantes entiendan qué son los modelos predictivos, cómo se diferencian de otros tipos de modelos y para qué sirven.
  2. Que lo/as estudiantes adquieran la capacidad de leer críticamente investigaciones que usan modelos predictivos.
  3. Que lo/as estudiantes se familiaricen con algunos de los modelos predictivos más comunes y útiles para las ciencias sociales.
  4. Que lo/as estudiantes adquieran la capacidad de usar R a un nivel básico.
  5. Que lo/as estudiantes aprendan a implementar algunos modelos predictivos en R.
  6. Que lo/as estudiantes sean capaces de usar modelos predictivos en el marco de una investigación científica social.

Metodología:

Para lograr los anteriores objetivos, utilizaremos cuatro técnicas educativas. Primero, haremos seminarios dirigidos para entender qué son los modelos predictivos, cuál es el contexto sociológico/histórico en el que surgieron y para qué sirven. Segundo, usaremos cátedras magistrales para introducir usos básicos de R, algunos de los modelos predictivos más comunes y útiles para las ciencias sociales y cómo implementarlos en R. Sin embargo, en todas las clases se espera la lectura previa y la participación activa de lo/as estudiantes. Tercero, en el trabajo final recurriremos al aprendizaje por colaboración, es decir, que el trabajo final estará diseñado para que lo/as estudiantes consoliden el dominio de los contenidos aprendidos en clase y refuercen mutuamente sus habilidades. Finalmente, a través del trabajo final, también usaremos el aprendizaje por proyectos para que lo/as estudiantes usen modelos predictivos en el marco de una investigación científica social.

Reglas de juego:

Todo/as lo/as estudiantes se comprometen a seguir las siguientes reglas, además del Reglamento General de Estudiantes de Posgrado de la Universidad de los Andes:

  1. La lectura previa a clase es obligatoria y fundamental para el buen desempeño de la sesión. Todas las lecturas estarán disponibles en SicuaPlus. 
  2. La asistencia a clase es obligatoria. 
  3. Lo/as estudiantes deben participar activamente en clase. 
  4. La no entrega o entrega tardía no justificadas de cualquier evaluación implica una nota de cero (0).
  5. El plagio no será tolerado y se procederá de conformidad con el Reglamento General de Estudiantes de Pregrado de la Universidad de los Andes.
  6. El trabajo final debe ser entregado siguiendo estas normas formales:
    1. Formato .doc o .docx
    2. Márgenes de 2.5 centímetros en todos los lados.
    3. Cada página numerada.
    4. Doble espacio entre líneas.
    5. No espacio entre párrafos.
    6. Párrafos indentados.
    7. Times New Roman 12.
    8. Citación APA.
    9. Nombre del archivo “Nombre_Apellido_Nombre_Apellido_etc.”.
    10. Incluir nombres y fecha arriba de la primera página
    11. Subir a SicuaPlus el día y a la hora indicados.
    12. Para los reclamos sobre notas se procederá de conformidad con el Reglamento General de Estudiantes de Posgrado de la Universidad de los Andes.
    13. Todo lo que sea subido o anunciado por SicuaPlus o enviado por el correo electrónico institucional de la universidad se entenderá como conocido por lo/as estudiantes. Ningún otro medio de comunicación será utilizado.

Contenido

1) ¿Por qué estamos hablando de modelos predictivos? - Julio 1.

Ghafourifar, A. & Evans, M. (2018, October 20). The Machine Learning Revolution: How Artificial Intelligence Could Transform Your Business. Forbes, Oct 20, 2018. Available here: https://www.forbes.com/sites/allbusiness/2018/10/20/machine-learning-artificial-intelligence-could-transform-business/?sh=17ac636ec6c3

Donoho, D. (2017). 50 years of data science. Journal of Computational and Graphical Statistics, 26(4), 745-766.

Matthew, J. (Forthcoming). Decision trees, random forests, and the genealogy of the black box. In M. Mazzotti and M. Ames (Eds.), Algorithmic Modernity: Mechanizing Thought and Action, 1500-2000. Oxford.

Matthew, J. (2017).Querying the Archive: Database Mining from Apriori to Page-Rank. In L. Daston (Ed.). Science in the Archive. University of Chicago Press.

2) ¿Qué son los modelos predictivos? - Julio 2.

Breiman, L. (2001). Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author). Statistical science, 16(3), 199-231.

Hand, D. J., Blunt, G., Kelly, M. G., & Adams, N. M. (2000). Data Mining for Fun and Profit. Statistical Science, 15(2), 111-131.

 James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. New York: Springer. (Selección: pp. 15-29.)

3)¿Para qué sirven los modelos predictivos en las ciencias sociales? - Julio 6.

 Invitado/as: Andrés Montealegre y Sarah Moore

Molina, M., & Garip, F. (2019). Machine Learning for Sociology. Annual Review of Sociology, 45, 27-45.

Yarkoni, T., & Westfall, J. (2017). Choosing Prediction Over Explanation in Psychology: Lessons from Machine Learning. Perspectives on Psychological Science, 12(6), 1100-1122.

Grimmer, J., Roberts, M. E., & Stewart, B. M. (2021). Machine Learning for Social Science: An Agnostic Approach. Annual Review of Political Science, 24, 1-25.

4)   Introducción a R (para los modelos predictivos) - Julio 7.

5) Limpieza de datos en R. - Julio 8.

Grolemund, G. & Wickham, H. (2016). R for Data Science: Import, Tidy, Visualize, and Model Data. Sebastopol, CA: O’Reilly. (Selección: capítulos 5, 9-15.)

6) Análisis exploratorio de datos en R - Julio 9.

Grolemund, G. & Wickham, H. (2016). R for Data Science: Import, Tidy, Visualize, and Model Data. Sebastopol, CA: O’Reilly. (Selección: capítulos 2 y 7.)

7) Workflow y organización del código - Julio 12.

8)  Validación cruzada - Julio 13.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. New York: Springer. (Selección: pp. 29-42, 175-187.)

9) Regresión linear - Julio 14.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. New York: Springer. (Selección: pp. 61-102.)

10) Regresión logística - Julio 15.

 James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. New York: Springer. (Selección: pp. 128-138.)

11) Laboratorio 2 - Julio 16.

12) Laboratorio 3 - Julio 19.

13) Regresiones regularizadas/penalizadas (Lasso y Ridge) - Julio 21.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. New York: Springer. (Selección: pp. 214-228.)

 14) Laboratorio 4 - Julio 22.

 15) Árboles de decisión - Julio 23.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. New York: Springer. (Selección: pp. 303-316.)

16) Laboratorio 5 - Julio 26.

17) Bosques aleatorios (random forests) y árboles impulsados (boosted tres) - Julio 27.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. New York: Springer. (Selección: pp. 315-324.)

 18) Laboratorio 6 - Julio 28.

 19) Árboles Bayesianos de Regresión Aditiva (Bayesian Additive Regression Trees) - Julio 29.

Chipman, H. A., George, E. I., & McCulloch, R. E. (2010). BART: Bayesian additive regression trees. The Annals of Applied Statistics, 4(1), 266-298.

 20) Laboratorio 7- Julio 30.

Profesores

Emilio Lehoucq

Candidato a doctor en sociología y maestría en estadística en Northwestern University. Actualmente estudia la difusión de machine learning en las corporaciones y agencias federales estatales estadounidenses desde 1980. También ha estudiado movimientos sociales en Colombia y transnacionales y cambio religioso en Colombia y El Salvador.

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.