Haciendo Ciencia Abierta: Buenas prácticas para investigación transparente y reproducible

Taller

Haciendo Ciencia Abierta: Buenas prácticas para investigación transparente y reproducible

Facultad Economía
Inicio / Programas / Haciendo Ciencia Abierta: Buenas prácticas para investigación transparente y reproducible

Haciendo Ciencia Abierta: Buenas prácticas para investigación transparente y reproducible

El taller forma parte del programa de Catalizadores que surge de la alianza entre la Universidad de los Andes y el Berkeley Initiative for Transparency in the Social Sciences (BITSS), una iniciativa del Center for Effective Global Action (CEGA) de la Universidad de California, en Berkeley. BITSS fue establecido para reforzar la calidad de la investigación en ciencias sociales y la evidencia utilizada para hacer políticas públicas.

Este taller busca fortalecer las prácticas de investigación en las ciencias sociales proporcionando herramientas libres y de código abierto para fomentar una ciencia abierta, transparente y reproducible. Para esto, los asistentes tendrán una combinación de clases teóricas y prácticas.

En las clases teóricas se introducirán los conceptos fundamentales de la ciencia abierta, transparente y reproducible. Mientras que en las clases prácticas se mostrarán los procesos para la generación de un paquete de replicación que contiene código y datos transparentes y reproducibles. Para ello se mostrará el uso de herramientas como GitHub para control de versión de código, Markdown para documentos reproducibles, el Open Science Framework, y Zenodo para colaborar, documentar, archivar, compartir y registrar proyectos de investigación, materiales y datos.

Al finalizar el taller, el asistente habrá adquirido conocimientos que le permitan fomentar la ética, la transparencia y la reproducibilidad en la investigación, así como generar un paquete de reproducción consistente con los estándares en la profesión.

Beca:

Parte de la financiación de este curso surge del grant: “BITSS Catalyst Grant for Advancing Transparent, Reproducible, and Ethical Research” que hace posible la financiación de apoyos financieros destinados a individuos sub-representados en la investigación.

Buscamos por lo tanto fomentar la participación de mujeres e individuos sub-representados en las ciencias que de otra manera no tendrían acceso a este curso. Si considera que cumple con las condiciones de apoyo financiero, por favor diligencie el siguiente formulario hasta el lunes 27 de mayo 2024. Los resultados serán informados a más tardar el martes 4 de junio de 2024 a mediodía.

Dirigido a

El taller está diseñado para asistentes de investigación de posgrado y úultimos semestres de pregrado y profesionales de disciplinas cuantitativas que se encuentren interesados en mejorar sus habilidades de manejo de códigos y datos en investigación. Los participantes suelen ser (i) asistentes de investigación, (ii) estudiantes actuales de maestría y doctorado, (iii) posdoctorados, (iv) profesores asistentes, (v) empleados de consultoras y ONGs, y (v) bibliotecarios y administradores de datos.

Se necesita experiencia básica en manejo de datos (por ejemplo, en Excel) y deseable en alguno de los siguientes softwares: “R”, “Stata” o “Python”.

Objetivos

Al finalizar el curso, el asistente estará en capacidad de:

  • Identificar y explicar los principios fundamentales de la ciencia abierta, incluyendo la importancia de la transparencia, accesibilidad, reproducibilidad y colaboración en la investigación científica.
  • Aplicar técnicas de Markdown en conjunto con herramientas de ciencia abierta (como R Markdown, Stata Markdown o Pandoc) para desarrollar y compartir documentos científicos reproducibles que integren código, datos y análisis.
  • Utilizar GitHub para la gestión de proyectos de investigación, incluyendo el manejo de problemas, notificaciones, ramas, confirmaciones (commits) y solicitudes de incorporación de cambios (pull requests).
  • Emplear el Open Science Framework para colaborar, documentar, archivar, compartir y registrar proyectos de investigación, materiales y datos, fomentando una cultura de ciencia abierta y colaborativa.
  • Integrar el manejo de GitHub, Open Science Framework y Zenodo en los flujos de trabajo de investigación para facilitar la reproducibilidad, el acceso abierto a los datos y los resultados, y la preservación a largo plazo de los mismos.
  • Generar paquetes de replicación consistentes con los lineamientos de la Asociación Económica Americana (AEA), asegurando que los documentos y análisis sean reproducibles y verificables por otros investigadores.
  • Implementar estrategias y herramientas que promuevan la investigación de código abierto, mejorando la calidad y la transparencia de las ciencias.
  • Reflexionar sobre las consideraciones éticas relacionadas con la ciencia abierta, incluyendo el manejo de datos sensibles, el consentimiento informado, y la atribución adecuada de créditos en proyectos colaborativos.

Metodología

El taller será sincrónico de 6 clases distribuidos a lo largo de 3 semanas que se llevará a través de la plataforma zoom.

La metodología del taller está diseñada para ofrecer una experiencia de aprendizaje integral y práctica, asegurando que los participantes no sólo comprendan los conceptos teóricos, sino que también adquieran habilidades prácticas aplicables a sus propios proyectos de investigación.

Para ello las clases contendrán una parte conceptual donde se explicarán los fundamentos que proporcionarán el marco conceptual necesario para entender los temas desarrollado y un componente práctico que permitirá a los estudiantes aplicar lo aprendido en un proyecto reales. El componente practico incluirá ejercicios de programación, creación de documentos reproducibles, y uso de herramientas de software para la gestión de proyectos y colaboración. A lo largo del taller, se llevará a cabo la reproducción transversal de un trabajo publicado como un proyecto de clase. Esto permitirá a los estudiantes aplicar de manera práctica y continua las técnicas y herramientas aprendidas, enfrentándose a desafíos reales de reproducibilidad y colaboración.

Softwares y Herramientas

  • Editor de Markdown: Para la creación de documentos reproducibles. Git y GitHub: Para la gestión de versiones y colaboración en proyectos.
  • Git y Git Large File Storage (LFS): Para el manejo avanzado de repositorios y archivos de gran tamaño.
  • R Markdown/Stata: Para la integración de análisis estadístico en documentos.
  • Open Science Framework (OSF) y Zenodo: Para el almacenamiento, compartición y documentación de datos de investigación.

Contenido

El curso se desarrollará a lo largo de 6 clases distribuidos a lo largo de 3 semanas donde casa sesión tendrá un componente magistral y uno aplicado.

Contenidos de las Clases:

Clase 1: Ética y Transparencia en la Ciencia Abierta. En la primera parte hablaremos de la importancia de la replicabilidad y reproducibilidad en la investigación científica, como así también de los principios éticos y transparencia en la ciencia abierta. En la segunda parte nos introduciremos a los paquetes de replicación. Buscando responder preguntas como: ¿Que son? ¿Qué función cumplen dentro de la transparencia de la ciencia? Inicio de un paquete de replicación.

Clase 2: Estructuración de Código Reproducible. Independencia del código: carpetas y sistemas operativos. Principios generales de estilo de Código: Nombres de archivos y variables. Variables locales vs. globales. Documentación de funciones. División de archivos en pequeñas funciones. Uso de un archivo maestro.

Clases 3 y 4: Markdown, Git y GitHub. Fundamentos de Markdown/ Creación de documentos reproducibles con Markdown (Stata y/o R markown). Sintaxis básica y avanzada para formatear texto, insertar imágenes, crear tablas, y enlazar referencias, entre otros. Incorporación de código, datos y análisis. Principios básicos de Git y GitHub para la gestión de proyectos de investigación, incluyendo el manejo de problemas, notificaciones, ramas, confirmaciones (commits) y solicitudes de incorporación de cambios (pull requests).

Clases 5 y 6: Datos en OSF o Zenodo y finalización del paquete de replicación. Uso de OSF y Zenodo para almacenar y compartir datos del paquete de replicación. Creación de una checklist para el editor de datos, asegurando la calidad y completitud del paquete de replicación. Finalización y revisión del documento reproducible creado durante el taller

Profesores

Ignacio Sarmiento-Barbieri

PhD en Economía de la Universidad de Illinois con especialización en Economía Urbana y Econometría. Realizó su postdoctorado en ciencia de datos en microeconomía aplicada en el Centro Nacional de Aplicaciones de Supercomputadoras (NCSA) de Estados Unidos. Actualmente es Profesor Asistente de la Facultad de Economía, miembro del programa de Catalistas del Berkeley Initiative for Transparency in the Social Sciences (BITSS) y profesor asociado del Centro de Investigación y Formación en Inteligencia Artificial. Su investigación combina herramientas econométricas tradicionales con avances en informática, big data, y aprendizaje automático para estudiar la economía pública y urbana. En particular, su interés está en la provisión de bienes públicos en ciudades de todo el mundo.

Gustavo Castillo Álvarez 

Estudiante de Maestría en Economía PEG de la Universidad de los Andes y economista de la misma institución. Actualmente es analista de datos en la Superintendencia de Economía Solidaria.

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.

Relacionados