Bioestadística Avanzada con R

Curso

Bioestadística Avanzada con R

Facultad de Ciencias, Dpto. de Ciencias Biológicas
Home / Programs / Bioestadística Avanzada con R

Bioestadística Avanzada con R

¿Quieres avanzar en tu práctica profesional y mejorar tus habilidades de análisis de datos biológicos? ¿Quieres seleccionar el método más adecuado para el análisis de tus datos, el diseño de tu experimento o de tu muestreo de campo? Este curso busca profundizar los conceptos de algunas técnicas estadísticas ampliamente utilizadas como la regresión y la clasificación estadística e incursionar en técnicas cada vez más populares como el machine learning. La herramienta que utilizaremos es el programa R, el cual, aparte de ser gratis, ha tenido una gran cantidad de desarrollos a nivel de versiones, funciones y paquetes que permiten que sea una herramienta utilizada en todo el mundo para el análisis de datos biológicos.

En este curso, los temas serán abarcados desde un punto de vista práctico, donde se entienda para que sirve el método estadístico, y que se necesita para su adecuada aplicación. Cada tema será explicado con estudios de caso que permitan aterrizar sus conceptos. En cada ejemplo o taller, los datos utilizados provendrán de las ciencias biológicas, con la intención de responder preguntas propias de esas áreas del conocimiento. Se espera que el estudiante ya tenga un manejo básico de R ya que el enfoque será en aprender las técnicas de análisis estadístico, conocer las funciones y paquetes que realizan esas técnicas y entender cómo deben estar organizados los datos para que el análisis se lleve a cabo correctamente.

Addressed to

Profesionales y estudiantes de pregrado o posgrado en Biología, Ecología, Ciencias de la salud, Farmacia, Ciencias Agrícolas, Psicología, Agronomía, e ingenierías relacionadas. Profesionales e investigadores de diversas carreras que trabajen con datos biológicos.

Como prerrequisito, el estudiante ya debe tener un manejo del programa R, que incluye cargar los datos, procesar las bases de datos, utilizar sus funciones básicas, y producir y editar gráficas como histogramas o boxplots. Debido a que es un curso avanzado, el estudiante ya debe manejar los conceptos básicos de la estadística descriptiva e inferencial.

Goals

Al finalizar el curso, el estudiante estará en capacidad de:

  • Comprender la base conceptual de los métodos de aprendizaje estadístico que son aplicados a datos biológicos.
  • Decidir qué método estadístico usar e identificar sus beneficios y limitaciones.
  • Realizar los análisis estadísticos entendiendo como debe prepararse la información para su procesamiento y cómo se interpretan los resultados obtenidos.
  • Adquirir las herramientas necesarias para aprender a manejar los métodos de análisis de datos más sofisticados.

Methodology

El curso será en modalidad virtual sincrónica. La metodología del curso es una combinación de clases magistrales, y ejercicios prácticos que se desarrollarán en clase usando el programa R.

Content

Sesión 1:

  • Introducción al curso.
  • Manejo de datos con R: Manipulación de datos. 

Sesión 2:

  • Manejo de datos con R: Manipulación de datos.  
  • Aprendizaje estadístico: Supervisado y no supervisado, ajuste de los modelos. 

Sesión 3:

  • Manejo de datos con R: Visualización.  
  • Regresión lineal.  

Sesión 4:

  • Interacción de efectos, factores categóricos, diagnósticos de la regresión, colinealidad. 

Sesión 5:

  • Análisis de regresión en R y Regresión no lineal. 

Sesión 6:

  • Medidas del rendimiento de los modelos.  
  • Validación cruzada. 

Sesión 7:

  • Regresión paso a paso. 
  • Regresión penalizada: Ridge y Lasso.  

Sesión 8:

  • Modelos lineales generalizados.  
  • Regresión logística y Poisson.  
  • Análisis discriminante.   

Sesión 9:

  • Evaluación de modelos de clasificación.  
  • Análisis de supervivencia. 

Sesión 10:

  • Métodos basados en árboles.  
  • Bagging y Random Forest.  
  • Boosting.  

Sesión 11:

  • Aprendizaje no supervisado.  
  • Análisis de componentes principales. 

Sesión 12:

  • Taller práctico final: Manejo de bases de datos y modelación de datos.

Professors

Johan Manuel Calderón

Biólogo con maestría en Ecología de la Universidad Nacional de Colombia y doctorado en Ecología de Enfermedades de la Universidad de los Andes. Miembro del grupo de investigación aplicada de la subdirección técnica operativa del Jardín Botánico de Bogotá. Su experiencia investigativa se ha enfocado en ecología aplicada en diferentes áreas como salud, ecología urbana y sistemas agrícolas. Ha trabajado en diferentes temas relacionados con cambio climático, servicios ecosistémicos, coberturas vegetales urbanas, análisis espaciales, modelación matemática, y análisis de datos. A nivel de docencia, ha trabajado por más de diez años en educación secundaria y universitaria, enseñando sobre ciencia y metodologías de investigación a varias carreras de ciencias básicas, ciencias de la salud e ingeniería. En su trabajo docente se ha caracterizado por la habilidad para explicar temas complejos de una forma simple y accesible, y en buscar la conexión directa entre conceptos y problemas de la vida real para llegar a la correcta apropiación del conocimiento.

Conditions

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.