Bioestadística Avanzada con R

Curso

Bioestadística Avanzada con R

DEPARTAMENTOS CIENCAS BIOLOGICAS
Inicio / Programas / Bioestadística Avanzada con R

Bioestadística Avanzada con R

¿Quieres avanzar en tu práctica profesional y mejorar tus habilidades de análisis de datos biológicos? ¿Quieres seleccionar el método más adecuado para el análisis de tus datos, el diseño de tu experimento o de tu muestreo de campo? Este curso busca profundizar los conceptos de algunas técnicas estadísticas ampliamente utilizadas como la regresión y la clasificación estadística e incursionar en técnicas cada vez más populares como el machine learning. La herramienta que utilizaremos es el programa R, el cual, aparte de ser gratis, ha tenido una gran cantidad de desarrollos a nivel de versiones, funciones y paquetes que permiten que sea una herramienta utilizada en todo el mundo para el análisis de datos biológicos.

En este curso, los temas serán abarcados desde un punto de vista práctico, donde se entienda para que sirve el método estadístico, y que se necesita para su adecuada aplicación. Cada tema será explicado con estudios de caso que permitan aterrizar sus conceptos. En cada ejemplo o taller, los datos utilizados provendrán de las ciencias biológicas, con la intención de responder preguntas propias de esas áreas del conocimiento. Se espera que el estudiante ya tenga un manejo básico de R ya que el enfoque será en aprender las técnicas de análisis estadístico, conocer los funciones y paquetes que realizan esas técnicas y entender cómo deben estar organizados los datos para que el análisis se lleve a cabo correctamente.

Dirigido a

Profesionales y estudiantes de pregrado o posgrado en Biología, Ecología, Ciencias de la salud, Farmacia, Ciencias Agrícolas, Psicología, Agronomía, e ingenierías relacionadas. Profesionales e investigadores de diversas carreras que trabajen con datos biológicos.

Como prerrequisito, el estudiante ya debe tener un manejo del programa R, que incluye cargar los datos, procesar las bases de datos, utilizar sus funciones básicas, y producir y editar gráficas como histogramas o boxplots. Debido a que es un curso avanzado, el estudiante ya debe manejar los conceptos básicos de la estadística descriptiva e inferencial.

Objetivos

Al finalizar el curso el estudiante estará en capacidad de:

  • Comprender la base conceptual de los métodos de aprendizaje estadístico que son aplicados a datos biológicos.
  • Decidir qué método estadístico usar e identificar sus beneficios y limitaciones.
  • Realizar los análisis estadísticos entendiendo como debe prepararse la información para su procesamiento y cómo se interpretan los resultados obtenidos.
  • Adquirir las herramientas necesarias para aprender a manejar los métodos de análisis de datos más sofisticados.

Metodología

El curso será en modalidad virtual sincrónica. La metodología del curso es una combinación de clases magistrales, y ejercicios prácticos que se desarrollaran en clase usando el programa R.

Contenido

Sesión 1: Introducción al curso. Aprendizaje estadístico. Evaluación de la exactitud de los modelos.

Sesión 2: Regresión lineal simple y múltiple. Estimación de coeficientes, y estimación de su exactitud. Problemas potenciales.

Sesión 3: Clasificación. Regresión logística. Análisis discriminante. Modelos lineales generalizados.

Sesión 4: Métodos de re-muestreo. Técnicas de validación cruzada. Bootstrap.

Sesión 5. Selección de métodos lineales y regularización. Selección del modelo óptimo. Reducción de dimensiones. Análisis en varias dimensiones.

Sesión 6: Métodos no lineales. Splines de regresión y suavizadas. Modelos aditivos. Métodos basados en árboles. Bagging. Random Forest. Boosting.

Sesiones 7 y 8: Machine learning. Support Vector Machine. Deep learning. Redes neurales.

Sesión 9: Análisis de supervivencia y datos censados. Curva de Kapla-Meier. Log-Rank Test. Modelos de regresión con una respuesta de supervivencia.

Sesión 10: Aprendizaje no supervisado. Análisis de componentes principales. Análisis de clusters. Opcional: Pruebas de hipótesis múltiples.

Profesores

Johan Manuel Calderón

Biólogo con maestría en ecología de la Universidad Nacional de Colombia y doctorado en ecología de enfermedades de la Universidad de los Andes. Su experiencia investigativa se ha enfocado en eco-epidemiología de enfermedades infecciosas como la enfermedad de Chagas, leishmaniasis y malaria. Ha trabajado en diferentes temas relacionados con cambio climático, análisis espaciales, modelación matemática, análisis de datos, muestreos en campo, diseño experimental, y análisis eco-epidemiológicos. A nivel de docencia, ha trabajado por más de diez años en educación secundaria y universitaria, enseñando sobre ciencia y metodologías de investigación a varias carreras de ciencias básicas, ciencias de la salud e ingeniería. En su trabajo docente se ha caracterizado por la habilidad para explicar temas complejos de una forma simple y accesible, y en buscar la conexión directa entre conceptos y problemas de la vida real para llegar a la correcta apropiación del conocimiento.

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.