El avance en la capacidad de cómputo de los ordenadores modernos ha permitido el desarrollo de algoritmos y paquetes de funcionalidades para analizar crecientes cantidades de datos. En el marco de la biología, esto ha sido de particular utilidad dada la paralela explosión de la cantidad de datos producidos por las técnicas de secuenciación modernas, así como la complejidad de estos últimos.
En esta coyuntura, es fundamental para los investigadores y los profesionales tener una comprensión suficiente tanto de los algoritmos y paquetes disponibles para el análisis de datos de experimentos biológicos como de los lenguajes de programación sobre el que estos se ejecutan. Así pues, este curso busca proveer el conocimiento teórico y práctico necesario para el manejo efectivo de las herramientas bioinformáticas requeridas para trabajar con datos biológicos.
Este curso ofrece las bases tanto teóricas como prácticas para el correcto análisis de datos biológicos. Para cada tema visto, se proveerá una explicación teórica de la motivación del problema, la naturaleza de los datos generados y el funcionamiento general de los algoritmos requeridos para su solución. En conjunto, se explicará en detalle los mecanismos para implementarlo en sesiones locales de Python.
Asimismo, el curso abordará un amplio rango de tipos de datos y estrategias de análisis, desde herramientas básicas —como alineamientos pareados y búsquedas en bases de datos— hasta aquellas utilizadas en investigaciones científicas recientes, como métodos de visualización de datos multidimensionales y técnicas de machine learning. Para asegurar un adecuado aprovechamiento del curso, se iniciará con un repaso de biología molecular y una introducción al manejo básico de Python.