Introducción a la Ciencia de Datos

Microcredencial

Introducción a la Ciencia de Datos

Facultad de Ciencias, Departamento de Física
Inicio / Programas / Introducción a la Ciencia de Datos

Introducción a la Ciencia de Datos

En los últimos años, el uso masivo de tecnologías de la información ha generado un gran volumen de datos en diversas áreas, como finanzas, salud, educación, ingeniería, marketing y muchas otras. Sin embargo, actualmente hay una escasez de personal calificado para satisfacer la creciente demanda de analistas de datos que puedan ayudar a las empresas y organizaciones a tomar decisiones informadas basadas en los datos.

Este curso tiene como objetivo proporcionar a los estudiantes las herramientas de programación nivel intermedio en Python y básico en SQL con el propósito de realizar análisis de datos básico, como calcular una media, caracterizar cualitativamente una distribución y organizar la información para analizar datos para sus empresas, universidades y organizaciones.

Competencia

Al finalizar esta Microcredencial, los estudiantes estarán en capacidad de aplicar herramientas computacionales (librerias como Seaborn, Pandas, Numpy, Matplotlib) de Python y elementos básicos de SQL para filtrar, extraer, analizar y representar información relevante de bases de datos.

Conoce la insignia digital que recibirás por aprobar esta microcredencial aquí.

Esta Microcredencial tiene una duración total de 48 horas distribuidas en 36 horas de trabajo sincrónico con el profesor y 12 horas de trabajo autónomo del estudiante (Horas asincrónicas).

Dirigido a

Se encuentra dirigido a profesionales, estudiantes y personas que tengan conocimientos básicos de álgebra lineal y programación, que deseen iniciar una formación básica en Ciencia de Datos, para aplicar en emprendimientos o empresas que buscan fortalecer su ventaja competitiva mediante analítica de datos en Python. El ambiente de aprendizaje es interdisciplinario e incluye campos de aplicación en ingeniería, finanzas y ciencias. El curso también está abierto para estudiantes de pregrado y posgrado de diversos campos que hayan completado el ciclo básico de matemáticas.

Objetivos

1. Aplicar elementos fundamentales del lenguaje Python como los búcles, funciones y arreglos para el diseño y ejecución de programas básicos.

2. Realizar gráficos básicos con Matplolib y Numpy para representar datos.

3. Desarrollar programas orientados a objetos que sirvan como estructura para el análisis de datos.

4. Extraer, analizar y representar información relevante de bases de datos usando las librerías de pandas y matplotlib (histograma) de python.

5. Realizar representaciones gráficas de los datos como histogramas y boxplots con la librería Matplotlib de python.

6. Extraer, analizar y representar información relevante de bases de datos usando las librerías de pandas y Seaborn de Python.

7. Extraer y analizar información relevante de bases de datos usando el lenguaje SQL.

Metodología

Cada semana hay dos sesiones magistrales de dos horas y una sesión complementaria de 2 horas. La metodología del curso se basa en aprendizaje por indagación y resolución de problemas. En cada sesión de la clase magistral se presenta la temática y se realizan ejemplos. Posteriormente cada estudiante trabaja en uno o dos problemas individuales y se hace una discusión abierta alrededor de estos problemas. Al finalizar cada módulo, se asigna un taller en la clase magistral para desarrollo asincrónico. En la sesión complementaria se realizan 2 horas de trabajo individual guiado por el profesor en donde se resuelven dudas sobre el taller asignado. La evaluación del curso se realiza promediando los 6 talleres semanales. Antes de cada sesión sincrónica, se invita a los estudiantes a explorar problemas o materiales que servirán de base para solucionar los problemas calificables.

Modalidad: Virtual sincrónica.

El curso tiene una duración total de 48 horas distribuidas en 36 horas de trabajo sincrónico con el profesor y 12 horas de trabajo autónomo del estudiante (Horas asincrónicas).

Sistema de evaluación

El estudiante desarrollará de forma individual un (1) taller en cada módulo, los cuales tendrán una participación cada uno del 16,66% (total 5 talleres).

Contenido

Módulo 1: Estructuras fundamentales en Python

  • Presentación del curso e instalación del software.
  • Introducción a la sintaxis básica de Python.
  • Tipado de variables, operadores, operadores de comparación.
  • Funciones y funciones anónimas.
  • Estructura de datos: listas, tuplas y diccionarios.
  • Condicionales y operadores de comparación.
  • Bucles: for y while. Continue, pass, else, break.
  • Lectura y escritura de archivos de texto plano usando Numpy.

Módulo 2: Matplotlib, Numpy y POO

Mod 2 - A

  • "Graficación 2d usando Matplotlib. Modificadores de estilo de un gráfico.
  • Graficación 3d usando Matplotlib.
  • Elementos de álgebra lineal usando Numpy.
  • Producto tensorial de vectores.

Mod 2 - B

  • Funciones recursivas: ventajas y desventajas.
  • Generadores y excepciones.
  • Introducción a la programación orientada a objetos (POO).

Módulo 3: Bases de datos con Pandas e histogramas

  • Elementos básicos de Pandas.
  • Excluir valores nulos. Redefinir index, creación de columnas.
  • Variables categóricas. Filtros (masking).
  • Lectura y escritura de archivos separados por como (csv).
  • Lectura y escritura de archivos de excel (xlsx).
  • Definición de histograma, rango y frecuencia de clase. Graficación usando marca de clase y normalización.
  • Distribución acumulada y su significado.
  • Definición de histograma 2D.
  • Graficación y normalización de histograma 2D.
  • Ideas de marginalización.

Módulo 4: Elementos básicos de estadística

  • Definición de cuantil, cuartiles y percentiles.
  • Mediana, moda y media.
  • Diagrama de cajas y bigotes (boxplots). Tablas de contingencia y variables categóricas.
  • Gráficos de barras y diagrama circular. Elementos básicos de Seaborn-I.
  • Graficación de distribuciones.
  • Graficación de variables categóricas.

Módulo 5: Elementos básicos de estadística usando Seaborn.

  • Elementos básicos de Seaborn-II.
  • Relación entre variables cuantitativas.
  • Relación entre variables cuantitativas y cualitativas.
  • Mapas de calor.
  • Multigráficas.
  • Elementos básicos de SQL.
  • Consultas de selección.
  • Consulta multitabla.
  • Consulta de cálculo. Sub-consulta.

Módulo 6: Elementos básicos de SQL

  • Elementos de SQL. Creación de tablas.
  • Actualización y elminación.
  • Elementos básicos de SQL en Python (SQLite3).
  • Consulta de selección.
  • Consulta de cálculo.
  • Creación de tablas. Agregar y eliminar campos.

Profesores

Manuel Alejandro Segura Delgado

Ms. Instituto Cinvestav de México y Ph.D en física de altas energías. Posee amplia experiencia en análisis de gran volumen de datos. Desarrolló su trabajo doctoral en el laboratorio CERN, en Ginebra, Suiza. Ha dictado el curso de métodos computacionales en la Universidad de Los Andes en múltiples ocasiones. Adicionalmente, el curso contará con la participación del profesor Andrés Flórez del departamento de física de la Universidad de los Andes, quien es experto en análisis de datos del experimento CMS y en el área de fenomenología de partículas. Finalmente, algunas clases serán dictadas por los fundadores de la empresa de análisis de datos Whale & Jaguar.

Diego Hernando Useche Reyes

Ms. en Física de la Universidad de los Andes e investigador del grupo MindLab de la Universidad Nacional. Ha sido investigador visitante en la Universidad de Purdue y en el laboratorio de Ames de Estados Unidos. Ha dictado varios cursos de métodos computacionales en ciencias en la Universidad de los Andes. Su área de investigación actual está enfocada en el desarrollo de modelos de machine learning en computadores cuánticos.

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.

Relacionados