Introducción a la Ciencia de Datos
En los últimos años, el uso masivo de tecnologías de la información ha generado un gran volumen de datos en diversas áreas, como finanzas, salud, educación, ingeniería, marketing y muchas otras. Sin embargo, actualmente hay una escasez de personal calificado para satisfacer la creciente demanda de analistas de datos que puedan ayudar a las empresas y organizaciones a tomar decisiones informadas basadas en los datos.
Este curso tiene como objetivo proporcionar a los estudiantes las herramientas de programación nivel intermedio en Python y básico en SQL con el propósito de realizar análisis de datos básico, como calcular una media, caracterizar cualitativamente una distribución y organizar la información para analizar datos para sus empresas, universidades y organizaciones.
Competencia
Al finalizar esta Microcredencial, los estudiantes estarán en capacidad de aplicar herramientas computacionales (librerias como Seaborn, Pandas, Numpy, Matplotlib) de Python y elementos básicos de SQL para filtrar, extraer, analizar y representar información relevante de bases de datos.
Conoce la insignia digital que recibirás por aprobar esta microcredencial aquí.
Esta Microcredencial tiene una duración total de 48 horas distribuidas en 36 horas de trabajo sincrónico con el profesor y 12 horas de trabajo autónomo del estudiante (Horas asincrónicas).
Addressed to
Se encuentra dirigido a profesionales, estudiantes y personas que tengan conocimientos básicos de álgebra lineal y programación, que deseen iniciar una formación básica en Ciencia de Datos, para aplicar en emprendimientos o empresas que buscan fortalecer su ventaja competitiva mediante analítica de datos en Python. El ambiente de aprendizaje es interdisciplinario e incluye campos de aplicación en ingeniería, finanzas y ciencias. El curso también está abierto para estudiantes de pregrado y posgrado de diversos campos que hayan completado el ciclo básico de matemáticas.
Goals
1. Aplicar elementos fundamentales del lenguaje Python como los búcles, funciones y arreglos para el diseño y ejecución de programas básicos.
2. Realizar gráficos básicos con Matplolib y Numpy para representar datos.
3. Desarrollar programas orientados a objetos que sirvan como estructura para el análisis de datos.
4. Extraer, analizar y representar información relevante de bases de datos usando las librerías de pandas y matplotlib (histograma) de python.
5. Realizar representaciones gráficas de los datos como histogramas y boxplots con la librería Matplotlib de python.
6. Extraer, analizar y representar información relevante de bases de datos usando las librerías de pandas y Seaborn de Python.
7. Extraer y analizar información relevante de bases de datos usando el lenguaje SQL.
Methodology
Cada semana hay dos sesiones magistrales de dos horas y una sesión complementaria de 2 horas. La metodología del curso se basa en aprendizaje por indagación y resolución de problemas. En cada sesión de la clase magistral se presenta la temática y se realizan ejemplos. Posteriormente cada estudiante trabaja en uno o dos problemas individuales y se hace una discusión abierta alrededor de estos problemas. Al finalizar cada módulo, se asigna un taller en la clase magistral para desarrollo asincrónico. En la sesión complementaria se realizan 2 horas de trabajo individual guiado por el profesor en donde se resuelven dudas sobre el taller asignado. Antes de cada sesión sincrónica, se invita a los estudiantes a explorar problemas o materiales que servirán de base para solucionar los problemas calificables.
Sistema de evaluación
El estudiante desarrollará de forma individual un (1) taller en cada módulo, los cuales tendrán una participación cada uno del 16,66% (total 6 talleres). La evaluación del curso se realiza promediando los 6 talleres semanales.
Content
Módulo 1
1A
1.1 Presentación del curso e instalación del sofware.
1.2 Introducción a la sintaxis básica de Python.
1.3 Tipado de variables, operadores, operadores de comparación.
1.4 Funciones y funciones anónimas.
1.5 Estructura de datos: listas, tuplas y diccionarios.
1B
2.1 Condicionales y operadores de comparación.
2.2 Bucles: for y while.
2.3 Continue, pass, else, break.
2.4 Lectura y escritura de archivos de texto plano usando Numpy.
Módulo 2
2A
3.1 Graficación 2d usando Matplotlib.
3.2 Modificadores de estilo de un gráfico.
3.3 Graficación 3d usando Matplotlib.
3.4 Elementos de álgebra lineal usando Numpy.
3.5 Producto tensorial de vectores.
2B
4.1 Funciones recursivas: ventajas y desventajas.
4.2 Generadores y excepciones.
4.3 Introducción a la programación orientada a objetos (POO).
Módulo 3
3A
5.1 Elementos básicos de Pandas.
5.2 Excluir valores nulos.
5.3 Redefinir index, creación de columnas.
5.4 Variables categóricas.
5.5 Filtros (masking).
5.6 Lectura y escritura de archivos esperados por cómo (csv) usando Pandas.
5.7 Lectura y escritura de archivos de excel (.xlsx) usando Pandas.
3B
6.1 Definición de histograma, rando, frecuencia de clase.
6.2 Graficación usando marca de clase y normalización de un histograma.
6.3 Distribución acumulada y su significado.
6.4 Definición de histograma 2D.
6.5 Graficación y normalización de histograma 2D.
6.6 Ideas fundamentales de la marginalización.
Módulo 4
4A
7.1 Definición de cuantil, cuartile y percentiles.
7.2 Mediana, moda y media.
7.3 Diagrama de cajas y bigotes (boxplots).
7.4 Tabla de contingencia y variables categóricas.
7.5 Gráficos de barras y diagrama circular.
4B
8.1 Elementos básicos de Seaborn-I.
8.2 Graficación de distribuciones.
8.3 Graficación de variables categóricas.
Módulo 5
5A
9.1 Elementos básicos de Seaborn-II.
9.2 Relación entre variables cuantitativas y cualitativas.
9.3 Mapas de calor.
9.4 Multigráficas.
5B
10.1 Elementos básicos de SQL.
10.2 Consultas de selección.
10.3 Consultas multi tabla.
10.4 Consultas de cálculo.
10.5 Sub-consultas.
Módulo 6
6A
11.1 Elementos de SQL.
11.2 Creación de tablas.
11.3 Actualización y eliminación.
6B
12.1 Elementos básicos de SQL en Python (SQLite3).
12.2 Consulta de selección.
12.3 Consulta de cálculo.
12.4 Creación de tablas.
12.5 Agregar y eliminar campos
Conditions
Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.
La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.