Introducción al análisis de datos en Python (Grupo 3)

Curso

Introducción al análisis de datos en Python (Grupo 3)

Facultad de Economía
Inicio / Programas / Introducción al análisis de datos en Python (Grupo 3)

Introducción al análisis de datos en Python

En el mundo laboral debido al incremento en el volumen de datos y la necesidad de automatización de tareas se ha generado la necesidad de implementar nuevos softwares y lenguajes de programación a las tareas del día a día. Adicionalmente, al ser Python open source, muchos de los desarrollos de la frontera de conocimiento se han implementado en este lenguaje. Python es el lenguaje de programación que más nuevos programadores ha atraído en los últimos años, es el tercer lenguaje más popular del mundo y el primero en lo que relaciona a análisis de datos, machine learning y minería de datos. Además, es el lenguaje más solicitado por los empleadores en busca de analistas de datos. En respuesta a esta necesidad, el curso de Introducción al análisis de datos en Python busca que los estudiantes adquieran una comprensión general del lenguaje de programación, su utilidad para el análisis de datos y automatización de tareas. En el curso se tratará la sintaxis básica de programación, el manejo de datos y su visualización. Así, el énfasis será sobre la importación, organización y manejo de datos y la presentación de resultados. 

Nota: se sugiere que el estudiante interesado en el curso cuente con un computador de 4GB de RAM pero preferiblemente 8GB en adelante. 
El software que usará es Anaconda de Python 3. Las instrucciones de instalación serán remitidas al inicio del programa.

Este curso hace parte del programa Proyectos de analítica en Python (Grupo 2). Ver más aquí.

Dirigido a

El curso está dirigido a personas que deseen desarrollar habilidades de programación en Python. Se espera que el curso sea tomado por personas en el entorno laboral que deseen generar un impacto positivo en sus organizaciones por medio de la automatización de procesos y análisis estadístico de volúmenes considerables de datos. De igual forma, se espera ofrecerles a los investigadores que no han tenido la oportunidad de tener un acercamiento a la programación, una herramienta con la que podrán iniciar su aprendizaje en los lenguajes de programación. Por último, el curso les dará las herramientas necesarias para tomar cursos aplicados de educación continua en los cuales se mostrará el uso de Python en problemas de diferentes industrias. El curso no tiene requisitos para su inscripción.

Objetivos

•    Enseñar a los estudiantes los conceptos básicos de programación.
•    Familiarizar a los estudiantes en la sintaxis básica de Python.
•    Enseñar a los estudiantes las siguientes habilidades: 
-    Operaciones matemáticas vectoriales y matriciales con numpy.
-    Limpieza y Manipulación de bases de datos.
-    Visualización de datos con las librerías más famosas.
-    Automatización de tareas en Python. 
-    Generar valor agregado a partir de análisis estadísticos descriptivos.
-    Introducción a web scrapping
 

Metodología

El curso se realizará de manera virtual con sesiones sincrónicas y cada sesión estará dividida en dos módulos, los cuales a su vez estarán divididos en dos partes. Durante la primera parte de cada módulo el profesor introducirá técnicas, comandos y conceptos relacionados con la utilización de Python y utilizará ejemplos que lo ilustren; durante la segunda parte los estudiantes deberán trabajar individualmente en un ejercicio, el cual deberán entregar al finalizar el módulo. Adicionalmente, se realizarán 2 talleres en clase en los cuales se espera que los estudiantes, con ayuda del profesor, afiancen sus conocimientos. 

Nota: se sugiere que el estudiante interesado en el curso cuente con un computador de 4GB de RAM pero preferiblemente 8GB en adelante. 
El software que usará es Anaconda de Python 3. Las instrucciones de instalación serán remitidas al inicio del programa.

Contenido

Sesión 1:
•    ¿Qué es Python? ¿Qué es Anaconda? 
•    ¿Qué es un lenguaje multipropósito?  
•    Instalación de Python, Anaconda y Jupyter LAB. 
•    Instalación y carga de librerías. 
•    Jupyter Lab, páneles y comandos rápidos. 
•    Sintaxis en Python: Identación y estructura básica. 
•    Tipos de datos: entero, float, lógico, character. Missings: NaN, NA. 
•    Estructuras de datos: Listas, cadenas, tuplas y diccionarios. 
•    Numpy y Pandas.
•    Operaciones básicas e indexación. 
•    ¿Dónde buscar ayuda?
Sesión 2:
•    Importar información 
•    Manejo de listas y diccionarios
•    Extraer información de objetos y rebanados. 
•    Uso de vectores lógicos para extraer información de objetos. 
•    Definir funciones. 
•    Estructuras de control.
Sesión 3:
•    Programación orientada a objetos
•    Clases y métodos.
•    Loops: while y for.
•    Controles de flujo: continue, break.
Sesión 4:
•    Instalar y cargar paquetes. 
•    Funciones apply, mapping and merge.
•    Funciones de manejo de texto.
•    Manejo básico pandas, numpy.arrays y spicy: selección de filas y/o columnas, selección condicionada.
•    Creación de muestras y subconjuntos de data frames: subsets and samples.
•    Importación de datos: txt, csv, xlsx, .pkl y gzip.
•    Inspección inicial de la información.
Sesión 5: 
•    Introducción a plotly y matplot.
•    Gráficos base: histogramas, scatter plot, bar plot, box plot. 
•    Otras herramientas para visualización de datos: manejo de mapas. 
•    Personalización de gráficos: ejes, colores, títulos. 
•    Exportación de gráficos.
Sesión 6:
•    Construcción de análisis estadísticos descriptivos.
•    Pruebas estadísticas.
•    Modelos estadísticos. (Regresiones y modelos de clústering)
Sesión 7:
•    Introducción a Web Scrapping
 

Profesores

Hamadys L. Benavides Gutiérrez

Economista con minor en finanzas y Maestría en Economía de la Universidad de los Andes. Se ha desempeñado como profesora asistente de la asignatura “Minería de datos y sus Aplicaciones” del programa de maestría de la facultad de Economía de la Universidad de los Andes y profesora asistente de los cursos de verano “Machine Learning and Public Policy”, “Human Artificial Intelligence for Human Development” y “Econometría y Aprendizaje de Máquinas”. También ha sido asistente de investigación en la facultad de Ciencias de la misma universidad donde construyó modelos de predicción de desempeño académico. Actualmente, se desempeña como subdirectora asociada del área de minería de datos en Quantil donde cuenta con experiencia en la utilización de técnicas de aprendizaje de máquinas para la resolución de diversos problemas de naturaleza predictiva en los sectores financieros, salud, manufacturero, educación y energía, así como en la aplicación de técnicas econométricas. En particular, su experiencia abarca la implementación de modelos de predicción de diagnóstico y progresión de enfermedades crónicas, modelos predictivos para el desempeño académico de estudiantes, modelos predictivos para clientes en riesgo de incumplimiento, predicción de series macroeconómicas, pronósticos y estimación de demanda, sistemas para la detección de anomalías y sistemas de riesgo crediticio y de lavado de activos y financiación de terrorismo (SARC y SARLAFT, respectivamente). Desde el lado de la economía, su experiencia se centra en economía de la salud y evaluación de impacto.

Carlos Montenegro

Ingeniero Mecánico de la Universidad de Los Andes. Último año de Magister en Ingeniería Mecánica de la Universidad de los Andes, completando su tesis en aprendizaje de modelos probabilísticos para control predictivo seguro de sistemas dinámicos en ambientes desconocidos. Durante su maestría se desempeñó como asistente graduado de docencia en el Departamento de Ingeniería Mecánica.Obtuvo el Premio Saber PRO por ser uno de los más altos puntajes del país en el Examen de Estado de la Calidad de la Educación Superior - Saber PRO, en las competencias genéricas y específicas, mediante la resolución 012413 del 26 de noviembre de 2019 del Ministerio de Educación Nacional. En Quantil, ha participado en proyectos de predicción de crimen para Bogotá y México, así como procesamiento de lenguaje natural para la caracterización de la demanda en el mercado laboral en cinco países de LATAM. Fue ganador de la beca PyTorch Scholarship Challenge ofrecida por Facebook para construir modelos de aprendizaje con PyTorch e hizo parte de la comitiva académica del Departamento de Ingeniería Mecánica para visitar institutos de automatización y robótica en Alemania para insolidaridad proyecto y oportunidades académicas.