Estadística y herramientas computacionales para análisis de datos

Curso

Estadística y herramientas computacionales para análisis de datos

Facultad de Ciencias, Departamento de Física
Inicio / Programas / Estadística y herramientas computacionales para análisis de datos

Estadística y herramientas computacionales para análisis de datos

En el mundo actual, la capacidad para interpretar datos complejos de manera robusta es sumamente importante para el desarrollo de empresas públicas o privadas, en cualquier actividad económica. La adopción de herramientas para el análisis de big data y business analytics ha impulsado el crecimiento del mercado global para estos sectores, con un valor estimado entre US$420.000 y US$512.000 millones para el 2027 y una tasa de crecimiento anual entre el 10,9% y el 14,8%*. Esta perspectiva ha hecho que el adecuado manejo de diferentes métodos de análisis estadístico sea esencial para obtener conclusiones y recomendaciones bien fundamentadas y de valor para estas empresas y sus clientes.  

Las herramientas y librerías para aplicar machine learning en el análisis e interpretación de grandes conjuntos de datos están disponibles y son de uso abierto para todos. Sin embargo, ¿cómo se puede agregar valor al uso de estas herramientas en un proceso de toma de decisiones? ¿Cómo puede un usuario generar un concepto estadísticamente robusto y comunicarlo de manera efectiva a un público o cliente? El manejo de conceptos estadísticos básicos, nociones de trato de errores, la aplicación de pruebas de hipótesis usando pensamiento crítico y estructurado, y la capacidad de utilizar herramientas computacionales de actualidad son competencias fundamentales para este fin. En este curso, se enseñarán técnicas y estrategias para procesar e interpretar a grandes conjuntos de datos y resumir los resultados de manera contundente y con valor para cualquier público, sea académico o empresarial.

Dirigido a

Este curso se encuentra dirigido a profesionales que deseen iniciar una formación robusta en análisis estadístico de datos y grandes volúmenes de información, para aplicar en emprendimientos o empresas que buscan fortalecer su ventaja competitiva mediante analítica de datos. El ambiente de aprendizaje es interdisciplinario e incluye campos de aplicación en administración, ingeniería, finanzas y ciencias. El curso también está abierto para estudiantes de pregrado y posgrado de diversos campos que hayan completado el ciclo básico de matemáticas (cálculo diferencial e integral). 

Objetivos

1. Al finalizar este curso, el estudiante estará en capacidad de aplicar adecuadamente diferentes métodos de análisis estadístico básicos aplicados a situaciones diversas en problemas de finanzas, salud pública, transporte, ciencias e ingeniería. 

2. El estudiante estará en capacidad de aplicar un pensamiento crítico y estructurado, usando habilidades del pensamiento científico, en situaciones que requieran análisis de grandes volúmenes de datos para determinar el comportamiento estadístico de la información de interés y tomar decisiones basadas en los datos. 


Metodología

El curso se desarrollará a través de clases virtuales magistrales y clases prácticas de aplicaciones de los conceptos. El curso tendrá actividades virtuales individuales y actividades grupales, que los estudiantes deberán desarrollar en su tiempo libre. Se realizarán talleres, trabajos en grupos y foros de discusión asociados al análisis de datos realizados por diferentes grupos de trabajo conformados por los participantes. 

Contenido

Introducción a Python y sus herramientas básicas para análisis estadístico de datos.

  • Uso de Python en la nube. 
  • Comando Básico de Unix. 
  • Introducción a la sintaxis básica de Python. 
  • Lectura de archivos y bases de datos. 
  • Herramientas para graficar y analizar datos.  

Introducción a la probabilidad 

  • Muestreo aleatorio simple, estratificado y sistemático de una población. 
  • Interpretación de probabilidad, funciones de densidad, funciones de variables aleatorias. Distribuciones exponenciales, gaussianas, normales-logarítmicas, chi-cuadrado. 
  • Valores esperados, funciones binomiales y multinomiales, distribución de Poisson, distribución uniforme. 

Introducción a la teoría de errores y su propagación 

  • Tipos de errores en mediciones. 
  • Propagación en sumas, productos cocientes. 
  • Media y desviación estándar.  
  • Como reportar incertidumbres correctamente.  

Pruebas estadísticas.  

  • Pruebas de Hipótesis.
  • Niveles de significancia.   


Profesores

Dr. Manuel Alejandro Segura Delgado

Ms. Instituto Cinvestav de México y Ph.D en física de altas energías. Posee amplia experiencia en análisis de gran volumen de datos. Desarrolló su trabajo doctoral en el laboratorio CERN, en Ginebra, Suiza. Ha dictado el curso de métodos computacionales en la Universidad de Los Andes en múltiples ocasiones. Adicionalmente, el curso contará con la participación del profesor Andrés Flórez del departamento de física de la Universidad de los Andes, quien es experto en análisis de datos del experimento CMS y en el área de fenomenología de partículas. Finalmente, algunas clases serán dictadas por los fundadores de la empresa de análisis de datos Whale & Jaguar.

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.

Relacionados