Análisis espacial de datos y sus aplicaciones en Python

Curso

Análisis espacial de datos y sus aplicaciones en Python

Facultad de Economía
Inicio / Programas / Análisis espacial de datos y sus aplicaciones en Python

Análisis espacial de datos en Python

Con las nuevas tecnologías de la información y la masificación de datos geolocalizados se han ampliado los espectros de investigación de los diferentes campos del conocimiento. Particularmente, los saberes de la cartografía y la estadística se han traslapado para consolidar el análisis espacial, como un campo de investigación que busca la compresión y el análisis de fenómenos que son influenciados por una dimensión espaciotemporal. En este sentido, el análisis espacial y sus aplicaciones son ampliamente utilizadas en diferentes disciplinas, que buscan entender cómo los patrones movilidad afectan otras esferas del conocimiento.  En particular, este tipo de análisis permite enriquecer y facilitar tareas de segmentación y entendimiento de clientes.
 

Dirigido a

Este curso está dirigido a profesionales de cualquier disciplina que se encuentren interesados en temas territoriales, que deseen profundizar en los conceptos y herramientas más importantes del análisis espacial de datos. Se espera que los participantes tengan un conocimiento básico de manipulación de datos en Python e interés en el aprendizaje de los diferentes algoritmos y metodologías estadísticas que potencializan el análisis espacial de datos. 
 

Objetivos

Este curso tiene como objetivo principal profundizar en un conjunto de técnicas y herramientas que permiten el manejo y el análisis de datos espaciales, haciendo énfasis en las aplicaciones e implementaciones de la vida real. Se espera que al finalizar el curso se tenga conocimiento de: 
  • Manejo, búsqueda y optimización de base de datos espaciales.
  • Simulación y visualización de datos geográficos.
  • Conocimiento sobre algoritmos de geolocalización e identificación de patrones espaciales.
  • Compresión y manejo de los conceptos de auto correlación espacial y regresión espacial.
  • Algoritmos de Machine Learning aplicados a datos espaciales.
  • Creación de herramientas interactivas para la visualización e interacción con mapas.
  • Desarrollo de un proyecto propio utilizando datos geográficos.

Metodología

El curso es de carácter teórico-práctico. En las sesiones se abordarán, expondrán y discutirán aspectos conceptuales del análisis espacial. Todos los módulos cuentan con un componente práctico, desarrollado mediante ejercicios prediseñados, que consiste en el manejo software (Python) para análisis de datos. El estudiante tendrá acceso a los diferentes algoritmos y aplicaciones que se desarrollarán a lo largo del curso. Finalmente, cada estudiante (o en grupos) deberá desarrollar un proyecto de su interés que involucre el uso y análisis de datos espaciales y metodologías estadísticas.
 

Contenido

Sesión 1: Introducción: Aplicaciones, alcance y limitaciones
Estado del arte – Teoría-
Aplicaciones.
Alcances y limitaciones. 
Librerías mapas: Leaflet, Folium, Geopandas.
Simulación de datos.
Aplicación: Simulación y visualización de individuos.

Sesión 2: Manejo de datos espaciales
Fuentes de información: DANE, Openstreetmap.
Almacenamiento de la información.
Polígonos, puntos, y figuras. 
Cruce de bases de datos espaciales.
Aplicación: Inicio proyecto propio.

Sesión 3: Estadísticas descriptivas de geolocalización: 
Capas y siluetas. 
Mapas de calor.
Estimación de Densidad de Kernel.
Aplicación: Heatmap de eventos georreferenciados.

Sesión 4: Geolocalización: 
Localización de individuos. 
Información adicional por individuos.
Recorridos y tiempo de trayecto.
Identificación de rutas y objetos cercanos.
Identificación de zonas y localidades.
Aplicación: Visualización y estadísticas descriptivas. 

Sesión 5: Agrupación y optimización: 
K-vecinos cercanos.
Clusterización (distancias espaciales).
Optimización espacial.
Aplicación: Sistemas de geolocalización, emparejamiento óptimo de oferta y demanda. 

Sesión 6: Autocorrelación y regresión espacial
Conceptos básicos e interpretación. 
Estadísticos de autocorrelación espacial globales y locales. 
Regresiones lineales espaciales.
Aplicación: Prevalencia e incidencia de enfermedades.

Sesión 7: Algoritmos básicos de Machine Learning:
Aprendizaje supervisado
Aprendizaje no supervisado
Aprendizaje profundo para análisis de imagen.
Aplicación: Predicción de precios de vivienda.

Sesión 8: Aplicaciones y masificación: 
Visualización interactiva.
Introducción a Dash y Bootstrap 4. 
Aplicación: Construcción página web reactiva.

Sesión 9: Presentación proyecto propio.
Cada estudiante (o en grupos de 2 o 3 estudiantes) deberá desarrollar una aplicación de su interés utilizando datos propios o públicos y las técnicas metodológicas y computacionales vistas durante el curso.

Profesores

Mateo Dulce Rubio

Economista y matemático de la Universidad de los Andes, y Magíster en Economía de la misma universidad, título en que obtuvo el grado Cum Laude. Se ha desempeñado como profesor asistente en la Universidad de los cursos de Cálculo integral y ecuaciones diferenciales, Álgebra lineal, y Macroeconomía y finanzas internacionales. En adición, fue asistente de investigación en la Facultad de Economía en el estudio de sistemas dinámicos para modelar el comportamiento criminal en Bogotá. En la actualidad se desempeña como Director del área de Minería de Datos en Quantil | Matemáticas Aplicadas (www.quantil.co), donde se dedica al diseño, desarrollo e implementación de modelos matemáticos y de aprendizaje automático para la resolución de problemas prácticos de la industria, el gobierno, y la academia. Cuenta con amplia experiencia en minería de texto y procesamiento del lenguaje natural trabajando en el desarrollo de algoritmos para la extracción de información de textos, análisis de sentimiento, construcción de tópicos de conversación, y aprendizaje de máquinas en documentos jurídicos, contratos, redes sociales, entre otros. Ha sido el desarrollador líder en la implementación de modelos de matemáticas aplicadas a la seguridad ciudadana para la predicción de puntos calientes, ubicación de nuevos equipamientos policiales, y priorización de sistemas de videovigilancia. Adicionalmente, ha implementado modelos de análisis estadístico para la predicción de desafiliación de clientes bancarios, análisis espacial y de aparición y progresión de enfermedades de alto costo en Colombia, análisis de datos de transporte público para métricas de desempeño de los operadores, entre otros. Dominio avanzado de los lenguajes de programación Python y R.

Germán González

Economista e historiador de la Universidad de los Andes, Magister en Economía de la misma universidad. Se ha desempeñado como profesor asistente en la Universidad de los cursos de Microeconomía ll, Microeconomía lll e historia económica de Colombia. En adición, fue asistente de investigación en el Centro de Estudios sobre el Desarrollo Económico –CEDE–. En la actualidad se desempeña como Investigador del área de Matemáticas financieras en Quantil donde se dedica al diseño, desarrollo e implementación de modelos matemáticos buscan la gestión y cuantificación del riesgo en el sector real y publico. Cuenta con amplia experiencia en análisis de portafolio, coberturas de riesgo y modelos de trading algorítmico, y análisis de espacial de datos. Ha sido el desarrollador principal de QuanTrip, herramienta que permite identificar patrones de comportamiento de manera individual y agregada en los recorridos y lugares frecuentes de diferentes individuos en un determinado territorio. Ha participado en proyectos con Movendo y Sentiance que requieren de la simulación, geolocalización, reconocimiento de patrones y visualización de recorridos de individuos en la ciudad de Melbourne, Australia. Conocimiento de diferentes algoritmos de Machine Learning: minería de texto, redes neuronales y modelos de clasificación enfocados a modelos de trading algorítmico que pronostican la dirección de los retornos del S&P 500 a partir de los sentimientos de los inversionistas. Finalmente, Dominio avanzado de los lenguajes de programación Python y R.

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.