Análisis espacial de datos y sus aplicaciones en Python

Curso

Análisis espacial de datos y sus aplicaciones en Python

Facultad de Economía
Inicio / Programas / Análisis espacial de datos y sus aplicaciones en Python
Con las nuevas tecnologías de la información y la masificación de datos geolocalizados se han ampliado los espectros de investigación de los diferentes campos del conocimiento. Particularmente, los saberes de la cartografía y la estadística se han traslapado para consolidar el análisis espacial, como un campo de investigación que busca la compresión y el análisis de fenómenos que son influenciados por una dimensión espaciotemporal. En este sentido, el análisis espacial y sus aplicaciones son ampliamente utilizadas en diferentes disciplinas, que buscan entender cómo los patrones movilidad afectan otras esferas del conocimiento.  En particular, este tipo de análisis permite enriquecer y facilitar tareas de segmentación y entendimiento de clientes.

Dirigido a

Este curso está dirigido a profesionales de cualquier disciplina que se encuentren interesados en temas territoriales, que deseen profundizar en los conceptos y herramientas más importantes del análisis espacial de datos. Se espera que los participantes tengan un conocimiento básico de manipulación de datos en Python e interés en el aprendizaje de los diferentes algoritmos y metodologías estadísticas que potencializan el análisis espacial de datos. 

Objetivos

Este curso tiene como objetivo principal profundizar en un conjunto de técnicas y herramientas que permiten el manejo y el análisis de datos espaciales, haciendo énfasis en las aplicaciones e implementaciones de la vida real. Se espera que al finalizar el curso se tenga conocimiento de: 

•    Manejo, búsqueda y optimización de base de datos espaciales.
•    Simulación y visualización de datos geográficos. 
•    Conocimiento sobre algoritmos de geolocalización e identificación de patrones espaciales. 
•    Compresión y manejo de los conceptos de auto correlación espacial y regresión espacial. 
•    Algoritmos de Machine Learning aplicados a datos espaciales. 
•    Creación de herramientas interactivas para la visualización e interacción con mapas. 
•    Desarrollo de un proyecto propio utilizando datos geográficos.
 

Metodología

El curso se realizará de manera virtual con sesiones sincrónicas. A su vez, el curso es de carácter teórico-práctico. En las sesiones se abordarán, expondrán y discutirán aspectos conceptuales del análisis espacial. Todos los módulos cuentan con un componente práctico, desarrollado mediante ejercicios prediseñados, que consiste en el manejo software (Python) para análisis de datos. El estudiante tendrá acceso a los diferentes algoritmos y aplicaciones que se desarrollarán a lo largo del curso. Finalmente, cada estudiante (o en grupos) deberá desarrollar un proyecto de su interés que involucre el uso y análisis de datos espaciales y metodologías estadísticas.

Contenido

1)    Sesión 1: Introducción: Aplicaciones, alcance y limitaciones
a)    Estado del arte – Teoría-
b)    Aplicaciones.
c)    Alcances y limitaciones. 
d)    Librerías mapas: Leaflet, Folium, Geopandas.
e)    Simulación de datos.
f)    Aplicación: Simulación y visualización de individuos.

2)    Sesión 2: Manejo de datos espaciales
a)    Fuentes de información: DANE, Openstreetmap.
b)    Almacenamiento de la información.
c)    Polígonos, puntos, y figuras. 
d)    Cruce de bases de datos espaciales.
e)    Aplicación: Inicio proyecto propio.

3)    Sesión 3: Estadísticas descriptivas de geolocalización: 
a)    Capas y siluetas. 
b)    Mapas de calor.
c)    Estimación de Densidad de Kernel.
d)    Aplicación: Heatmap de eventos georreferenciados.

4)     Sesión 4: Geolocalización: 
a)    Localización de individuos. 
b)    Información adicional por individuos.
c)    Recorridos y tiempo de trayecto.
d)    Identificación de rutas y objetos cercanos.
e)    Identificación de zonas y localidades.
f)    Aplicación: Visualización y estadísticas descriptivas. 

5)    Sesión 5: Agrupación y optimización: 
a)    K-vecinos cercanos.
b)    Clusterización (distancias espaciales).
c)    Optimización espacial.
d)    Aplicación: Sistemas de geolocalización, emparejamiento óptimo de oferta y demanda. 

6)    Sesión 6: Autocorrelación y regresión espacial
a)    Conceptos básicos e interpretación. 
b)    Estadísticos de autocorrelación espacial globales y locales. 
c)    Regresiones lineales espaciales.
d)    Aplicación: Prevalencia e incidencia de enfermedades.

7)    Sesión 7: Algoritmos básicos de Machine Learning:
a)    Aprendizaje supervisado
b)    Aprendizaje no supervisado
c)    Aprendizaje profundo para análisis de imagen.
d)    Aplicación: Predicción de precios de vivienda.

8)     Sesión 8: Aplicaciones y masificación: 
a)    Visualización interactiva.
b)    Introducción a Dash y Bootstrap 4. 
c)    Aplicación: Construcción página web reactiva.

9)    Sesión 9: Presentación proyecto propio.
a)    Cada estudiante (o en grupos de 2 o 3 estudiantes) deberá desarrollar una aplicación de su interés utilizando datos propios o públicos y las técnicas metodológicas y computacionales vistas durante el curso.
 

Profesores

Germán González

Economista e historiador de la Universidad de los Andes, Magister en Economía de la misma universidad. Se ha desempeñado como profesor asistente en la Universidad de los cursos de Microeconomía ll, Microeconomía lll e historia económica de Colombia. En adición, fue asistente de investigación en el Centro de Estudios sobre el Desarrollo Económico –CEDE–. En la actualidad se desempeña como Investigador del área de Matemáticas financieras en Quantil donde se dedica al diseño, desarrollo e implementación de modelos matemáticos buscan la gestión y cuantificación del riesgo en el sector real y publico. Cuenta con amplia experiencia en análisis de portafolio, coberturas de riesgo y modelos de trading algorítmico, y análisis de espacial de datos. Ha sido el desarrollador principal de QuanTrip, herramienta que permite identificar patrones de comportamiento de manera individual y agregada en los recorridos y lugares frecuentes de diferentes individuos en un determinado territorio. Ha participado en proyectos con Movendo y Sentiance que requieren de la simulación, geolocalización, reconocimiento de patrones y visualización de recorridos de individuos en la ciudad de Melbourne, Australia. Conocimiento de diferentes algoritmos de Machine Learning: minería de texto, redes neuronales y modelos de clasificación enfocados a modelos de trading algorítmico que pronostican la dirección de los retornos del S&P 500 a partir de los sentimientos de los inversionistas. Finalmente, Dominio avanzado de los lenguajes de programación Python y R.