Análisis espacial de datos y sus aplicaciones en Python
Con las nuevas tecnologías de la información y la masificación de datos geolocalizados se han ampliado los espectros de investigación de los diferentes campos del conocimiento. Particularmente, los saberes de la cartografía y la estadística se han traslapado para consolidar el análisis espacial, como un campo de investigación que busca la compresión y el análisis de fenómenos que son influenciados por una dimensión espaciotemporal. En este sentido, el análisis espacial y sus aplicaciones son ampliamente utilizadas en diferentes disciplinas, que buscan entender cómo los patrones movilidad afectan otras esferas del conocimiento. En particular, este tipo de análisis permite enriquecer y facilitar tareas de segmentación y entendimiento de clientes.
Dirigido a
Este curso está dirigido a profesionales de cualquier disciplina que se encuentren interesados en temas territoriales, que deseen profundizar en los conceptos y herramientas más importantes del análisis espacial de datos. Se espera que los participantes tengan un conocimiento básico de manipulación de datos en Python e interés en el aprendizaje de los diferentes algoritmos y metodologías estadísticas que potencializan el análisis espacial de datos.
Objetivos
Este curso tiene como objetivo principal profundizar en un conjunto de técnicas y herramientas que permiten el manejo y el análisis de datos espaciales, haciendo énfasis en las aplicaciones e implementaciones de la vida real. Se espera que al finalizar el curso se tenga conocimiento de:
- Manejo, búsqueda y optimización de base de datos espaciales.
- Simulación y visualización de datos geográficos.
- Conocimiento sobre algoritmos de geolocalización e identificación de patrones espaciales.
- Compresión y manejo de los conceptos de auto correlación espacial y regresión espacial.
- Algoritmos de Machine Learning aplicados a datos espaciales.
- Creación de herramientas interactivas para la visualización e interacción con mapas.
- Desarrollo de un proyecto propio utilizando datos geográficos.
Metodología
El curso se realizará de manera virtual con sesiones sincrónicas. A su vez, el curso es de carácter teórico-práctico. En las sesiones se abordarán, expondrán y discutirán aspectos conceptuales del análisis espacial. Todos los módulos cuentan con un componente práctico, desarrollado mediante ejercicios prediseñados, que consiste en el manejo software (Python) para análisis de datos. El estudiante tendrá acceso a los diferentes algoritmos y aplicaciones que se desarrollarán a lo largo del curso. Finalmente, cada estudiante (o en grupos) deberá desarrollar un proyecto de su interés que involucre el uso y análisis de datos espaciales y metodologías estadísticas.
Contenido
Sesión 1: Introducción: Aplicaciones, alcance y limitaciones
a) Estado del arte – Teoría-
b) Aplicaciones.
c) Alcances y limitaciones.
d) Librerías mapas: Leaflet, Folium, Geopandas.
e) Simulación de datos.
f) Aplicación: Simulación y visualización de individuos.
Sesión 2: Manejo de datos espaciales
a) Fuentes de información: DANE, Openstreetmap.
b) Almacenamiento de la información.
c) Polígonos, puntos, y figuras.
d) Cruce de bases de datos espaciales.
e) Aplicación: Inicio proyecto propio.
Sesión 3: Estadísticas descriptivas de geolocalización:
a) Capas y siluetas.
b) Mapas de calor.
c) Estimación de Densidad de Kernel.
d) Aplicación: Heatmap de eventos georreferenciados.
Sesión 4: Geolocalización:
a) Localización de individuos.
b) Información adicional por individuos.
c) Recorridos y tiempo de trayecto.
d) Identificación de rutas y objetos cercanos.
e) Identificación de zonas y localidades.
f) Aplicación: Visualización y estadísticas descriptivas.
Sesión 5: Agrupación y optimización:
a) K-vecinos cercanos.
b) Clusterización (distancias espaciales).
c) Optimización espacial.
d) Aplicación: Sistemas de geolocalización, emparejamiento óptimo de oferta y demanda.
Sesión 6: Autocorrelación y regresión espacial
a) Conceptos básicos e interpretación.
b) Estadísticos de autocorrelación espacial globales y locales.
c) Regresiones lineales espaciales.
d) Aplicación: Prevalencia e incidencia de enfermedades.
Sesión 7: Algoritmos básicos de Machine Learning:
a) Aprendizaje supervisado
b) Aprendizaje no supervisado
c) Aprendizaje profundo para análisis de imagen.
d) Aplicación: Predicción de precios de vivienda.
Sesión 8: Aplicaciones y masificación:
a) Visualización interactiva.
b) Introducción a Dash y Bootstrap 4.
c) Aplicación: Construcción página web reactiva.
Sesión 9: Presentación proyecto propio.
a) Cada estudiante (o en grupos de 2 o 3 estudiantes) deberá desarrollar una aplicación de su interés utilizando datos propios o públicos y las técnicas metodológicas y computacionales vistas durante el curso.
Condiciones
Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.
La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.