Big data y machine learning en el mercado inmobiliario
Este curso busca introducir herramientas de Big Data y Machine Learning para estudiar las ciudades en las que vivimos y el mercado inmobiliario. Para esto, los estudiantes tendrán una combinación de clases teóricas y prácticas. En las clases teóricas se introducirán los conceptos teóricos fundamentales para las aproximaciones prácticas de los problemas. En las clases prácticas a su vez aprenderán herramientas de programación básicas en R.
Al finalizar el curso, el estudiante habrá adquirido conocimientos en los modelos teóricos básicos que explican la configuración de las ciudades y los precios de las propiedades. También estará en condiciones de obtener datos desde la web (webscraping, APIs), manejar datos espaciales, y usar algoritmos de Machine Learning para la tarea de predecir
Nota: se sugiere que el estudiante interesado en el curso cuente con un computador de 4GB de RAM pero preferiblemente 8GB en adelante.
Las instrucciones de instalación de los software que usará serán remitidas al inicio del curso.
Dirigido a
Este curso está dirigido a profesionales de cualquier disciplina que se encuentren interesados en el uso de herramientas de Big Data y Machine Learning aplicadas a la vida urbana y el precio de las propiedades.
Para tomar este curso y sacarle el mayor provecho posible, los estudiantes deben tener experiencia en manejo de datos (por ejemplo, Excel, STATA, etc.) y conocimientos básicos en R. Es recomendable también que los estudiantes tengan conocimientos básicos de cálculo y estadística (por ejemplo, regresión lineal)
Importante: Si tiene dudas sobre estos prerrequisitos, por favor consultar con el asesor.
Objetivos
Al finalizar el curso el estudiante estará en capacidad de
• Comprender los modelos de equilibrio espacial dentro y entre ciudades, como los modelos hedónicos de valuación de propiedades
• Reconocer, adquirir, y manejar distintas fuentes de datos
• Analizar y encontrar patrones en los datos recolectados
• Contrastar las ventajas y limitaciones de los algoritmos
• Adaptar datos y algoritmos para responder a problemas complejos / esenciales de la economía urbana
• Evaluar la calidad del modelo en términos de métricas de error relevantes para cada tarea
• Implementar estas técnicas en R.
Metodología
El curso combina clases magistrales con talleres prácticos donde se aplicarán los conocimientos teóricos discutidos en la clase magistral. Las aplicaciones prácticas estarán hechas en R y en Python.
Contenido
1. Introducción a los modelos de valuación (1 sesión)
1.1. Introducción a la Economía Urbana, precios hedónicos y a la programación en R.
1.2. Modelos de valuación de propiedades: Rosen-Roback, estado del arte, evidencia internacional.
2. Big Data geográfica (4 sesiones)
2.1. Las 4 V’s del Big Data: Variedad, Velocidad, Volumen y Veracidad.
2.2. Introducción a datos espaciales. Manejo de datos espaciales en R: rasters, polígonos, líneas, y puntos.
2.3. Obtención y procesamiento automáticos de datos en línea, webscraping y APIs, usando R. Datos satelitales, Open Street Map, DANE, etc.
2.4. Procesamiento de datos de texto, expresiones regulares en R.
3. Machine Learning con aplicación a la predicción de precios de propiedades en Colombia en R.(5 sesiones)
3.1. Introducción a Machine Learning. Predicción versus Inferencia. Dilema Sesgo-Varianza.
3.2 Modelos lineales y modelos semi-paramétricos.
3.3 CARTs, Bagging, Bosques Aleatorios.
3.4 Bossting, XGBoost, LightGBM
3.5 Redes Neuronales, Superlearners.
Condiciones
Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.
La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.