Por: José Manuel Peña, Director RSM Chile Technology

Incorporando el terreno en la ecuación.

Seguimos analizando cómo la ciencia de datos puede ayudar a resolver problemas del territorio (si quieres saber más, aquí está el primer post). En este segundo post, vamos a hablar sobre cómo el terreno mismo, en términos de su topografía, puede ser empleado como una fuente de información relevante para entender sistemáticamente el potencial de uso y valor.

Intuitivamente, la forma y tipo de terreno evidentemente influye el tipo de usos que este puede tener; No es lo mismo un terreno emplazado en la ladera de un cerro o quebrada que uno sobre una explanada. Esto es algo crítico en procesos de tasación o definición de idoneidad de un emplazamiento (trazado eléctrico, carreteras, proyectos mineros, etc), y en el proceso de tasación manual es un factor comúnmente considerado.

El problema es que el entender la topografía de un terreno para estos propósitos usualmente requería visitas a terreno para realizar mediciones, lo cual es extremadamente costoso y lento de realizar en escala. En este punto entra la ciencia de datos para que, en base a modelos digitales de elevación, caracterizar un terreno en términos de sus atributos topográficos de manera masiva y escalable, permitiendo incorporar información contextual de alto valor a problemas de manera innovadora y llegando a estimaciones más precisas y robustas.

Ejemplo: Análisis de Potencial Energético Solar para tasación de trazados.

En un caso similar se nos presentó el desafío de estimar para una gran minera chilena el costo de servidumbre de un trazado de terreno para fines confidenciales , la cual cruzaba de costa a cordillera a través del norte grande. 

Si bien las técnicas discutidas antes fueron útiles para dar contexto de cada predio a tasar, faltaba un elemento clave para entender el valor de estos, que era el potencial de cada terreno en ser una Concesión de Uso Oneroso (CUO), es decir, si podía utilizarse para la generación de energía solar o no (lo cual acarrea una mayor valoración).

En simple, en el norte grande la capacidad de generación solar es una de las más altas del mundo, por lo que para albergar un proyecto solar necesitas algunos elementos, por ejemplo:

El primer punto fue fácil de resolver con las técnicas ya discutidas (se estimó la distancia de cada predio a la subestación más cercana), pero el segundo punto era más difícil. ¿Cómo medir la pendiente y orientación de cada terreno en una franja de más de 20 kilómetros?.

Para esto tuvimos la grata ayuda de la NASA y sus satélites. Afortunadamente, la NASA ha generado un detallado (y pesadísimo) modelo digital de elevación global (DEM en sus siglas) llamado NASADEM, el cual con una precisión de 30 mt2, estima la elevación de cada punto de la tierra.

location_matters_2_variables_topologicas.pngCon estos datos, y un par de paquetes de análisis topográfico (en particular richDEM) logramos estimar la distribución de elevaciones, inclinaciones y orientaciones de cada terreno y así generar atributos como la mediana y variabilidad de inclinación y orientación de cada terreno.

Generamos predicciones de potencial de generación solar con sobre un 80% de precisión.

location_matters_2_rishdem.png

Ejemplo: Utilización de análisis de imágenes satelitales para la generación de atributos relevantes - Land Use [LU] o Land Cover [LC].

location_matters_2_satelite_img.png

La clasificación de la cobertura terrestre utilizando datos de teledetección es la tarea de clasificar píxeles u objetos cuyas características espectrales son similares y clasificarlos como bosques, pastizales, humedales, tierras áridas, tierras cultivadas y áreas edificadas. Se han aplicado varias técnicas a la clasificación de la cobertura terrestre, incluidos los algoritmos estadísticos y los enfoques recientes de machine learning.

Esto se ha realizado utilizando imágenes tradicionales en algunos casos y en otros con imágenes hiperespectrales (HSI):

Las imágenes hiperespectrales (HSI) son una técnica importante en la teledetección, que recopila el espectro electromagnético que va desde la longitud de onda visible hasta la infrarroja cercana. Los sensores de imágenes hiperespectrales a menudo proporcionan cientos de bandas espectrales estrechas desde la misma área en la superficie de la tierra. En imágenes hiperespectrales (HSI), cada píxel puede considerarse como un vector de alta dimensión cuyas entradas corresponden a la reflectancia espectral en una longitud de onda específica.

Esto nos permite obtener atributos relevantes a la hora de armar nuestros modelos como por ejemplo si una zona es:

ClasesDescripción
Zonas áridasZonas áridas.
EdificiosTodos los edificios o edificaciones no residenciales.
Edificios residencialesTodos los edificios con fines residenciales, casas u otros.
CaminosCaminos de asfalto, tierra, puesntes entre otros.
BosquesBosques o vegetación intensa
AguaRios, lagos o otras masas de agua relevantes.

Utilizando modelos de data science, en conjunto con fuentes ricas de datos, se pueden realizar trabajos que en otras épocas hubieran sido impensados, imaginen hace 20 años poder calcular la pendiente de un terreno en un trazado de más de 1000 km, cualquiera diría IMPOSIBLE, hoy con estas herramientas se puede hacer de forma eficiente y eficaz.

Dado este y muchos otros casos “LA UBICACIÓN IMPORTA”. En este y futuros posts vamos a seguir revisando oportunidades y definiciones que hemos abordado para incorporar efectivamente esta importante, pero comúnmente mirada a menos, dimensión de todo proceso en el territorio. En el siguiente artículo de geolocalización y data science hablaremos sobre cómo usar datos geolocalizados para predecir la fuga de tus clientes.