Por morfema.press

¿Cuántos habitantes tiene Venezuela? ¿Cómo están distribuídos geográficamente? Esta investigación de la consultora Anova nos da las respuestas

Anova es un empresa que genera y analiza datos para fines investigativos. En esta oportunidad utilizaron imágenes satelitales y métodos estadísticos para cifrar la población actual de Venezuela en 28.142.489 habitantes como valor medio con margen de error del (+/- 3,9%). Lea a continuación su análisis

Introducción

Venezuela ha experimentado la ola de emigración más grande de la historia moderna del hemisferio occidental. De acuerdo a algunas fuentes [1], en los últimos años, unos 6,1 millones de migrantes venezolanos se establecieron en otros países, principalmente en Colombia, Ecuador, Perú y Chile. Si uno toma como cierta esa cifra, se trataría de un país que perdió casi un quinto de su población, un éxodo que tiene, y seguirá teniendo, repercusiones de todo orden en Venezuela y el resto de la región.

Más allá de la cifra total de migrantes estimados, se sabe muy poco sobre sobre la distribución territorial de los cambios ocurridos. En la actualidad, no se dispone de instrumentos para saber con certeza, no solo el número total de personas que se fue, sino cómo quedó la distribución espacial de la población venezolana después del éxodo. Idealmente, corresponde al Estado, a través de los Censos de Población y Vivienda (CPV), llenar este vacío de información, pero el último CPV de Venezuela fue hecho en 2011, y las provisiones para tener pronto un nuevo CPV no lucen demasiado promisorias [2].

Saber cuánta gente vive en un país y su distribución territorial es de fundamental importancia para el diseño, planeamiento, ejecución y evaluación de las políticas públicas. De hecho, la inmensa mayoría de las decisiones públicas depende de ello en menor o mayor grado. Desde las decisiones de distribución presupuestaria, pasando por el diseño de programas de atención, y la localización de inversiones, hasta  aspectos del desarrollo urbano, el control de enfermedades infecciosas y planes de evacuación, toda una gama de políticas públicas depende de ello [3].

Esta nota presenta los resultados principales de una investigación realizada por ANOVA Policy Research para el Banco Interamericano de Desarrollo, que busca medir los impactos demográficos de la reciente ola migratoria en Venezuela. En esta investigación se usan metodologías emergentes para la estimación de las bases poblacionales actualizadas de Venezuela, usando para ello la información contenida en imágenes satelitales públicas de la superficie del territorio venezolano, para estimar modelos predictivos de la población venezolana y su distribución geográfica contemporánea.

En ausencia de información censal actualizada o de datos muestrales adecuados, esta investigación ofrece la primera estimación estadística y metodológicamente robusta sobre el tamaño actual de la población de Venezuela y la de cada uno de sus municipios.

Datos y metodología

Esta investigación hace uso extensivo de datos no convencionales y de técnicas computacionales emergentes para estimar las nuevas bases demográficas de Venezuela.

La estrategia metodológica utilizada para la construcción de los modelos predictivos de población constó de dos etapas: En la etapa 1, o fase de entrenamiento, se estimó un modelo no-paramétrico que asoció la densidad poblacional de un conjunto de segmentos del censo de 2011 [4], con imágenes satelitales de la misma época. Esta estimación se hizo mediante la utilización de algoritmos de aprendizaje automatizado (machine learning). En la etapa 2, se usan los resultados de la etapa 1 para proyectar o “predecir” la densidad poblacional actual de 22.320 segmentos censales, utilizando como insumo imágenes satelitales contemporáneas obtenidas de Google Maps Platfom.

Para la interpretación, análisis y descomposición de imágenes satelitales se utilizaron dos enfoques: el modelo de extracción de características pre-entrenadas, como en Christie et. al. (2018) [5], y el método de creación de variables a partir de pixeles de Hillson et al.(2019)[6]. Está última aproximación, que fue la especificación favorita para la investigación, se basa en la generación de una gama de variables descriptivas de los pixeles de una imagen, que pueden luego ser utilizadas como variables independientes o regresores en un modelo de población [7]. Para esta investigación se usaron varias fuentes de imágenes satelitales de distinta resolución [8]. Para la construcción del modelo de entrenamiento 2011-2013 (coincidente con el censo 2011), se obtuvieron imágenes (30m) del proyecto Landsat 8, de acceso gratuito a través de Google Earth Engine (Ver Figura 1).

Figura 1. Imagen de Landsat 8 (30m) alrededor de Distrito Capital, Venezuela

Fuente: Proyecto Landsat 8, Google Earth Engine

Asimismo, se obtuvo un mosaico parcial de imágenes satelitales de alta resolución (2m) proveniente de los satélites GeoEye-1, QuickBird, y WorldView-2, que cubren imágenes tomadas entre 2010 y 2013 de una muestra de territorio de unos 2000 km2, sobre 3.795 segmentos censales que representan 11% de la población del censo 2011. El mosaico satelital fue diseñado para ofrecer un balance entre zonas de la capital, zonas urbanas del interior y zonas rurales (Ver Figura 2).

Figura 2. Mosaico de imágenes satelitales de alta resolución (2m) alrededor de Distrito Capital, Venezuela

Fuente: GeoEye-1, QuickBird, y WorldView-2

Como complemento para las fases de entrenamiento/predicción, se obtuvo un conjunto de datos de luminosidad nocturna provenientes del instrumento VIIRS (Visible Infrared Imaging Radiometer Suite). En total, se consideraron 61 variables independientes (regresores) que caracterizaron cada uno de los segmentos censales disponibles. La variable dependiente a ser estimada por los modelos fue la densidad poblacional del segmento censal.

Finalmente, para la etapa final de proyección o predicción poblacional, se usaron imágenes satelitales actuales (año 2020), adquiridas gratuitamente a través de Google Maps Platform, con una alta resolución de aproximadamente 2,4m, correspondientes a 23.712 segmentos censales a lo largo y ancho del territorio nacional (ver Figura 3), la superficie cubierta por las imágenes disponibles para 2020 concentra aproximadamente el 80% de la población del censo 2011.

Figura 3. Cobertura geográfica de los segmentos censales con imágenes satelitales de alta resolución. Año 2020.

Fuente: INE y Google Maps Platform.

Resultados

De las opciones metodológicas aplicadas, la especificación preferida fue un modelo para estimar el logaritmo de la densidad poblacional, con segmentos agrupados por categorías de densidad baja, media y alta. El modelo fue estimado mediante algoritmos de árboles de decisión del tipo Gradient Boosting Machine. Esta especificación minimizó el error cuadrático medio entre las estimaciones del modelo y los valores reales. La estimación de intervalos de credibilidad para la estimación puntual poblacional se obtuvo mediante un proceso iterativo de bootstrapping con hiper-parámetros fijos para la post-distribución en la tradición de la estadística bayesiana [9].

Nuestra especificación preferida utilizando imágenes de 2020 de Google Maps Platform, logró imputar la densidad poblacional de los 22.320 segmentos censales que concentran el 80% de la población. Para la mayoría del resto de los segmentos censales (zonas menos densas, rurales o desiertas), se imputaron valores basados en la tasa de cambio de segmentos vecinos pertenecientes a la misma parroquia o municipio [10].

Esta investigación encuentra que la población total de Venezuela en 2020 puede ser estimada en 28.142.489 habitantes (+/- 3,9%). Tomando en consideración que el Instituto Nacional de Estadísticas de Venezuela proyectaba una población de 32.605.423 habitantes para ese año, nuestra estimación implica que el país tiene 14% menos población que lo que se esperaba tener de acuerdo a proyecciones oficiales. Esta estimación permite escalar la magnitud de la pérdida poblacional producto del éxodo migratorio venezolano en 4.462.934 personas. Esta cifra destaca como menor a la estimación de las agencias internacionales especializadas, que para la época situaban la cantidad total de migrantes y refugiados venezolanos en unos 5,4 millones de personas [11].

Esta investigación es la primera que ofrece una estimación independiente y metodológicamente robusta de la distribución actual de la población de Venezuela a nivel sub-nacional. De hecho, el producto central de este trabajo es una estimación de la población total de los 24 entidades federales y de los 335 municipios del país, luego de la enorme ola migratoria que afectó al país en los últimos años.

Una evaluación preliminar de los datos estimados a nivel estadal y municipal -comparando con la proyección oficial del INE para 2020-, permite concluir que los estados Miranda, Mérida, Yaracuy, Trujillo y Táchira, son los que presentan mayor “pérdida” poblacional por la migración. Por su parte, los municipios Libertador (Distrito Capital), Maracaibo (Zulia), Sucre (Miranda), Caroní (Bolívar) e Iribarren (Lara), son las unidades municipales que más han “perdido” población por el éxodo migratorio. Esta estimación es un corte transversal que incorpora cualquier efecto neto que pudieran tener las migraciones internas que han ocurrido durante el mismo tiempo.

La figura 4 muestra la distribución territorial de los cambios estimados de población a nivel municipal. El mapa muestra la diferencia entre nuestra estimación basada en imágenes satelitales y la proyección oficial del Instituto Nacional de Estadísticas para el año 2020.

Figura 4. Cambios en la población municipal en 2020. Estimación Vs. Proyección oficial del INE.

Fuente: Cálculos propios ANOVA Policy Research

Hallazgos e Implicaciones

  • Esta investigación de hace uso de datos no convencionales y de técnicas computacionales emergentes para estimar nuevas bases demográficas para Venezuela. Con ese propósito, se construyeron modelos para estimar la densidad poblacional para cada segmento censal en el último censo de población (2011), utilizando como variables independientes la información extraída de imágenes satelitales históricas coincidentes (2011-2013) y datos de iluminación nocturna de la época.
  • En ausencia de información censal actualizada o datos muestrales adecuados, esta investigación ofrece la primera estimación, estadística y metodológicamente robusta, de la población total actual de Venezuela y la de sus distintas unidades sub-nacionales.
  • Los modelos de densidad poblacional de esta investigación se estimaron mediante algoritmos predictivos no paramétricos de aprendizaje automatizado (machine learning), aplicados sobre un conjunto de imágenes satelitales de 2020 obtenidas de Google Maps Platfom, e información de luminosidad nocturna concurrente. El método de estimación que arrojó mejores resultados fue el de construcción de variables independientes a partir de la descomposición de pixeles propuesto por Hillson et al.(2019).
  • Se estima que la población de Venezuela en 2020 ascendió a 28.142.489 personas (+/- 3,9%). Si se compara esta estimación con la proyección censal oficial del Instituto Nacional de Estadísticas de Venezuela para 2020 (32.605.423), se infiere que Venezuela habría perdido un estimado de 4.462.934 habitantes con respecto a lo esperado, es decir, de acuerdo a esta estimación Venezuela habría perdido 13,7% de su población.
  • La estimación puntual de esta investigación resulta menor a la cifra estimada por agencias internacionales especializadas, que para 2020 situaban la cantidad total de migrantes y refugiados venezolanos en unos 5,4 millones de personas.
  • Esta investigación confirma la profundidad de los impactos demográficos internos que ha tenido la crisis migratoria de Venezuela de los años recientes. Se estima que los estados Miranda, Mérida, Yaracuy, Trujillo y Táchira, y los municipios Libertador (Distrito Capital), Maracaibo (Zulia), Sucre (Miranda), Caroní (Bolívar) e Iribarren (Lara), son las entidades territoriales con mayor pérdida de población como consecuencia de la migración.
  • La estimación de las nuevas bases poblacionales de Venezuela a nivel de estados y municipios ofrece, por primera vez, una visión de los efectos demográficos netos a nivel sub-nacional, causados por los abruptos movimientos migratorios producidos durante los últimos años en Venezuela. Esta investigación ofrece una información que es de crucial importancia desde el punto de vista analítico, académico y de políticas públicas.

Referencias

[1] https://www.r4v.info/es/home

[2] https://xvcenso.gob.ve/datos-importantes/

[3] Robinson, Hohman y Dilkina (2017)

[4] El segmento censal es la unidad de observación básica de esta investigación. En los datos del censo, constituye un área operativa que concentra las viviendas de una o varias manzanas. Un centro poblado a partir de 120 viviendas, agrupa uno o varios segmentos censales. Los datos del censo de 2011 disponen de información de 54.967 segmentos censales.

[5] Christie, G., Fendley, N., Wilson, J., & Mukherjee, R. (2018). Functional map of the world. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 6172-6180).

[6] Hillson, R., Coates, A., Alejandre, J. D., Jacobsen, K. H., Ansumana, R., Bockarie, A. S., … & Stenger, D. A. (2019). Estimating the size of urban populations using Landsat images: a case study of Bo, Sierra Leone, West Africa. International journal of health geographics, 18(1), 1-24.

[7] Entre las variables extraídas está la los promedios de los componentes de las imágenes  (medidas de intensidad); medidas de transformaciones de pixeles; y diversas medidas de variabilidad espacial (medidas de textura). Las imágenes analizadas contienen tres bandas de colores: rojo, verde y azul. Los valores de los pixeles en estos componentes representan la intensidad del color y toman valores de 0 a 255. Mientras mayor sea el valor del pixel, mayor es la intensidad del color que está representando.

 [8] La resolución espacial de una imagen hace referencia a cuánto representa la unidad más pequeña (pixel) de dicha imagen sobre el suelo terrestre y se expresa en metros. Mientras menor sea el área representada en un pixel de una imagen, mayores son los detalles que pueden ser capturados. Las imágenes satelitales de común acceso tienen una resolución espacial media de entre 10m y 30m, como el satélite Sentinel (10 – 20m) o el Landsat (30m).

[9] El proceso de construcción de intervalos de credibilidad mediante bootstrapping se realizó con la simulación de 1000 estimaciones de la estructura entrenada del modelo, aplicadas sobre datos fuera de la muestra. Se reportan intervalos de credibilidad correspondiente al límite máximo, mínimo y la deviación estándar de un segmento que agrupa el 70%  de las observaciones.

[10] Con este procedimiento se asignaron valores para el 93% de los segmentos censales del país. Para imputar la población del 7% de los segmentos restantes se aplicó la técnica “Propensity Score Matching”, que identifica a través de un modelo de probabilidad grupos de segmentos similares a los segmentos de interés.

[11) Alto Comisionado de las Naciones Unidas para los Refugiados (ACNUR). (2021). Situación en Venezuela. Recuperado el 18 de enero del 2021, a partir de https://www.acnur.org/situacion-en-venezuela.html