Organización de la Información en el Proyecto D2CR

Introducción

El proyecto D2CR trabaja con una gran cantidad de datos sobre la situación demográfica y socioeconómica de la provincia de Ciudad Real y sus territorios, incluidos cada uno de sus 102 municipios. Según los intereses del usuario, dicha información puede accederse y utilizarse de varias maneras y a varios niveles. De menor a mayor amplitud, son:

  • Informes escritos (menú ‘Informes’) con actualización periódica, donde se presentan y analizan los datos más relevantes, incluyendo en anexos algunas tablas con dichos datos para cada municipio y algunos otros territorios en que se subdivide la provincia.
  • En una colección de archivos digitales (menú ‘Informes’), que acompañan a los mencionados informes. Dichos archivos, disponibles en formato de hoja de cálculo Excel para facilitar el uso por no expertos, amplían bastante lo incluido en los informes escritos, por fuerza muy limitados.
  • En una colección de cuadros de mando (menú ‘Cuadros de Mando’), donde el usuario puede interactuar y navegar entre tablas, gráficos y mapas. En ellos se pueden visualizar, de manera fácil y cómoda, datos demográficos de un municipio, del total provincial o de otros territorios, conocer detalles de las migraciones o de la situación socioeconómica, entre otros.
  • En el repositorio completo (menú ‘Consultas’), donde se incluyen más de seiscientos mil datos en formato adecuado para descarga y procesamiento, siguiendo los principios de datos abiertos. El usuario puede elegir, mediante filtrado por tiempo, territorios o temática, el conjunto exacto de datos que desea y, luego, exportarlos a diversos estándares para su manejo (CSV, XLSX) o visualización (PDF).

Estructura Básica

Cada dato individual manejado en D2CR corresponde al valor de cierta propiedad (en D2CR les llamamos variables) para un cierto territorio en un cierto periodo o momento temporal. Es por ello que podemos considerar que la estructura general de la información en D2CR es una especie de cubo con tres dimensiones: temática (variables), temporal (periodos de tiempo) y territorial (territorios). Por ejemplo, el hecho de que ‘la población en el padrón oficial de 2021 del municipio Abenójar es de 1339 habitantes’ se representará como que el valor de la variable ‘población’ para el territorio ‘municipio de Abenójar’ en el periodo ‘2021’ es 1339. De esta manera es como si cada valor estuviese almacenado en una celda individual del cubo, tal cómo se muestra en la Figura 1.

 

Figura 1. Estructura tridimensional de los datos en D2CR.

Estructura Datos

 

Toda la información mostrada en las tablas, gráficas, mapas o archivos de cualquier tipo incluidos en D2CR se ajusta a esta estructura básica. Así, las columnas de una tabla corresponderán a un valor de un dato o a una característica de su dimensión temática (variable), territorial (territorio) o temporal (periodo). Da igual si procede de uno de los archivos Excel adjuntos al informe, se ha descargado del módulo de consultas o se visualiza en alguno de los cuadros de mando interactivos.

El tamaño del cubo D2CR se muestra en la Figura 1: 210 (variables) por 310 (territorios) por 92 (periodos temporales). En total esto supone casi 6 millones de celdas, es decir, de datos individuales. En la realidad muchas de las combinaciones no tienen valor, por ejemplo, porque de cada variable solo se dispone de datos para ciertos periodos temporales. El resultado es que el cubo real, en la versión de 2023 del proyecto D2CR, está formado por algo más de seiscientas mil celdas, es decir, de datos individuales con un valor.

Temas

Los temas de los que trata la información manejada (dimensión temática del cubo) se organizan en los niveles categoría/aspecto/variable. Así, cada variable pertenece a un aspecto (grupo de variables sobre el mismo tema) y estos, a su vez, a una de dos categorías, demografía o socioeconomía. En la Tabla 1 se muestra la cifra de variables manejadas en cada categoría y aspecto.

En la Tabla 1 se muestran, en columnas separadas, los tres tipos diferentes de variables que existen dependiendo de la manera de obtener su valor: directa (directamente de las fuentes utilizadas), calculadas (aplicando una fórmula matemática, o método de cálculo, que utiliza el valor de una o varias variables directas o calculadas previamente) y escala (una etiqueta cualitativa obtenida comparando el valor de otra variable numérica con una escala de rangos; por ejemplo, si densidad es 5’6 el valor de rango_densidad es la etiqueta ‘3: 5-10 hbts/km2, poco poblado’).

 

Tabla 1. Número de variables por categoría, aspecto y origen.

Número de Variables Origen
Categoría / Aspecto directa calculada escala Total
Demografía 30 42 3 75
cambio 5 1 6
dispersión 5 6 1 12
edad 4 4 8
lugar de nacimiento 2 1 3
movimiento natural 3 5 8
nacionalidad 2 1 3
sexo 2 3 5
tamaño 4 4 1 9
variaciones residenciales 8 13 21
Socioeconomía 69 66 135
agricultura 4 6 10
banca 1 1 2
empresas 4 4 8
infraestructura 22 27 49
mercado inmobiliario 4 6 10
nivel de estudios 4 5 9
renta 11 2 13
sector público 6 6 12
trabajo 12 8 20
vehículos 1 1 2
Total proyecto D2CR 99 108 3 210

La lista completa de variables y sus principales características se incluye en un archivo Excel disponible para descarga (menú ‘Organización de la Información’).

Territorios

En el proyecto D2CR se han manejado más de 300 territorios diferentes. En la Tabla 2 se muestra la cifra de territorios de cada tipo. Los territorios usados como base principal de todo el estudio en D2CR son los 102 municipios de la provincia de Ciudad Real. A efectos de referencia con la que comparar, también se manejan los datos para la provincia de Ciudad Real en su conjunto, así como la Comunidad Autónoma de Castilla-La Mancha y el conjunto de toda España. Se incluyen también datos para más de una docena de tipos de territorios intermedios entre el municipio y la provincia, que se definen por agregación de municipios.

Tabla 2. Tipos de territorios agrupados por clases.

clase tipo de territorio descripción
base Municipio Municipio 102
referencia Autonomía Comunidad Autónoma 1
Estado España (estado) 1
Provincia Provincia de Ciudad Real 1
agregado Aglomeración urbana Aglomeración Urbana 21
Área de salud Área de salud (SESCAM) 3
Área urbana Área Urbana (Ministerio de Transportes) 10
Área urbana (AUDES) Área Urbana (proyecto AUDES) 5
Comarca Comarca (Diputación Provincial) 6
Comarca agraria Comarca Agraria (Ministerio de Agricultura) 6
Grupo de acción local Grupos de Acción Local (Ministerio de Agricultura) 7
Mancomunidad Mancomunidad de Servicios (Ministerio de Hacienda) 16
Área de movilidad Área de Movilidad (INE) 38
Otros Otros territorios especiales 1
Partido judicial Partido Judicial (Ministerio de Justicia) 10
Zona básica de salud Zona Básica de Salud (SESCAM) 39
Zona funcional Zona Funcional (Facultad de Letras, UCLM) 7
Zona poblacional Zona Poblacional (ley 2/2021 Medidas .. frente a la Despoblación de Castilla-La Mancha) 12
Rango de cambio (*) Grupo de municipios con igual escala cualitativa de cambio anual medio (%) en 20 años (1999-2019) 7
Rango de densidad (*) Grupo de municipios con igual escala cualitativa de densidad (2019) 8
Rango de tamaño (*) Grupo de municipios con igual escala cualitativa de tamaño de población (2019) 9
Aglomeración urbana Aglomeración Urbana 21
Área de salud Área de salud (SESCAM) 3
Área urbana Área Urbana (Ministerio de Transportes) 10

Algunos tipos de territorios agregados abarcan toda la provincia (es el caso de comarca, comarca agraria, partido judicial o zona funcional). Otros, por su naturaleza, no cubren al total de los 102 municipios, como es el caso de las áreas urbanas y los grupos de acción local (que por ley no pueden incluir a los municipios de Ciudad Real, Puertollano y Tomelloso por contar con un núcleo urbano de más de 30 mil habitantes).

Un tipo especial de territorios agregados, marcados con (*) en la Tabla 2, corresponde a los formados por grupos de municipios con igual valor cualitativo en alguna variable demográfica relevante (tamaño de población, densidad o cambio medio anual). Frente a los otros territorios agregados, estos no tienen por qué tener coherencia o continuidad geográfica. Por ejemplo, se incluye un territorio de tipo ‘Rango de tamaño’ formado por todos los municipios que tiene un tamaño de población entre 1001 y 2000 habitantes. Los territorios de estos tipos sirven para poder analizar la situación por franjas de tamaño, densidad o de cambio medio anual, independientemente de donde se localicen los municipios.

La lista completa de territorios y sus principales características se incluye en un archivo Excel disponible para descarga (menú ‘Organización de la Información’). En dicho fichero también se incluye una tabla indicando los territorios agregados a los que pertenece cada municipio.

Periodos

La dimensión temporal se maneja mediante la indicación del periodo de tiempo al que corresponde cada dato. Un periodo puede referir a un único año o a un intervalo de años, en cuyo caso se expresa en la forma ‘<año de inicio>-<año de fin>’. Así, 2021 refiere al año 2021 y 2011-2021 refiere a los 10 años entre 2011 y 2021. Las dos fuentes principales de datos de población, ambas del Instituto Nacional de Estadística, son los padrones oficiales anuales, que existen desde 1996, y los censos oficiales, que se realizan con una periodicidad de 10 años. Hay años (2001, 2011 y 2021 hasta ahora) en que se realizó tanto un padrón como un censo, por eso en D2CR todos los censos se distinguen porque el año va seguido de una letra ‘c’. En la última versión del proyecto D2CR se han manejado 92 periodos diferentes, que corresponden a las clases indicadas en la Tabla 3.

Tabla 3. Clases de periodos temporales.

basado en clase duración (años) desde hasta
padrones 10 años 2 10 2001 2021
2 años 1 2 1996 1998
20 años 1 20 2001 2021
5 años 5 5 1996 2021
interpadrón 25 1 1996 2021
padrón 26 0 1996 2021
censo y padrón largo plazo 1 121 1900c 2021
mixto 1 10 2011c 2021
censos censos (etapa) 4 30 o 31 1900c 2021c
censos (largo plazo) 1 121 1900c 2021c
intercensal 11 10 o 11 1900c 2021c
censo 12 0 1900c 2021c
92

Los periodos de duración cero solo refieren a un único año, como 2019 o 2011c, y están asociados a variables como población o densidad, que se refieren a un hecho en una fecha determinada (ejemplo: la población del municipio de Abenójar el 1 de enero de 2021 es de 1339 habitantes). Los periodos con duración mayor que cero, como 2001-2021 o 1900c-2021c, están asociados a variables como nacimientos, migraciones o cambio poblacional, que se refieren a hechos ocurridos a lo largo de una serie de años (ejemplo: los nacimientos en el municipio de Anchuras entre 1 de enero de 2016 y el 1 de enero de 2021 fueron 13).

Para indicar las cifras de población (tamaño) y sus características (edad, sexo, nacionalidad, etc.) se utilizan periodos de clase ‘padrón’, que se refieren a cifras en uno de los padrones oficiales a fecha 1-enero de cada año (de ahí que su duración sea 0). Por el contrario, un periodo de tipo ‘interpadrón’, por ejemplo 2017-2018, se refiere a todo el año trascurrido entre el 1 de enero del año de inicio y el 1 de enero del año de fin, y se usará, por ejemplo, para indicar los nacimientos o migraciones a lo largo de los 365 días del periodo. Con los censos pasa algo parecido, habiendo periodos de tipo censo, sin duración, y periodos de tipo intercensal para las variables que refieren a hechos o cambios entre un censo y el siguiente.

La lista completa de periodos y sus principales características se incluye en un archivo Excel disponible para descarga (menú ‘Organización de la Información’).