Construyendo un Índice de Movilidad Sustentable

Introducción

La movilidad se ha convertido en uno de los asuntos prioritarios a atender y resolver en la ciudad, las estrategias que se han llevado a cabo hasta el momento, en la mayoría de los casos, no han logrado crear las condiciones óptimas para la población en las áreas urbanas. Cuenca, en términos de movilidad, se define por dos rasgos contrastantes, por un lado la importancia del transporte público, dado que el 43% de la población lo utiliza, y por el otro, el creciente aumento de la motorización y la congestión vehicular, modalidad en la que se invierte un alto porcentaje de los recursos públicos. Para entender mejor el estado actual de la movilidad urbana en Cuenca, LlactaLAB en colaboración con el Plan de Movilidad y Espacios Públicos (PMEP) del GAD Municipal de Cuenca realizó una encuesta de percepción sobre movilidad en toda la ciudad. Esta encuesta proporciona valiosos datos de percepciones y actitudes de los cuencanos sobre la movilidad en la ciudad que pueden guiar futuras intervenciones.

Como parte de este estudio se realizaron algunas preguntas sobre modalidades de transporte y su frecuencia, a partir de estos datos se pudo construir un índice que llamamos índice de movilidad sustentable. El índice mide la movilidad motorizada y no motorizada en las distintas zonas. A diferencia del índice de motorización, que mide la cantidad de autos privados por el número de habitantes, el índice propuesto mide la cantidad de usuarios que utilizan los distintos medios de transporte, su frecuencia y les da un peso de acuerdo al nivel de motorización de cada modalidad y su intensidad de uso. Este índice está compuesto por valores de 1 a 10, valores bajos corresponden a zonas en las que sus habitantes usan principalmente el auto y valores altos a zonas en las sus habitantes principalmente caminan.

Cálculo del índice:

Variables:

indice

Formula:

formula

Resultados:

IMS

En el tema de movilidad, la ciudad de Cuenca comparte (aunque en menor grado) los mismos síntomas de una movilidad deficiente que otras ciudades latinoamericanas, estas deficiencias se traducen en: congestión vehicular producto de la dispersión y de la alta inversión en infraestructura para el automóvil; poca accesibilidad dentro de la ciudad para peatones y ciclistas; contaminación del aire dentro del medio ambiente urbano, entre otros. Sin embargo, como se puede ver en la figura, gran parte de la ciudad tiene un índice de movilidad sustentable medio, esto principalmente por el alto uso del transporte público (que compone el 43% del reparto modal). El Centro Histórico es la zona con el mejor índice de toda la ciudad, puesto que la mayoría de los habitantes señalan que caminan como principal medio de transporte. Existe una agrupación de índices bajos, en la zona del Ejido, Yanuncay, y Monay, en las cuales la modalidad de transporte es principalmente el auto privado. En relación a los datos presentados es necesario hacer nuevas preguntas que den luz a las distintas condicionantes que han dado como resultado la movilidad actual en la ciudad. Esto permitirá entender mejor las causas y permitirán orientar mejor las estrategias e intervenciones urbanas dentro de Cuenca.

Autor: Mateo Neira
Twitter: @mateoneira

Nota de Investigación: Componentes principales, relaciones con sentido.

La búsqueda de relaciones entre variables es un proceso muy utilizado en la investigación. Ocurre luego de la descripción general de indicadores y ayuda como un paso previo a la búsqueda de causalidad entre variables.

A veces este paso suele realizarse de forma mecánica, encontrando correlación entre variables sin una conexión aparente. Es ahí donde interviene el investigador, quien con su conocimiento del fenómeno puede discriminar aquellas relaciones útiles de las que no tienen sentido.

En el Proyecto de Modelos de Densificación Sustentable dividimos nuestra zona de estudio en una cuadrícula compuesta por 85 celdas de 200m x 200m, y levantamos en cada una de ellas información de 19 indicadores que miden compacidad, diversidad de uso, verde urbano e integración socio-espacial. En el equipo nos preguntamos: ¿qué herramienta nos puede ayudar a dar sentido a las relaciones existentes? Aparte de nuestro conocimiento del fenómeno investigado, necesitábamos una técnica que nos ayude a explorar relaciones multivariadas en distintos niveles.

Nos decidimos a usar componentes principales, una técnica estadística cuyo propósito principal es la reducción de variables a través de la conformación de componentes que vinculan todas las variables con un peso específico. Por medio de estos coeficientes, caracterizamos los componentes, sacando a la luz las relaciones que tienen algunas variables entre sí.

Por ejemplo, el primer componente que obtuvimos nos ayudó a vincular ocho de las diecinueve variables iniciales con distintos valores:

Valor muy alto: Compacidad absoluta.

Valor alto:Complejidad urbana, Actividades comerciales cotidianas, Continuidad espacial y funcional de la calle corredor.

Valor bajo: Índice de verde, Volumen de verde en el espacio público.

Valor muy bajo: Área de predios vacíos. Permeabilidad de suelo público

Este componente nos muestra lugares densos en edificación, con actividades comerciales y productivas, facilidades para el peatón y baja cantidad de verde urbano, todas ellas características de lugares con vocación comercial.

Al representar estos valores en el mapa, podemos observar que los valores altos en este componente están vinculados a las grandes vías y a los lugares más comerciales de la zona de estudio.

Mapa Componentes Principales 1

Valores que toman las observaciones en el Componente 1 por cuartiles.

Las técnicas estadísticas, cuando se aplican a observaciones espaciales, nos permiten observar patrones que pudieron pasar desapercibidos. En este caso, el análisis de componentes principales se realizó por medio del programa IBM SPSS Statistics 20, aunque también es posible realizarlo con STATA en sus versiones más recientes. ¡Lo recomendamos!

Una explicación detallada sobre el método de componentes principales se puede encontrar en este documento de la Universitat Oberta de Catalunya.

Autor: Pablo Osorio

Nota de Investigación: Las posibilidades de las redes sociales – el hashtag #llactacamp en Twitter

El análisis de redes sociales fue desarrollado de una forma poco técnica por las preocupaciones estructurales del antropólogo Radcliffe-Brown a inicios del siglo XX. Desde la década de 1930 hasta 1970 un número creciente de antropólogos y sociólogos comenzaron a construir sobre el concepto de “estructura social” de Radcliffe-Brown y a utilizar metáforas encaminadas a comprender las relaciones a través de las cuales se organizan las acciones sociales, la metáfora de “red” social pasó a primer plano. Desde principios de 1970 una gran cantidad de trabajo técnico y aplicaciones especializadas empezaron a aparecer, y a partir de estos trabajos surgieron los conceptos claves de análisis de redes sociales.

Actualmente las redes sociales, plataformas que permiten interacción social virtual, como twitter producen una cantidad enorme de datos, estos datos no se encuentran estructurados, pero contienen una serie de metadatos que posibilitan estudiar las distintas propiedades de las redes y abstraer información de ellas. Durante el evento de Llactacamp2.0, realizado entre el 13 al 15 de marzo del 2015, se incentivó que los asistentes, y cualquier otra persona interesada, que interactúe en twitter utilizando el hashtag #llactacamp. Para recolectar estos datos se utilizó la librería de twitter de Python y se realizó una consulta mediante el API de la plataforma. Realizada esta consulta se pudo ver que hubo 166 usuarios hablando sobre ciudad y 973 tweets en total. Es a través de estos datos que se trata de responder las siguientes preguntas utilizando diversas herramientas de análisis de redes y visualización.

  1. ¿De dónde provienen los tweets con mayor influencia del llactacamp?
  2. ¿Cuál fue el tema más compartido dentro de la red?
  3. ¿Cuáles fueron los principales temas de conversación alrededor de llactacamp?
  4. ¿Cuáles fueron esas redes que se formaron?

 

¿De dónde provienen los tweets con mayor influencia del llactacamp?

Para visualizar la influencia de las distintas ubicaciones de donde se realizaron los tweets, se limpiaron los datos geocodificados mediante Open Refine, Luego se aplicó un algoritmo de centralidad del vector propio con NodeXL para medir la influencia de cada persona dentro de la red. La centralidad del vector propio se calcula evaluando qué tan bien conectado un individuo se encuentra a las partes de la red con mayor conectividad. Los individuos con valores altos de vector propio tienen muchas conexiones, y sus conexiones tienen muchas conexiones y así hasta el final de la red. Una vez calculado la centralidad de vector propio para cada usuario se les agrupo a los usuarios por ciudad y se generó la visualización que se muestra a continuación, el tamaño de los círculos está dado por la centralidad de vector propio multiplicado por la cantidad de tweets y los colores únicamente por la centralidad del vector propio. Esto permite visualizar el alcance que tuvieron los tweets mandados desde distintas ciudades del Ecuador, como se puede visualizar los tweets enviados desde Quito tuvieron el mayor alcance he influencia, seguidos por Cuenca (ciudad donde se realizó el evento).

 

Mapa_tweets

 

 

 

 

 

 

 

 

 

Se puede realizar un procedimiento similar para visualizar las personas más influyentes dentro de la red y la cantidad de tweets que estos enviaron. En este caso no importa la ubicación de los tweets, únicamente la centralidad de vector propio de cada usuario y la cantidad de tweets que estos realizaron. En la imagen que se muestra a continuación el tamaño de los círculos está dado por el número de tweets que envió cada usuario y el color por la centralidad del vector propio. Una de las cosas interesantes que se pueden visualizar es que @FundacionAvina, aunque no envió una gran cantidad de tweets sobre #llactacamp, es uno de los usuario con mayor influencia dentro de la red.

Usuarios

 

 

 

 

 

 

 

 

 

 

¿Cuál fue el tema más compartido dentro de la red?

Uno de los metadatos que nos proporciona Twitter es el número de veces que fue retuiteado un tweet específico. Con la aplicación Tableau se generó la visualización que se muestra a continuación, el color y el tamaño de los círculos está dado por el número de retweets de cada tweet. Dentro de los temas que más resaltan, y coinciden con el interés que se mostró durante el evento, es la necesidad de pensar en una ciudad para los niños. El tema que más interés generó fue el convertir a un parqueadero en un parque de bolsillo. A esta actividad se le denominó hackeando la ciudad.

 

tweets

 

 

 

 

 

 

 

 

 

 

 

 

 

 

¿Cuáles eran los principales temas de conversación alrededor de llactacamp?

Para visualizar los principales temas de conversación alrededor de #llactacamp se creó un wordcloud con el paquete “wordcloud” dentro del lenguaje de programación R. El tamaño de las letras corresponde a la frecuencia que aparecen dentro de la totalidad de tweets generados con el hashtag #llactacamp. La visualización solo muestra la frecuencia de palabras individuales, para una mejor aproximación a los distintos temas puede ser interesante generar la frecuencia de pares de palabras con el fin de tener una mejor contextualización.

 

word_cloud

 

 

 

 

 

 

 

 

 

 

¿Cuáles fueron esas redes que se formaron?

Mediante Gephi, se realizó una visualización para poder ver los subgrupos dentro de la red. Para esto se utilizó el algoritmo de clasificación por modularidad. La modularidad es una medida de la estructura de las redes, este algoritmo busca los nodos que están más densamente conectados entre sí comparados al resto de la red (para una explicación más detallada pueden leer el paper llamado “Fast unfolding of communities in large networks”, publicado por el creador del algoritmo). Los colores representan distintos subgrupos, y las líneas las conexiones existentes entre los distintos usuarios. Usando este tipo de análisis se puede observar como, por ejemplo, @FundacionAVINA actúa como conector a un nuevo grupo de personas que no estaban originalmente conectadas a la red, comprendidas por empresas y personas más vinculadas con temas sociales.

red

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

¿Qué pasa cuando aplicamos este tipo de análisis a la ciudad?

Estas formas de analizar redes sociales pueden ser aplicadas a una escala mucha más grande, lo que permite visualizar los distintos grupos o subgrupos dentro de toda una ciudad, y entender como estos interactúa entre sí. Existen investigaciones interesantes que muestran este potencian, por ejemplo:

https://www.youtube.com/watch?v=PhVP1tNeGyY&feature=youtu.be

Autor: Mateo Neira

 

Nota de investigación: Análisis exploratorio de datos de movilidad.

En esta nota de investigación, mostramos cómo hemos creado una serie de funciones de R que nos permiten visualizar datos de movilidad en un cubo espacio-temporal en Google Earth.

SPACE-TIME CUBE

El problema

Representar visualmente los datos de movilidad es todo un reto. Por un lado, estos datos son espacio-temporales, pues representan la posición de un objeto en el espacio y en el tiempo. Por otro lado, suelen ser muchísimos; por ejemplo, en un reciente experimento registramos el movimiento de 20 personas moviéndose en bicicletas por Cuenca utilizando GPS que graban la posición cada 5 segundos, dando como resultado un conjunto de aproximadamente 71 000 observaciones. Finalmente, suelen ser multi-escala, pues tienen a la vez gran detalle y amplia extensión espacio-temporal. En el ejemplo anterior, aunque la posición de cada bicicleta se grabó cada 5 segundos, cada viaje duraba al rededor de una hora y diferentes viajes ocurrieron en diferentes días.

Ya que los datos de movimiento generalmente están almacenados como tuplas con la forma [oid, x, y, t], las propiedades del movimiento deben ser derivadas de forma automática a partir de estos valores de forma automática.

La idea

Tomando en cuenta estas dificultades, estamos experimentando diferentes formas de visualizar estos datos. Esto nos permitirá: a) tener una perspectiva general de los patrones espacio-temporales y b) detectar algunas características específicas del movimiento, como los lugares donde el movimiento se detiene o las rutas más utilizadas. Necesitamos además que estas visualizaciones se puedan crear de forma automática o semi-automática ya que durante la investigación tendremos conjuntos de datos cada vez más grandes.

Cómo lo solucionamos

Utilizando el lenguaje de programación R, hemos creado dos funciones que toman como entrada un directorio con archivos .gpx y realizan las siguientes transformaciones: 1) sincroniza el tiempo de inicio de cada archivo para que todos los movimientos inicien al mismo tiempo. 2) Transforma el tiempo en la dimensión espacial z, de manera que el transcurso del tiempo quede registrado como “altitud” del movimiento. 3) guarda el resultado en un nuevo archivo .gpx.

El archivo resultante puede visualizarse en Google Earth simplemente abriéndolo o arrastrándolo sobre la interfaz. El resultado es un “cubo espacio-temporal” que permite observar al mismo tiempo las dimensiones espaciales y temporales del movimiento.

El resultado:

El siguiente video realizado por Mateo Neira (@MateoNeira) muestra un ejemplo de la visualización de datos de movilidad. Cada línea representa el movimiento de una bicicleta; el tiempo está representado en la dimensión z (altura), de forma que cada trayectoria inicia en la base y se dirige hacia arriba, con la inclinación representando la velocidad. A mayor velocidad, la inclinación de la línea es menor, pues se recorre mucho espacio en poco tiempo, y las líneas más inclinadas representan menor velocidad (se recorre poco espacio en mucho tiempo). Las secciones verticales representan paradas, pues la bicicleta permanece en el mismo sitio durante un tiempo.

Las funciones de R están disponibles en GitHub. También es posible descargar un ejemplo de datos de movimiento para visualizar en Google Earth.

Siguientes pasos.

Una vez que hemos logrado representar los datos en el cubo espacio-temporal, el siguiente paso es modificar las funciones en R para adicional algunas características en la visualización: por ejemplo, utilizar el color para representar mejor la velocidad, o detectar automáticamente los sitios de encuentro.

Autores:

Daniel Orellana

Mateo Neira