¿Es posible combinar nuevas fuentes de datos, como sensores viales en autopistas, datos de GPS y grabaciones de cámaras con información de encuestas? ¿Y entonces podemos adivinar cómo se transporta a las personas en la red de carreteras holandesa? Esta fue la pregunta que Yinyi Ma abordó en su tesis, que fue financiada y supervisada por Statistics Holland (CBS). El 3 de junio, Yinyi Ma defendió con éxito su tesis en la Universidad Erasmus de Rotterdam.
Adivinación
Tradicionalmente, los camioneros y las empresas de transporte completan cuestionarios para las estadísticas de tráfico y transporte compiladas por la CBS. Pero hoy en día, el número de fuentes de datos disponibles ha aumentado significativamente y son mucho más completas. Por ejemplo, datos proporcionados por sensores de carretera en autopistas, datos de GPS e imágenes de cámaras. Estudiante de doctorado Yinyi Ma: «Investigué cómo estas nuevas fuentes de datos pueden integrarse en fuentes existentes y cómo se pueden evaluar los cambios de ruta basándose en estos datos».
El modelo teórico
Yinyi Ma estudió un modelo teórico (una red bayesiana jerárquica) que le permitió combinar datos de varias fuentes. El modelo fue probado con éxito. «El modelo que propongo en mi investigación puede aumentar la precisión y conducir a mejores estimaciones de los movimientos de mercancías por carretera». Hasta el momento el modelo no ha sido probado en la práctica. Ma: ‘Si queremos trabajar más eficazmente con big data, necesitamos responder preguntas sobre gestión de datos, modelos de datos, evaluación y visualización. Mi investigación se centra principalmente en dos elementos importantes: modelo y evaluación.’
Cooperación con universidades
Chris de Blois, investigador de CBS, fue mentor de Yinyi Ma durante su investigación de doctorado. «Nuestro departamento estaba muy interesado en las posibilidades que ofrecen estas nuevas fuentes de datos para el tráfico y el transporte». Chris enfatizó que el camino de la investigación doctoral también condujo a contactos más estrechos y frecuentes entre CBS y la Universidad Erasmus de Rotterdam. De Blois dice «Un buen spin-off». En el futuro, nos beneficiaremos de unas relaciones sólidas entre nuestras instituciones. Después de todo, la CBS tiene una enorme base de datos, pero a veces adolece de falta de capacidad de investigación. En el mundo académico, es al revés. Somos complementarios.’
Un nuevo paso en el trabajo con big data
Los desarrollos de big data están sujetos a cambios constantes. La CBS produce ahora estadísticas sobre la intensidad del tráfico rodado basándose únicamente en sensores de carretera. Estos nuevos datos crean mejores oportunidades de análisis en combinación con los datos tradicionales. Este es un avance prometedor. «Un nuevo paso en el manejo de big data», afirma De Blois. ‘Para nosotros, el trabajo de investigación doctoral de Ma es una fuente de inspiración. La verificación de cifras basada en big data es un punto de interés para CBS.’
cursos de estadistica
Durante los primeros años de sus estudios de doctorado, Yinyi Ma trabajó dos días a la semana en la oficina de la CBS en Heerlen. «Durante ese período estuve en contacto con mi supervisor Chris de Blois y las transmisiones de la CBS sobre el tema fueron muy útiles. También tuve la oportunidad de asistir a cursos de estadística en Eurostat, la Oficina Europea de Estadística. Mis colegas de la CBS fueron muy involucrado y servicial, una experiencia realmente positiva.’ Yinyi Ma recibió su doctorado en la Escuela de Administración de Rotterdam de la Universidad Erasmus el 3 de junio. Actualmente trabaja con IBM en los Estados Unidos.