Statistics Holland (CBS) se centra cada vez más en el uso de big data para producir estadísticas oficiales. Un paso destinado a dar forma a este objetivo es el lanzamiento oficial el 27 de septiembre de 2016 del nuevo Centro de Estadísticas de Big Data (CBDS) de la CBS. El lanzamiento tiene lugar durante una misión comercial oficial de Corea del Sur encabezada por el primer ministro holandés, Mark Rutte, y el secretario de Estado de Asuntos Económicos, Martijn van Dam. Durante esta visita, se firmará un acuerdo de cooperación bilateral sobre big data con Estadísticas de Corea (KOSTAT). La agencia oficial de estadística está invirtiendo mucho en big data. En Statistics Netherlands, el director del programa Magchiel van Meeteren, el metodólogo/científico de datos Piet Daas y el director de innovación Barteld Braaksma explican el objetivo de la CBS de convertirse en el líder mundial indiscutible en estadísticas de big data.
Más rápido, más oportuno y más completo
La CBS lleva varios años utilizando big data para elaborar sus estadísticas. Uno de los resultados fue que, a mediados de 2015, la CBS se convirtió en la primera oficina estadística del mundo en lanzar estadísticas oficiales de tráfico generadas a partir de big data. La principal ventaja de utilizar big data es que puede dar como resultado una producción más rápida y oportuna y estadísticas más detalladas. Van Meeteren: ‘La CBS desempeña un papel de liderazgo en el ámbito del big data para las estadísticas oficiales. Ahora es el momento de que todas las disciplinas de este campo se unan, aceleren el trabajo y nos mostremos con una identidad clara. Por eso estamos lanzando el Centro de Estadísticas de Big Data (CBDS)’. Físicamente, CBDS operará desde dos oficinas diferentes conectadas en tiempo real, centrándose principalmente en la oficina de CBS en Heerlen. Allí, los investigadores y científicos de datos de CBS trabajarán en nuevas estadísticas utilizando big data en colaboración con estudiantes de doctorado, estudiantes universitarios y expertos asociados con diversos actores nacionales e internacionales.
nuevas técnicas
Como explica Van Meeteren, los objetivos de CBS son tres: ‘En primer lugar, la implementación más rápida de nuestra producción estadística: estadísticas en tiempo real. Esto aumentará nuestra respuesta a la necesidad de información útil de nuestra sociedad con mayor rapidez. El segundo objetivo es hacer que las estadísticas existentes estén disponibles a un bajo nivel de agregación, especialmente aquellas que contienen datos sobre áreas regionales y urbanas. Además, los big data ofrecen oportunidades para mejorar la producción estadística y formular nuevos indicadores. Finalmente, queremos trabajar basándonos en el concepto de huella cero; Esto significa reducir la carga administrativa para las empresas y los particulares mediante la distribución de nuevos recursos.’ Van Meeteren espera que la implementación de big data en las estadísticas también conduzca a mejoras en la eficiencia y la calidad.
Calidad de los números
Piet Daas es metodólogo senior y científico de datos en CBS. En 2009, Daas y sus colegas comenzaron a explorar posibles nuevas formas de abrir fuentes de datos como Internet, mediciones de teléfonos inteligentes y otras fuentes grandes y complejas con fines de producción estadística. El resultado de este trabajo fue el lanzamiento de las primeras estadísticas oficiales de big data sobre tubos de tráfico a mediados de 2015, una primicia mundial. Entre los proyectos recientes se incluye un estudio sobre la importancia de la economía de Internet en los Países Bajos. En este estudio se combinan datos de las estadísticas estándar de la CBS sobre empresas con datos web recopilados y procesados por la empresa DataProvider, con la colaboración de Google. Los primeros resultados de este estudio estarán disponibles a principios del próximo mes.
Según Daas, no sólo las grandes cantidades de datos representan un gran desafío para el big data, sino que la calidad también juega un papel importante. CBS se distingue de otras organizaciones por la alta calidad de sus números. Queremos mantener este estándar de calidad, pero somos conscientes de que esto también debería aplicarse al big data. Debido a la inestabilidad de las fuentes de datos, es uno de los puntos al que se debe prestar más atención.’
Nuevas formas de trabajar y pensar
Daas espera trabajar en el Centro de Estadísticas de Big Data. ‘Cuando comenzamos a colaborar con partes externas, se crean más oportunidades que nunca para abrir y explorar diferentes fuentes de datos. Es un grupo de socios muy heterogéneo, lo cual es interesante porque así pueden complementarse y continuar.’ Trabajar con big data requiere un enfoque diferente al de recopilar estadísticas de la forma tradicional. Junto con partes externas y nuestros propios científicos de datos, creamos nuevos métodos y técnicas que requieren nuevas ideas. Sin embargo, es importante que los departamentos de la CBS actúen con conocimiento del tema, como hemos visto durante el desarrollo de nuevas estadísticas basadas en datos de los tubos de tráfico. También se necesitan nuevas instalaciones en TI. Por ello, CBS empezó a utilizar un clúster Spark, una herramienta que permite el análisis rápido de grandes cantidades de datos.’ Un punto planteado por Daas es la importante cuestión de la privacidad y los grandes datos. «Hemos tomado las precauciones adecuadas dentro de CBS. La operación se lleva a cabo íntegramente dentro del entorno altamente seguro de CBS».
Socios externos innovadores
Barteld Braaksma es el director de innovación de CBS. Una de sus tareas era acercarse a socios nacionales e internacionales para cooperar con CBDS. ‘Los compañeros actúan con rapidez y entusiasmo. Ya lo han firmado siete institutos nacionales de estadística (INE) y la Oficina Estadística de la Comunidad Europea (Eurostat). No sólo nos centramos en las agencias de estadística, sino también en conocidos socios externos innovadores del sector público o privado, como TNO, DNB, IBM, KPN y SURFsara. Además, desde Maastricht hasta Leiden y desde Twente hasta Ámsterdam, se han unido muchas universidades y escuelas superiores de educación superior. El nivel de ambición de la CBS para el Centro de Estadísticas de Big Data es alto, afirma Braaksma. Estos son nuestros deseos que debemos cumplir nosotros mismos. No sólo trabajando con nuestros socios, sino también en todos nuestros departamentos internos. Además, es importante que recopilemos información útil a partir de la recopilación.’ Más fuentes de big data están disponibles en empresas, institutos y autoridades. El acceso a estos recursos es importante para cumplir nuestros deseos”. Muchas partes están dispuestas a cooperar con CBS proporcionando datos de forma anónima.
Una página de actualización estará disponible durante el lanzamiento del Centro de Estadísticas de Big Data, donde se publicarán los resultados del Centro. El objetivo es recopilar comentarios y mejoras en el desarrollo de nuevos productos. Los que tengan éxito pasarán a producción.
¿Qué partes participan en CBDS?
Una larga lista de organizaciones nacionales e internacionales han respaldado al Centro de Estadísticas de Big Data. Estas organizaciones proporcionarán el conocimiento y la experiencia necesarios para lograr conjuntamente diversos objetivos sociales. Se reutilizan experiencias relevantes, se comparten soluciones técnicas. Una de las partes relacionadas es Capgemini Nederland. Pieter Nieuwenboer, Head Insights and Data Netherlands, explica: ‘CBS se encuentra en una posición única para seguir desarrollando el área de big data. Capgemini Nederland contribuirá a este desarrollo ofreciendo su experiencia en big data y temas como seguridad y movilidad”. Otra respuesta entusiasta es la de Jeannine Peek, directora de Dell-EMC: ‘Estamos encantados de colaborar con CBS en el Centro de estadísticas Big Ata y producir nuevos productos y servicios estadísticos. Dell-EMC y Pivotal aportan experiencia en lagos de datos, plataformas nativas de la nube y microservicios basados en soluciones creadas en automoción, atención sanitaria, finanzas y servicios públicos”. Otro socio es Microsoft Holanda. Según el director general Ernst-Jan Stigter: ‘En todo el mundo, Microsoft ve enormes oportunidades en la movilización de big data con fines sociales. Esperamos trabajar con CBS para aprovechar estas oportunidades en los Países Bajos. El Centro de Estadísticas de Big Data desempeñará un papel clave en este trabajo.’ Además, Humanity X respalda la iniciativa CBS. El cofundador de Humanity X es el Dr. Ulrich Mans: ‘Humanity X es una iniciativa conjunta del Centro de Innovación de la Universidad de Leiden, la ciudad de Den Haag y muchos otros socios, incluidas universidades, ONG y empresas de TI. Apoyamos las innovaciones basadas en datos para resolver problemas globales y trabajaremos en estrecha colaboración con el nuevo Centro de Estadísticas de Big Data. De esta manera nos sumamos a la red global de innovadores que quieren aprovechar la revolución de los datos para alcanzar los objetivos relacionados con el desarrollo sostenible (ODS).’ Una lista completa de organizaciones que han adoptado el Centro de Estadísticas de Big Data.