Nuestro Blog

0

¿Por qué son necesarios los espacios de datos?

Hoy en día, hay sectores donde es requisito indispensable la compartición de datos entre los distintos actores de un mismo sector. Un ejemplo prototípico de esto, son las aduanas. En las fronteras, si se comparten datos entre los países limítrofes, no sólo se puede reducir el esfuerzo, evitando un doble chequeo, sino que además se puede conseguir un funcionamiento óptimo si se comparten datos. Por ejemplo, poder detectar de forma temprana un posible problema veterinario si el país de entrada conoce con antelación la carga que trae un camión gracias a la información facilitada por el país de salida

data-spaces-netitelligent

Sin embargo, esto también puede suponer introducir nuevas complejidades que deben ser resueltas. Algunas de ellas son:

  • Interoperabilidad. En el momento en el que se comparten datos hay que definir algún tipo de estándares para que ambos sistemas o ambas partes entiendan las características de los datos compartidos. Por ejemplo, en el caso de las aduanas, es común utilizar algunos de los estándares definidos por la OMA (Organización Mundial de Aduanas), que entre otros, estandariza los códigos de los productos o materias primas.
  • Uso de los datos. Al compartir los datos, dejamos de tener el control sobre los mismos. Esto puede ser un problema si no se exponen explícitamente las condiciones de uso de dichos datos. Por ejemplo, en el caso de las aduanas, pueden existir datos que el país de salida podría compartir con el país de entrada para una finalidad concreta, pero puede que tenga miedo de que el país de entrada los utilices con otros objetivos.
  • Seguridad. Al compartir los datos de forma digital estamos introduciendo nuevos riesgos ya que abrimos los sistemas a terceros. Por ejemplo, en un sistema aduanero de un país que solo era utilizado de forma interna, exponer determinados datos a terceros, puede suponer un riesgo de seguridad.
  • Protección de datos. Al compartir datos sensibles (por ejemplo. datos personales), es necesario garantizar que, la persona que recibe esos datos, mantenga los niveles de privacidad exigidos para el uso que se les vaya a dar. En algunos casos, esto conlleva utilizar técnicas de anonimización antes de compartir los datos.

¿Qué son los espacios de datos o data spaces?

Los espacios de datos vienen a resolver las problemáticas que se producen a la hora de compartir datos entre diferentes actores. Un espacio de datos es una forma de compartir datos entre distintos actores garantizando los derechos de cada uno de los participantes. La idea básica es pasar de un control de acceso de los datos a un control de uso de los datos.

Como ejemplo, uno de los pilares básicos de la Estrategia Europea de Datos es la creación de Espacios de Datos comunes e interoperables en toda la UE en sectores estratégicos. El objetivo es superar las barreras (legales, técnicas, …) que actualmente existen para el intercambio de datos, lo que sin duda permitirá la puesta en marcha de proyectos innovadores sobre estos datos y la generación de nuevas empresas y servicios. Para ello, es necesario poner en marcha las infraestructuras de datos y los marcos de gobernanza para facilitar la puesta en común y el intercambio de datos.

ELEMENTOS TECNOLOGICOS CLAVES EN LOS ESPACIOS DE DATOS

data-spaces-building-blocks-technologies

Desde una perspectiva técnica, un espacio de datos puede entenderse como una colección de componentes técnicos que facilitan un flujo de datos/información dinámico, seguro y continuo entre partes y dominios. Estos componentes se pueden implementar de muchas maneras diferentes y se pueden implementar en diferentes marcos de tiempo de ejecución (por ejemplo, Kubernetes). Según Open DEI, se pueden clasificar de la siguiente manera:

INTEROPERABILIDAD DE DATOS

Los bloques de construcción tecnológica que pertenecen a esta categoría son:

  1. Modelos y formatos de datos: este componente básico establece un formato común para las especificaciones del modelo de datos y la representación de datos en las cargas útiles de intercambio de datos. Combinado con el componente básico de las API de intercambio de datos, esto garantiza la interoperabilidad total entre los participantes.
  2. API de intercambio de datos: este componente básico facilita el intercambio y el intercambio de datos (es decir, la provisión de datos y el consumo/uso de datos) entre los participantes del espacio de datos. Un ejemplo de un bloque de construcción de interoperabilidad de datos que proporciona una API de intercambio de datos común es el «Context Broker» (Broker de contexto) del Connecting Europe Facility (CEF), recomendado por la Comisión Europea para compartir datos en el momento adecuado entre varias organizaciones.
  3. Procedencia y trazabilidad de los datos: este bloque de construcción proporciona los medios para rastrear y rastrear en el proceso de provisión de datos y consumo/uso de datos. Por lo tanto, proporciona la base para una serie de funciones importantes, desde la identificación del linaje de los datos hasta el registro de transacciones a prueba de auditorías. También permite la implementación de una amplia gama de casos de uso de seguimiento a nivel de aplicación, como el seguimiento de productos o flujos de materiales en una cadena de suministro.

SOBERANIA Y CONFIANZA DE DATOS

Los bloques de construcción tecnológica que facilitan la confianza y la soberanía de los datos son:

  • Gestión de identidades (IM): el componente básico de IM permite la identificación, autenticación y autorización de las partes interesadas que operan en un espacio de datos. Garantiza que las organizaciones, las personas, las máquinas y otros actores reciban identidades reconocidas, y que esas identidades puedan autenticarse y verificarse, incluido el aprovisionamiento de información adicional1, para que los mecanismos de autorización los utilicen para habilitar el control de acceso y uso. El bloque de construcción de IM se puede implementar sobre la base de plataformas de IM fácilmente disponibles que cubren partes de la funcionalidad requerida. Ejemplos de soluciones de código abierto son la infraestructura KeyCloak, la plataforma de mensajería instantánea Apache Syncope, la plataforma de mensajería instantánea de código abierto del Shibboleth Consortium o el marco FIWARE IM. La integración del componente IM con el componente eID del Connecting Europe Facility (CEF), que respalda la identificación electrónica de usuarios en toda Europa, sería particularmente importante. La creación de identidades federadas y de confianza en espacios de datos puede estar respaldada por normativas europeas como EIDAS.
  • Intercambio confiable: este bloque de construcción facilita el intercambio de datos confiable entre los participantes, asegurando a los participantes en una transacción de intercambio de datos que los otros participantes son realmente quienes dicen ser y que cumplen con las reglas/acuerdos definidos. Esto se puede lograr mediante medidas organizativas (por ejemplo, certificación o credenciales verificadas) o medidas técnicas (por ejemplo, atestación remota).
  • Control/políticas de acceso y uso: este componente garantiza el cumplimiento de las políticas de acceso y uso de datos definidas como parte de los términos y condiciones establecidos cuando los recursos o servicios de datos se publican (consulte el componente básico «Mercado de publicaciones y servicios» a continuación) o se negocian entre proveedores y consumidores. Un proveedor de datos normalmente implementa mecanismos de control de acceso a datos para evitar el uso indebido de recursos, mientras que los mecanismos de control de uso de datos normalmente se implementan en el lado del consumidor de datos para evitar el uso indebido de datos. En cadenas de valor de datos complejas, los prosumidores combinan ambos mecanismos. El control de acceso y el control de uso se basan en la identificación y la autenticación.

CREACIÓN DE VALOR DE DATOS

Los bloques de construcción tecnológica que facilitan la creación de valor de los datos son:

  • Metadatos y protocolo de descubrimiento: este componente básico incorpora mecanismos de publicación y descubrimiento para recursos y servicios de datos, haciendo uso de descripciones comunes de recursos, servicios y participantes. Dichas descripciones pueden ser tanto independientes del dominio como específicas del dominio. Deben estar habilitados por tecnologías de web semántica e incluir principios de datos vinculados.
  • Contabilidad del uso de datos: este bloque de creación proporciona la base para contabilizar el acceso y/o el uso de datos por parte de diferentes usuarios. Esto, a su vez, respalda importantes funciones de compensación, pago y facturación (incluidas las transacciones de intercambio de datos sin la participación de los mercados de datos).
  • Servicios de publicación y mercado: Para respaldar la oferta de recursos y servicios de datos bajo términos y condiciones definidos, se deben establecer mercados. Este componente básico admite la publicación de estas ofertas, la gestión de procesos vinculados a la creación y el seguimiento de contratos inteligentes (que describen claramente los derechos y obligaciones para el uso de datos y servicios) y el acceso a datos y servicios.

En función de las necesidades técnicas, se pueden ejecutar los procesos de backend correspondientes para calificación, compensación y facturación. Por lo tanto, el bloque de construcción facilita la ampliación dinámica de los espacios de datos con más partes interesadas, recursos de datos y servicios de análisis/procesamiento de datos (como servicios de análisis de big data, servicios de machine learning o servicios basados ​​​​en modelos de procesamiento estadístico para diferentes funciones comerciales). Debe comprender capacidades para publicar recursos de datos siguiendo los estándares DCAT (Data Catalogue Vocabulary) ampliamente aceptados, y para recopilar datos de plataformas de publicación de datos abiertos existentes.

Nuestra plataforma netITELLIGENT dispone de un potente buscador sobre aquellos repositorios documentales de interés para nuestros clientes. En este caso, a nuestro cliente, empresa de ingeniería, le facilitamos el acceso a distintos documentos de open data obtenidos de boletines oficiales, concursos, ayudas, etc. Entre estos documentos, se encuentran disposiciones de impacto medioambiental publicadas en boletines oficiales provinciales y autonómicos. Nuestro cliente nos solicitó poder realizar preguntas sobre estas disposiciones ambientales directamente sobre el buscador y para conseguirlo, hemos incorporado ChatGPT a nuestro sistema de búsqueda.

ChatGPT_buscador_boletines_ayudas

Esto nos ha permitido responder de forma concreta a las siguientes preguntas-tipo:

  • ¿Qué cultivos se consideran en la declaración de impacto ambiental con numero expediente IA21/0480?’
  • ¿Cuál es el CIF de la empresa que ha solicitado permiso para una planta de biodiesel en el Valle de Escombreras?
  • ¿Cuál es la actividad de la empresa que ha solicitado autorización para una máquina de papel en la población de Hernani?
  • ¿Quién es el promotor de la Planta de compostaje de purines en el municipio de Quero en Toledo?

Pero, hemos ido más allá. En algunos casos, las preguntas de los clientes son más complejas de lo habitual y cuyas respuestas únicamente se pueden responder mediante la combinación de varios documentos. En la imagen, podemos observar cómo el sistema puede deducir la respuesta con la combinación de dos documentos. Gracias a esta tecnología ChatGPT, hemos sido capaces de responder muchas de estas preguntas complejas.

Lo mejor de todo es que hemos podido realizar todo lo anterior minimizando el número de consultas a ChatGPT y su coste asociado. Asimismo, hemos integrado todo en nuestro buscador facetado lo que evita a nuestro cliente tener que interactuar con un segundo sistema cuando requiere contestar preguntas.

  • ITELLIGENT,  en consorcio con Grupo Energético de Puerto Real, Wattabit y Universidad de Cádiz, coordinados por Smart City Cluster, evolucionan en el proyecto iPredice con una segunda fase.

El proyecto iPredice se centra en el desarrollo de una plataforma tecnológica que pretende avanzar en la implementación de la Inteligencia Artificial (IA) aplicada al mantenimiento predictivo de infraestructuras energéticas. Este sistema, concretamente, toma el nombre de «Investigación de una PlatafoRma intEligente de mantenimiento preDICtivo de infraestructura” y permitirá, entre otras:

  • Monitorizar las infraestructuras de forma inteligente para predecir el final de su vida útil antes de llegar a situaciones catastróficas
  • Reducir el tiempo de respuesta en la toma de decisiones
  • Incrementar la seguridad en las infraestructuras críticas que tienen una vida útil limitada.

En esta Fase 2, el objeto de estudio  se centrará en la aplicación del mantenimiento predictivo a las redes de abastecimiento de aguas, mejorando la gestión de la red y dotando a la ciudadanía de herramientas que le permitan gestionar y monitorizar su propio consumo. Los objetivos de esta Fase 2 de iPredice es:

  • Mejorar la eficiencia en la gestión del agua
  • Reducir las pérdidas
  • Garantizar un suministro más sostenible y de mayor calidad

Este proyecto es un claro ejemplo de colaboración público-privada ya que, la empresa pública Grupo Energético de Puerto Real (GEN), dentro de la iniciativa Puerto Real +Ciudad, concretamente en la Línea 4, denominada “Innovación enfocada a la gestión energética”, es quien lidera el consorcio compuesto por: el Clúster Smart City, como coordinador, empresas de la provincia como WATTABIT e ITELLIGENT que aportan su expertise tecnológico, así como el grupo de investigación UCASE de la Universidad de Cádiz.

iPredice ha sido merecedor de ser catalogado como una actividad I+D+i y, por consiguiente, receptor de ayudas por parte del Ministerio de Industria, Comercio y Turismo mediante el programa de apoyo a las Agrupaciones Empresariales Innovadoras (AEI) en el marco de las ayudas Next Generation y el Plan de Recuperación, Transformación y Resiliencia.  Cuenta con un presupuesto de 490.524,36€ cuya subvención por parte de la adminsitración pública asciende a 339.113 € y finaliza en Mayo de 2023Para ampliar esta información sobre el proyecto, objetivos, fases y presupuestos: iPredice Investigación de una Plataforma inteligente de mantenimiento predictivo de infraestructuras.

logos ayudas ipredice fase2