Nuestro Blog

A lo largo de nuestra experiencia en proyectos de Vigilancia Tecnológica (VT) destacamos que cada uno de ellos posee necesidades diversas en base al sector, los usuarios o la finalidad para la que se desarrollan. Estos proyectos de VT solemos abordarlos a partir de nuestra plataforma netitelligent adaptándolas a las necesidades de cada uno de ellos. Sin embargo, existen una serie de elementos que marcan la diferencia. En este post, abordaremos qué ocho elementos son claves para el éxito de una plataforma de Vigilancia Tecnológica:

Por norma general, las plataformas de VT siguen en mayor o menor detalle la Norma UNE 166006 – Actividades de Investigación, Desarrollo Tecnológico e Innovación (I+D+i). Esta Norma, se centra en:

vigilancia tecnologica desarrollo e innovacion

A partir de la identificación de las necesidades de información – algo que habitualmente es complicado y que no se suele realizar a un nivel de detalle adecuado-, el siguiente paso es identificar aquellas fuentes de información que puedan ayudarnos a cubrir las necesidades identificadas. A partir de estas fuentes, hay que generar con la periodicidad adecuada la información relevante y hacerla llegar a los consumidores de la misma.

ELEMENTOS CLAVE PARA EL ÉXITO DE UN PROYECTO DE VT

1.- IDENTIFICACIÓN DE LAS NECESIDADES

Cuando las necesidades de un proyecto de VT no están claras suele ser una pasarela hacia el fracaso. Para evitarlo, debemos ser capaces de:

  • Concretar qué preguntas queremos que le sistema nos ayude a responder
  • Identificar los perfiles que usarán la información -ya que, en muchas ocasiones, cada pregunta está ligada a un determinado perfil-.

Para saber si hemos realizado esto correctamente, podemos asociar a cada necesidad de información, una métrica que nos permita chequear su cumplimiento.

itelligent objetivos en proyectos VT

2.- SELECCIÓN DE FUENTES TRONCALES

Una vez definidas las necesidades del proyecto de VT es fundamental identificar un conjunto reducido de fuentes que nos permitan cubrir las necesidades detectadas y que sirvan de “core” para el sistema de Vigilancia Tecnológica. La selección de estas fuentes no solo implica su identificación, sino lo que también llamamos “Due-Dilligence” de las fuentes. Es decir, una vez que tenemos identificadas un conjunto de fuentes debemos responder a las una serie de preguntas como:

  • ¿Es viable técnicamente extraer los datos de las fuentes con la frecuencia que necesitamos?
  • ¿Es viable, a nivel legal, la extracción de los datos de las fuentes seleccionadas?
  • ¿Es posible extraer los datos de las fuentes seleccionadas y cumplir con el RGPD u otras políticas al respecto vigentes?
  • A nivel económico, ¿es posibles la extracción de los datos de las fuentes seleccionadas con la frecuencia que necesitamos?

Por lo general, la elección de las fuentes troncales suele estar acorde al ciclo de vida de un proceso de innovación, tal como aparece en la imagen.itelligent fuentes proyectos VT

3.- FILTRADO Y LIMPIEZA DE FUENTES TRONCALES

Haber identificado fuentes troncales y haber extraído datos de las mismas, no implica que éstos estén libres de ruido. Por ello, es conveniente que nuestra plataforma de Vigilancia Tecnológica nos permita incorporar términos y operadores para:

  • Incluir resultados a la plataforma, si se activan (operadores blancos)
  • O desechar resultados a la plataforma, si no se activan (operadores negros)

Una forma muy eficiente de identificar qué elementos deben ser descartados es a través de visualizaciones de datos como las nubes de tags. Este tipo de visualizaciones es fundamental que estén presentes en una plataforma Vigilancia Tecnológica.

itelligent limpiar datos proyectos VT

4.- ARMONIZACIÓN DE LAS FUENTES

Debemos tener en cuenta que, para poder utilizar datos de distintas fuentes sobre un mismo interfaz, debemos armonizar cada fuente a un estándar común. Por ejemplo, si nuestra interfaz posee una ficha o elementos como una tabla que posea un campo llamado “título”, debemos de disponer en la plataforma la posibilidad de asociar este elemento de cada fuente -mapping- al campo “titulo”. Os mostramos un ejemplo:

itelligent armonizar datos proyectos VT

5.- DETECCIÓN DE TEMÁTICAS EMERGENTES

Una funcionalidad muy interesante que siempre debe incorporar nuestra plataforma VT es la detección de temáticas emergentes con posibilidad de filtrado semántico. Esto nos sirve para saber si existen temáticas que estén cobrando notoriedad y, habitualmente, esto implica la aparición de innovaciones. Por este motivo no solo es importante que nuestra plataforma VT permita este descubrimiento sino que nos permita también analizar la evolución temporal de aquellas temáticas que nos interesen más. Por ejemplo, la plataforma nos puede identificar temáticas emergentes como “Machine learning” o “blockchain” cuando comenzaron a aparecen en las distintas fuentes pero, también, nos debería permitir analizar su evolución en el tiempo.

itelligent tematicas emergentes vt

6.- EXPLOTACIÓN DE SEMÁNTICAS Y RELACIONES

En muchas ocasiones, además de explotar la información semántica contenida en los documentos, es posible explotar las identidades que aparecen en dichos documentos. Esto, abre un abanico de posibilidades muy interesantes en el área de la Vigilancia Tecnológica: podemos determinar relaciones de coautoría entre autores de artículos científicos o relaciones entre entidades consorciadas en proyectos de investigación.

Una plataforma de VT debe ser capaz de poner en valor estas relaciones entre entidades y la semántica asociada a los textos que está generando (ej. Articulo científico, proyectos, …) permitiendo, mediante potente visualizaciones, identificar de una forma simple la información relevante que esta combinación de relaciones semánticas nos puede descubrir.

itelligent grafo de relaciones vt

Utilizar grafos nos permite de forma muy simple detectar aquellos organismos consorciados con otros organismos con proyectos de innovación y detectar para distintas temáticas aquellas organizaciones con un mayor número de relaciones, esto es los denominados HUB. Lo que facilita encauzar el esfuerzo para establecer nuevas relaciones al poder identificar vías de accesos a estos hubs.

7.- SISTEMAS DE ALERTAS

En cualquier plataforma de VT nos encontraremos con usuarios que no van a disponer del tiempo necesario para interactuar de forma sistemática con la misma. Para generar engagement a estos usuarios es necesario conectar estas fuentes con un sistema avanzado de alertas.
Un problema habitual de los sistemas de alertas es que son difíciles de adaptar a las necesidades de cada usuario. Algo típico es que un usuario reciba un exceso de alertas y éste no acceda a las mismas por saturación. También ocurre que un usuario apenas reciba alertas y pierda información relevante para este. Por este motivo, lo ideal es que una plataforma de VT posea alertas inteligentes que permita:

  • Personalizar alertas en base a cada usuario según su área de interés
  • Detectar, mediante Inteligencia Artificial, cuándo una información puede ser relevante para este usuario y enviársela.

Además, de todo esto, es muy útil tener feedback de este usuario para poder adaptar la información a sus necesidades concretas.

8.- FACILIDAD PARA INCORPORAR NUEVAS FUENTES

Puede que con el tiempo un proyecto de VT requiera incorporar nuevas fuentes. Por ello es importante que la plataforma tenga un mecanismo que pueda dar de alta nuevas fuentes que puedan ser relevantes para la Vigilancia Tecnológica.

El pasado mes de agosto, el instituto IEEE (Institute of Electrical and Electronics Engineers) publicaba en Spectrum, el ranking anual sobre el Top Programming Languages 2021, donde se destacaba Python como el lenguaje de programación más popular en 2021. Según este estudio, Python se convierte en la plataforma «de facto» para las nuevas tecnología IT y la principal conclusión que se puede sacar de su constante predominio es que hay que aprender Python:

Learning the language well enough to use one of the vast number of libraries written for it is probably worth your time.

Aprender este lenguaje lo bastante bien como para poder usar una de las muchas bibliotecas escritas para él probablemente valga la pena

Python es una opción interesante para realizar todo tipo de programas que se ejecuten en cualquier máquina. Con este lenguaje podemos desarrollar software para app científicas, para comunicaciones de red, para app de escritorio con interfaz gráfica de usuario (GUI), para crear videojuegos, para smartphones, para Inteligencia Artificial, para automatización de tareas y por supuesto, para programación web. Su predominio que tiene mucho que ver con su versatilidad: lenguaje multiparadigma, al poder ser enfocado a varios estilos; y de código abierto, lo que permite que cualquiera pueda acceder a él. Actualmente, Python es el lenguaje de programación de referencia para grandes tecnológico como Google, Facebook o Netflix lo utilizan.

Por otro lado, cabe decir que muchas tareas siguen demandando soluciones especializadas como R, SQL y Matlab.  Así como, otros lenguajes generalistas también siguen siendo de peso en proyectos IT como son los que aparecen, junto a Python, en el top 5 del ranking:  Java, C, C++ y JavaScript.

ranking IEEE

FUENTE: https://spectrum.ieee.org/

Acerca del ranking…

La publicación Spectrum sobre  «Top Programming Languages 2021» tiene el objetivo de clasificar  docenas de lenguajes de programación en base a su popularidad. Se trata de un ranking interactivo: se puede filtrar excluyendo sectores que no sean relevantes para quien lo quiera visualizar (ej. filtar como «Web» o «Integrado»).  Las clasificaciones se crean ponderando y combinando 11 métricas de ocho fuentes: CareerBuilder, GitHub, Google, Hacker News, IEEE, Reddit, Stack Overflow y Twitter. El ranking, por defecto, posee unos filtros asociados preestablecidos por IEEE, pero si el usuario desea realizar su propio ranking, la publicación Spectrum ofrece la posibilidad de customizar los criterios de clasificación a través del botón «Create Custom Ranking», como se muestra en la siguiente imagen:

IEEE Spectrum filters

FUENTE: https://spectrum.ieee.org/

Este ránking de IEEE puede resultar un tanto polémico ya que se incluyen algunos «lenguajes» a los que no todos considerarían lenguajes de programación como tal, ejemplos de esto son: el puesto 9, HTML; y el puesto 11, Arduino. Según afirma su autor, , «adoptamos un enfoque pragmático para definir qué es un lenguaje de programación; HTML no puede ser de propósito general, pero creemos que sería una locura excluirlo sobre esa base. De la misma forma que se podría argumentar que el código Arduino simplemente está escrito en un subconjunto de C ++, pero eso no es lo que la gente busca cuando intentan que sus LEDs parpadeen«.

El objetivo de este proyecto era suministrar información sobre ayudas e incentivos a través de un buscador avanzado para el ICEX y dirigido a empresas españolas y extranjeras. Este buscador debía proporcionar acceso a la información actualizada y estructura sobre las ayudas publicadas en diversas fuentes de datos de boletines y diarios oficiales tanto a nivel nacional como europeo. Además, el buscador requería tanto el uso del idioma español como inglés para ser adaptado a la web de Invest In Spain.

En un primer momento, realizamos una fase de análisis de la situación de partida. Conocer cómo era el anterior buscador para establecer elementos diferenciales para mejorar el diseño del nuevo buscador de ayudas e incentivos teniendo en cuenta los objetivos del proyecto. Estos elementos diferenciales son:

  1. Escondiendo la complejidad al usuario
  2. Buscador facetado
  3. Diseñado para la usabilidad
  4. Velocidad de carga
  5. Dataset con actualizaciones 24/7
  6. Adaptación de los datos obtenidos

ELEMENTOS DIFERENCIALES DEL BUSCADOR INVEST IN SPAIN DEL ICEX

1.- ESCONDIENDO LA COMPLEJIDAD AL USUARIO

En una fase inicial de análisis comprobamos que con el anterior buscador en la web de Invest In Spain era complejo conseguir la información relevante. En muchos casos, se requería la selección de diferentes campos más allá del texto de búsqueda. Esto suponía un esfuerzo en tiempo y una complejidad de la información para el usuario.

Esta necesidad de aportar una información relativamente compleja al buscador antes de realizar la búsqueda es un problema habitual en muchos buscadores y una de las causas de fracaso de los mismos.

La idea fundamental para resolver este problema es esconder al usuario esta complejidad y que sea el propio buscador el que la gestione de forma transparente al usuario. En definitiva, el buscador debe ser capaz de ofrecer resultados relevantes a partir de un simple texto de búsqueda, sin que el usuario se vea obligado a tener que introducir o seleccionar otros campos complejos.

2.- BUSCADOR FACETADO

El anterior buscador no permitía filtrar los resultados de las búsquedas. Por lo que si el usuario quería refinar la búsqueda se veía obligado a realizar una nueva búsqueda incluyendo nuevos términos. El problema es que al introducir nuevos elementos en la búsqueda para el filtraje se perdía, en parte, el control sobre los resultados.

Un buscador es una herramienta iterativa donde partimos de un primer conjunto de resultados que podemos ir refinando en función de su relevancia. La forma más eficaz de conseguir refinar los resultados con el mínimo esfuerzo es a través de facetas. Las facetas permiten, por un lado, resumir los resultados en distintas “categorías” y, al mismo tiempo, poder filtrar los resultados de una forma muy simple en base a dichas categorías. Esto permite navegar y refinar los resultados de una forma extremadamente rápida.

buscador icex con facetas

3.- DISEÑADO PARA LA USABILIDAD

El anterior buscador estaba diseñado de tal forma que disponía de pocas ayudas a la búsqueda y éstas utilizaban un lenguaje técnico difícil de entender para un usuario no experto. Sin embargo, el target de este buscador son usuarios no expertos y, en muchos casos, usuarios extranjeros. Por lo que la usabilidad del buscador requería información didáctica y procesos de búsquedas simples e intuitivos. Para ello, se trabajaron tres elementos:

  • Ayudas contextuales: se introdujeron iconos en todos los elementos del buscador para facilitar al usuario el acceso a una ayuda contextualizada.
  • Procesos guiados: en aquellas funcionalidades más complejas (búsquedas avanzadas) se estableció un proceso mediante «pasos a seguir» que facilitaran su uso.
  • Lenguaje fácil de entender: especial cuidado en evitar tecnicismos y en el uso de frases que permitiesen a cualquier usuario entender los elementos del buscador.

4.- VELOCIDAD DE CARGA

La velocidad de carga era un problema en el anterior buscador. Por este motivo, desde el primer momento, se diseñó una infraestructura elástica basada en Amazon AWS que permitiese una alta velocidad en el uso del buscador y que, además, permitiese a éste crecer en recursos siempre que fuera necesario.

5.- GENERACIÓN DE UNA BASE DE DATOS (DATASET) DE AYUDAS NACIONALES Y EUROPEAS CON UNA ACTUALIZACIÓN AUTOMÁTICA 24/7

En este proyecto, además del buscador propiamente, también se generan diariamente (24/7) las ayudas que lo alimentan. Para ello, se indexan cada día las ayudas nacionales y europeas obtenidas a través de nuestra plataforma netOpendata que son gestionadas y supervisadas por nuestros partner Fundamenta. El objetivo, desde el comienzo del proyecto, fue disponer de una base de datos lo más actualizada, completa y libre de ruido posible, para que los usuarios del buscador puedan encontrar siempre las ayudas que fuesen relevantes para ellos.

6.- ADAPTACIÓN DE LOS DATOS DE LAS AYUDAS OBTENIDAS PARA UN CORRECTO FUNCIONAMIENTO DEL SISTEMA DE BÚSQUEDA

Disponer de los datos en este caso, de una base de datos de ayudas, no garantiza un buscador exitoso, es necesario diseñar de forma correcta los procesos que permitan armonizar los datos de distintas fuentes e indexarlos de una forma flexible y eficiente en el buscador. Esto es todo un “arte” y en ITELLIGENT llevamos más de 12 años perfeccionando este “arte”.

En nuestra amplia experiencia en la generación de buscadores, sabemos que un buscador es un servicio importante para un proyecto o negocio. Por este motivo, hay que tener muy en cuenta al usuario final, es decir, el buscador debe estar diseñado y adaptado al target al que va dirigido con el fin de ofrecerle la información de forma fácil y usuable.

En ITELLIGENT, tenemos amplia experiencia en la generación de buscadores avanzados usables y adaptados al usuario. Si su proyecto o negocio requiere el desarrollo de un buscador avanzado, puede contactar con nosotros. Estaremos encantados de escucharte.