Category: Big Data e Inteligencia Artificial

  • Buaala es una app inteligente de contenidos audiovisuales que ofrece a sus usuarios construir su propia programación televisiva. 
  • A partir de nuestros gustos o tendencias,  Buaala sabe lo que aún no sabemos qué queremos ver.

Así es Buaala, una aplicación móvil inteligente basada en Inteligencia Artificial y enfocada a ofrecer a los usuarios qué ver en televisión en base a sus gustos y preferencias de la parrilla mediática.  El creador de esta smart app es Felipe García CEO de la compañía Knowdle Media Group, basada en el conocimiento abierto bioinspirado, en la inteligencia colectiva y apoyado en el concepto de “el conocimiento como servicio”.

buaala-app-parrilla-inteligente

La aplicación Buaala cuenta con un motor de inteligencia artificial totalmente proactivo. Permite a los usuarios descubrir y recomendar contenidos relacionados con el cine, películas, series, shows de TV… y, actualmente, posee un catálogo de más de 70.000 productos de Amazón. Está disponible en formato para iOS como para Android.

El concepto de Buaala nació en 2011, su fundador, Felipe García decidió unir dos conceptos: inteligencia artificial e inteligencia colectiva. En 2014, el proyecto recibió casi 2 millones de euros de financiación pública para el desarrollo de un protipo no comercial. Finalmente en 2016, tras un periodo de investigación y desarrollo, surge Buaala como app móvil gratuita.

Funciona como una parrilla inteligente de contenidos audiovisuales, desde la TDT hasta los contenidos que ofrecen Netflix, HBO y Movistar Fusión+.  Aunque algunas de estas mismas plataformas poseen recomendaciones según el historial de contenidos visualizados, Buaala posee un algortimo mucho más complejo. Además de atender a los patrones de consumo de un usuario,  se  tienen en cuenta los criterios que siguen el resto de espectadores de televisión a la hora de escoger  un contenido audiovisual. De esta forma, Buaala recomienda a un usuario qué, cómo y cuándo ver un contenido a través de recomendaciones de amigos, reseñas/críticas, de blogs especializados, campañas promocionales, comentarios de usuarios en redes sociales etc. La idea reside en: cuanto más utilicemos su sistema, su algoritmo más aprenderá sobre ti y tus gustos.

buaal-app-recomendaciones

Además, esta aplicación posee funciones similares a las de una red social especializada en cine y televisión ya que permite: enviar solicitudes se seguimiento a otros usuarios, ver qué contenidos están viendo tus amigos, acceder a foros de comentarios, crear chats privados o chats con varios usuarios, …

CÓMO FUNCIONA BUAALA

Tal como hemos mencionado antes, Buaala aprende de sus usuarios de tal forma que cuanto más uso le den a la app, sus recomendaciones serán más afines al gusto del usuario. Todo esto es gracias a su algoritmo de inteligencia artificial basado en inteligencia colectiva con el que nos propone qué ver. En resumen, nos ayuda a construir nuestra propia programación televisiva.

¿Qué funciones permite Buaala? Podemos reunir algunas a las que se irán uniendo otras muy interesantes en un futuro próximo:

  • OCIO: sugerencias de planes, conciertos, series y películasque ni sabías que podían ser de tu agrado.
  • CINE: si estás con amigos y os apetece ir al cine, Buaala os sugerirá la película perfecta para todos.
  • INFORMACIÓN PERSONALIZADA: Buaala te ofrece todas las curiosidades sobre series, programas y películas de tu interés.
  • CRÍTICAS Y VALORACIONES: podrás leer comentarios/opiniones de otros usuarios, de expertos en cine así como recomendaciones de terceros.
  • ECONOMÍA DEL TIEMPO: con Buaala ahorrarás tiempo buscando cuándo echan tu series, película o programa favorito. Con Buaala lo que te gusta, te encuentra.
  • COMUNICACIÓN 2.0: incorpora un chat con el que poder hablar con amigos en privado o crear un grupo privado de chat.

  • ITELLIGENT, GRUPO TOPDigital y el Cluster Andalucía Smart City colaboran en el proyecto SIPREDE
  • El objetivo ha sido mejorar el conocimiento de la demanda en las tiendas físicas de TOPDigital – Vodafone

portada-proyecto-siprede-itelligent

El consorcio formado por las empresas TOPDigital y Itelligent Information Technologies y el Cluster Andalucía Smart City recibió el pasado 2017 financiación del Ministerio de Industria, Energía y Turismo, dentro del programa Agrupaciones Empresariales Innovadoras (AEI), en su convocatoria 2017, para el desarrollo del proyecto “Sistema de previsión de la demanda”, (SIPREDE).

El Cluster Andalucía Smart City, está formado por la alianza de multitud de empresas e instituciones andaluzas dedicadas al desarrollo de ciudades inteligentes, eficientes, sostenibles y confortables. TOPDigital, es un grupo enfocado a diversas actividades en los sectores de las telecomunicaciones, la eficiencia energética, la consultoría, el marketing, los electrodomésticos, el equipamiento de hogar y profesional, el emprendimiento así como el desarrollo de software. ITELLIGENT Information Technologies es una empresa pionera en España en las áreas de la Inteligencia Artificial, el Big Data y el Procesamiento del Lenguaje Natural (PLN) dedicada desde el 2008 al desarrollo de proyectos en dichas áreas.

El objetivo del proyecto SIPREDE ha sido mejorar el conocimiento de la demanda de las tiendas de TOPDigital y para ello se han realizado la hibridación de datos internos del cliente (demanda) y datos procedentes de Open Data (ej. Dataos sociodemográficos, meteorológicos, etc…) y se ha tenido en cuenta la geolocalización de mucho de estos datos. A partir de esta hibridación se han creado modelos que teniendo en cuenta las capacidades explicativas y predictivas de dichos datos y la distribución espacial de los mismos, permitan una mejora en el conocimiento de la demanda y poder tomar decisiones más informadas.

Los resultados del proyecto obtenidos han sido satisfactorios y abren una oportunidad a muchas otras empresas, las cuales puedan aprovechar la información que aportan la hibridación de sus datos, tanto temporales como geoespaciales y demográficos y de esta forma mejorar el conocimiento de su demanda y con posterioridad poder tomar decisiones mucho más informadas y óptimas que las actualmente consideradas, entre las cuales podían no estar contenidas las ventajas que los datos anteriormente expuestos aportan.

A continuación, se va a realizar una pequeña descripción técnica del proyecto, el cual se fundamenta en el análisis de los factores que más influyen a la hora de producirse una acción de venta. Se han tenido en cuenta 11 tiendas de telefonía propias del grupo TOPDigital en colaboración con uno de sus principales asociados, el operador de telefonía móvil Vodafone. Las tiendas están localizadas en el municipio de Malaga y los datos han sido del año 2017.

Este artículo se centrará en el análisis el análisis de la captación de usuarios (creación de una nueva línea móvil). Para el análisis disponíamos además de los datos de las captaciones las direcciones de dichas tiendas a través de las cuales fueron geolocalizadas determinando su ubicación, latitud/longitud.

Una vez tenida en cuenta esta información, se realizó una búsqueda anexa de la información contenida en Google tanto de las opiniones de los usuarios que realizaron alguna actividad en alguna de las tiendas de estudios, (cantidad de reseñas y puntuaciones aportadas), como de los centros comerciales presentes en la ciudad de Málaga, dentro de los cuales podría encontrarse (o no) alguna de las citadas 11 tiendas. En la siguiente figura, Figura-1, mostramos un ejemplo de la ubicación de 6 de las 11 tiendas anteriormente mencionadas:

Figura-1. Muestra localización de 6 de las 11 tiendas Vodafone-TOPDigital de la ciudad de Málaga

Figura-1. Muestra localización de 6 de las 11 tiendas Vodafone-TOPDigital de la ciudad de Málaga

Como últimos recursos a considerar se tomaron los datos meteorológicos, temperatura media y precipitaciones, aportadas por la Agencia Estatal de Meteorología,  , así como las horas de sol del día estimadas por el Instituto Geográfico Nacional a través de las puesta y la salida del sol, y los días laborales, festivos y de apertura especiales de los centros comerciales recogidos en Boletines Oficiales del Estados, BOE, de la provincia de Málaga.

Antes de proceder a modelar los datos de venta decidimos aplicar diversos análisis estadísticos para determinar las características de cada factor, entre los cuales no se tuvieron en cuenta los de carácter espacial (latitud/longitud, presencia en centros comerciales, reseñas de Google) que serán considerados posteriormente, solo los de carácter temporal (series temporales de captación, meses del año, días horas de sol, etc…). En las siguientes figuras, Figura-2, Figura-3, Figura-4, mostramos un pequeño ejemplo de los análisis de influencia de los factores temporales para una de las 11 tiendas, serie temporal, influencia de dos de los factores, meses del año y las horas que poseen los días:

Figura-2. Serie temporal de captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-2. Serie temporal de captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-3. Influencia del factor meses del año en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-3. Influencia del factor meses del año en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-4. Influencia del factor horas de sol en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-4. Influencia del factor horas de sol en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Una vez consideradas tanto el formato de los datos como las influencias anteriormente descritas y las características aportadas por el problema con respecto a los factores espaciales decimos aplicar un modelo Generalizad Linear Models, espacial y autoregresivo, una variante del Hurdle Count Model, el cual aporta ventajas sobre otros count models, principalmente porque permite corregir ciertas discapacidades como puede ser el problema de la overdispersión.

Una vez generado el modelo, se compararon el valor de estimación del modelo Hurdle Count Model para cada serie temporal de las captaciones con la serie temporal real para el año 2017 de las 11 tiendas presentes en el estudio. En la Figura-5 se muestra un ejemplo de la comparación para una de las 11 tiendas de estas dos series temporales expuestas anteriormente:

Figura-5. Serie temporal de captaciones estimadas por el Hurdle Count Model versus serie temporal real de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-5. Serie temporal de captaciones estimadas por el Hurdle Count Model versus serie temporal real de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Este nuevo término “Inteligencia Electoral (IE)” es la adaptación de modelos matemáticos y de Inteligencia Artificial a las peculiaridades de una campaña electoral. El objetivo de esta inteligencia es la obtención de una ventaja competitiva en los procesos electorales.

¿Cómo funciona? La IE hace uso de toda la información disponible en relación a las campañas electorales pasadas, a  los históricos de resultados electorales, a las encuestas actuales, a los datos demográficos, etc. Toda esta información sirve para evaluar millones de estrategias posibles para poder minimizar el esfuerzo a la hora de obtener el resultado deseado en futuros procesos electorales.

En base a esta IE, hemos desarrollado un sistema inteligente que hemos denominado NETELECTIONS. Se trata de una plataforma digital en la que podemos analizar cualquier tipo de elecciones a cualquier nivel: municipal, autonómico, estatal, …; tomar decisiones en base a la sociodemografía e inclinación del voto de cada zona; y visualizar los datos en base a un sistema de información geográfica (SIG).

¿Qué ofrece este sistema de Inteligecia Electoral? Según el objetivo que queramos alcanzar, ya sea, por ejemplo, el número de escaños, dónde lanzar campañas de buzoneo o dónde realizar mitins, … El sistema NETELECTIONS ofrece una gran variedad de información, entre las que pueden ser:

  • Un conjunto de estrategias a seguir para alcanzar el número de escaños deseado, ya sea a partir de la captación de un (n) de votos de otro partido o a partir de las abstenciones en el voto.
  • Toda la información geolocalizada en el municipio o distrito donde se debe focalizar la campaña electoral para alcanzar el objetivo de escaños deseado.
  • Una estimación por cada zona de un municipio en la que haya mayor afluencia e personas según el perfil del votante establecido (elegido previamente dentro del sistema)
  • Integración con Redes Sociales.
  • Sistemas avanzados de gamificación. netElections, análisis del voto y ubicaciones optimas para establecer tu campaña electoral #politica”.

CASO DE USO: ELECCIONES MUNICIPALES EN SEVILLA, 2019

Supongamos que queremos estudiar al partido Ciudadanos (C´s) con NETELECTIONS para analizar y establecer su campaña electoral en el municipio de Sevilla. En base a la información ofrecida por esta herramienta de Inteligncia Electoral, ¿cómo sería el proceso de análisis del sistema NETELECTIONS? Vayamos paso a paso:

PASO 1: Seleccionar resultados base. Primero, debemos establecer en la plataforma qué Elecciones Municipales de partida queremos tener en cuenta para el análisis de los datos. En este caso de uso, seleccionaremos los resultados de las anteriores Elecciones Municipales de Sevilla en 2015.

PASO 2: Seleccionar proyecciones. Tras seleccionar los resultados base, se proyectan los resultados utilizando las encuestas disponibles.

PASO 3: Seleccionar el Partido Político de estudio. En este supuesto práctico, el partido político objeto de estudio es Ciudadanos (C´s)

PASO 4: NETELECTIONS ofrece estrategias inteligentes. En base a todos los datos seleccionados y al partido político escogido, el sistema NETELECTIONS ofrece las estrategias más óptimas. Además, estos resultados estratégicos se pueden explorar de forma interactiva.

¿Qué estrategias puede ofrecer NETELECTIONS? El sistema ofrece tres tipos de estrategias: simples, combinadas y a medida. En este caso de uso, supongamos que nuestro objetivo en la campaña electoral para Ciudadanos en las Elecciones Municipales de Sevilla 2019 es conseguir más escaños frente a las elecciones pasadas (2015). Para ello, elegiremos la opción de las estrategias simples ofrecidas por el sistema NETELECTIONS.

Una estrategia simple se basa en la captación de votos de varios partidos o captación de abstenciones de voto. El objetivo es saber el mínimo de votos que necesitaría C´s para conseguir su objetivo de escaños.

NETELECTIONS_estrategias simple

En base a estos datos, las estrategias que nos ofrece el sistema son:

  1. Estrategia de captación de votos de las abstenciones en la que C´s tendría que captar, como mínimo,553 votos de las abstenciones para poder conseguir el objetivo de 1 escaño. Si lo consiguiese, el Partido Popular (PP) perdería uno de sus escaños.
  2. Si la estrategia es captar votos al PSOE, el mínimo de votos para alcanzar un escalo sería de 5.553. Curiosamente, esta estrategia acaba perjudicando al PP (y no al PSOE) que perdería el escaño que ganaría Ciudadanos.
  3. Si la estrategia es captar votos del PP para que C´s suba un escaño, se requieren captar 4.600 votos.
  4. La estrategia de captar votos de IULV-CA resulta interesante: sólo se requieren 3.301 votos. Esta estrategia busca eleiminar a IULV-CA haciendo que su porcentaje de voto sea menor que el 5% (Ley d´Hont). Por lo que perdería sus dos escaños, uno lo ganaría C´s y el otro el PSOE-A. Sin embargo, esta estrategia, teniendo en cuenta que el partido objeto de estudio es Ciudadano, parece poco real y bastante díficil que éste capte tres mil votos de IULV-CA. Ante este tipo de situaciones, desde el sistema NETEELECTIONS se puede incluir datos que tengan en cuenta esto y poder generar estrategias a mediad.

Pongamos un ejemplo de una estrategia a medida:

  • Primero, debemos definir el máximo de votos que podemos captar de cada uno de los partidos. A esto le denominamos las “restricciones de escenario”. En este caso de uso, supongamos que queremos captar como máximo un 2% de las abstenciones, un 5% del PP y un 2% del PSOE.
  • En base a estas restricciones, el sistema establece cuál es la mejor forma con la que podemos captar nuestro objetivo de escaños. NETELECTIONS indicará la estrategia más óptima para ello. Por lo que el voto mínimo que debemos captar para obtener 4 escaños son: 141 votos de las abstenciones, 3.595 votos del PP y 648 votos del PSOE.

NETELECTIONS_estrategias a medida

Por otro lado, el sistema también ofrece la información geolocalizada en el municipio. NETELECTIONS determina, a través de una gama de color, las zonas donde se debe realizar mayor esfuerzo para la captación de votos. Con esta información se pueden implementar actos electorales en esa zona, colocar cartelería, lanzar buzoneo especial, … para alcanzar esos votos.

NETELECTIONS dónde captar votos

Si deseas saber algo más sobre nuestro Sistema de Inteligencia Electoral de Netelections, escríbenos o contacta con nosotros.

La mayoría de la información ofrecida por instituciones, diputaciones y otros organismos públicos, popularmente conocida como Open Data, es digitalizada y publicada a través de diferentes canales en Internet. Estos datos abiertos pueden ser tanto disposiciones de licitaciones, ayudas, subvenciones, multas de tráfico, oposiciones, concursos oficiales, etc. Este tipo de información es buscada día a día por diversos usuarios y empresas de diferente índole que desean consultar estas bases de datos de Open Data.

Pero, claro, toda esta información no está estructurada (desordenados) y cada dato está publicado en una web diferente bajo un formato distinto (PDF, HTML, XML,…). Hoy en día no existe una página pública o herramienta comercial que aglutine y extraiga todos estos datos descritos bajo una misma web. Tampoco existe un protocolo o normalización estándar de “cómo se deben publicar”.

Además de la gran heterogeneidad del Open Data (origen y formato), en el 95% de los casos, esa información no está estructurada y necesita un tratamiento por una persona para que sea útil. Si se tiene en cuenta la cantidad de canales a extraer y el volumen de información publicado, incluso considerando sólo lo publicado diariamente, se hace inmanejable para una persona.

En resumen, la situación de partida es que estamos ante un gran volumen de datos que requiere la necesidad de una herramienta que facilite la consulta y extracción de estos datos. Gracias a la inteligencia artificial y el Machine Learning (aprendizaje automático), tenemos la solución: NetOpenData. Se trata de una herramienta que facilita el acceso a los datos del sector público y open data. Se trata de un servicio para acceder a la información de forma estructurada y bajo un solo paraguas, una sola web.

¿Cómo funciona el sistema de inteligencia artificial diseñado?

La innovación principal de NetOpenData parte de obtener, procesar y ofrecer este tipo de información de forma estructurada siguiendo un enfoque automático. Para ello se han aplicado diferentes técnicas de aprendizaje, siguiendo un enfoque supervisado relacionado con:

Se han desarrollado sistemas capaces de dar solución a la extracción masiva de recursos a partir de Internet, la segmentación de textos, la clasificación de textos y la extracción de información en textos. Además, de cara a la extracción masiva de información se ha hecho uso de herramientas pensadas para este tipo de entornos que permitan trabajar desde una perspectiva paralela capaz de organizar el trabajo siguiendo un enfoque escalable y distribuido ya que de otra forma el sistema no es capaz de procesar toda la información recogida.

Otros de los puntos fuertes de NetOpenData es la utilización de las últimas tecnologías de almacenamiento. Sistemas que surgieron hace poco y están adaptadas a los procesamientos de información en tiempo real. Esto es una ventaja debido a que desde su base de creación se están enfocando a problemas actuales como cargas masivas de datos (Big Data) o tiempos de respuesta y almacenamiento bajos, una gran problemática que les cuesta solventar a las bases de datos tradicionales, debido a la robustez que ya tienen.

¿Qué ventajas posee este sistema de Inteligencia Artificial?

  • Permite extraer unos recursos concretos (Ej. Boletines Oficiales) a través de diferentes canales (Ej. Web de una Diputación) de una forma automática, teniendo en cuenta las peculiaridades de los datos a extraer, así como el uso que se le tiene pensado dar.
  • Es capaz de tratar cada recurso extraído con el fin de obtener de él una información útil para el usuario:
    • Segmentar el índice del contenido.
    • Segmentar el contenido en disposiciones.
    • Clasificar el idioma de la disposición.
    • Clasificar las disposiciones en función a una taxonomía.
  • Puede ordenar determinadas piezas de información según el idioma y el tipo de la disposición.
  • Hace posible guardar de forma persistente tanto la información bruta como la estructurada fruto del tratamiento indicado anteriormente, teniendo en cuenta el uso que se le tiene pensado dar y el volumen generado.
  • Ofrece al usuario el acceso a los datos de forma más práctica y eficaz posible, a través de una única página web que permite:
    • la visualización y filtración de datos
    • la descarga de disposiciones concretas
    • la creación de alertas de disposiciones en base a una serie de filtros concretos.

¿Qué tipo de datos públicos puedes obtener con NetOpenData?

Boletines Oficiales, Patentes, Marcas, Ayudas, Nombres Comerciales, Contrataciones y Licitaciones. Toda esta información se estructura para puedas utilizarlo de forma fácil y sencilla en tu empresa o para que puedas montar servicios innovadores a partir de estos datos.

NetOpendata

Por otro lado, en ITELLIGENT nos adaptamos a las necesidades de cada uno de nuestros clientes por lo que si tu empresa requiere otros datos diferentes a los que aporta NetOpenData o desea enlazar los datos de nuestro software con otras fuentes, también somos especialistas en hibridación de datos.