Tag: SIPREDE

  • ITELLIGENT, GRUPO TOPDigital y el Cluster Andalucía Smart City colaboran en el proyecto SIPREDE
  • El objetivo ha sido mejorar el conocimiento de la demanda en las tiendas físicas de TOPDigital – Vodafone

portada-proyecto-siprede-itelligent

El consorcio formado por las empresas TOPDigital y Itelligent Information Technologies y el Cluster Andalucía Smart City recibió el pasado 2017 financiación del Ministerio de Industria, Energía y Turismo, dentro del programa Agrupaciones Empresariales Innovadoras (AEI), en su convocatoria 2017, para el desarrollo del proyecto “Sistema de previsión de la demanda”, (SIPREDE).

El Cluster Andalucía Smart City, está formado por la alianza de multitud de empresas e instituciones andaluzas dedicadas al desarrollo de ciudades inteligentes, eficientes, sostenibles y confortables. TOPDigital, es un grupo enfocado a diversas actividades en los sectores de las telecomunicaciones, la eficiencia energética, la consultoría, el marketing, los electrodomésticos, el equipamiento de hogar y profesional, el emprendimiento así como el desarrollo de software. ITELLIGENT Information Technologies es una empresa pionera en España en las áreas de la Inteligencia Artificial, el Big Data y el Procesamiento del Lenguaje Natural (PLN) dedicada desde el 2008 al desarrollo de proyectos en dichas áreas.

El objetivo del proyecto SIPREDE ha sido mejorar el conocimiento de la demanda de las tiendas de TOPDigital y para ello se han realizado la hibridación de datos internos del cliente (demanda) y datos procedentes de Open Data (ej. Dataos sociodemográficos, meteorológicos, etc…) y se ha tenido en cuenta la geolocalización de mucho de estos datos. A partir de esta hibridación se han creado modelos que teniendo en cuenta las capacidades explicativas y predictivas de dichos datos y la distribución espacial de los mismos, permitan una mejora en el conocimiento de la demanda y poder tomar decisiones más informadas.

Los resultados del proyecto obtenidos han sido satisfactorios y abren una oportunidad a muchas otras empresas, las cuales puedan aprovechar la información que aportan la hibridación de sus datos, tanto temporales como geoespaciales y demográficos y de esta forma mejorar el conocimiento de su demanda y con posterioridad poder tomar decisiones mucho más informadas y óptimas que las actualmente consideradas, entre las cuales podían no estar contenidas las ventajas que los datos anteriormente expuestos aportan.

A continuación, se va a realizar una pequeña descripción técnica del proyecto, el cual se fundamenta en el análisis de los factores que más influyen a la hora de producirse una acción de venta. Se han tenido en cuenta 11 tiendas de telefonía propias del grupo TOPDigital en colaboración con uno de sus principales asociados, el operador de telefonía móvil Vodafone. Las tiendas están localizadas en el municipio de Malaga y los datos han sido del año 2017.

Este artículo se centrará en el análisis el análisis de la captación de usuarios (creación de una nueva línea móvil). Para el análisis disponíamos además de los datos de las captaciones las direcciones de dichas tiendas a través de las cuales fueron geolocalizadas determinando su ubicación, latitud/longitud.

Una vez tenida en cuenta esta información, se realizó una búsqueda anexa de la información contenida en Google tanto de las opiniones de los usuarios que realizaron alguna actividad en alguna de las tiendas de estudios, (cantidad de reseñas y puntuaciones aportadas), como de los centros comerciales presentes en la ciudad de Málaga, dentro de los cuales podría encontrarse (o no) alguna de las citadas 11 tiendas. En la siguiente figura, Figura-1, mostramos un ejemplo de la ubicación de 6 de las 11 tiendas anteriormente mencionadas:

Figura-1. Muestra localización de 6 de las 11 tiendas Vodafone-TOPDigital de la ciudad de Málaga

Figura-1. Muestra localización de 6 de las 11 tiendas Vodafone-TOPDigital de la ciudad de Málaga

Como últimos recursos a considerar se tomaron los datos meteorológicos, temperatura media y precipitaciones, aportadas por la Agencia Estatal de Meteorología,  , así como las horas de sol del día estimadas por el Instituto Geográfico Nacional a través de las puesta y la salida del sol, y los días laborales, festivos y de apertura especiales de los centros comerciales recogidos en Boletines Oficiales del Estados, BOE, de la provincia de Málaga.

Antes de proceder a modelar los datos de venta decidimos aplicar diversos análisis estadísticos para determinar las características de cada factor, entre los cuales no se tuvieron en cuenta los de carácter espacial (latitud/longitud, presencia en centros comerciales, reseñas de Google) que serán considerados posteriormente, solo los de carácter temporal (series temporales de captación, meses del año, días horas de sol, etc…). En las siguientes figuras, Figura-2, Figura-3, Figura-4, mostramos un pequeño ejemplo de los análisis de influencia de los factores temporales para una de las 11 tiendas, serie temporal, influencia de dos de los factores, meses del año y las horas que poseen los días:

Figura-2. Serie temporal de captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-2. Serie temporal de captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-3. Influencia del factor meses del año en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-3. Influencia del factor meses del año en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-4. Influencia del factor horas de sol en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-4. Influencia del factor horas de sol en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Una vez consideradas tanto el formato de los datos como las influencias anteriormente descritas y las características aportadas por el problema con respecto a los factores espaciales decimos aplicar un modelo Generalizad Linear Models, espacial y autoregresivo, una variante del Hurdle Count Model, el cual aporta ventajas sobre otros count models, principalmente porque permite corregir ciertas discapacidades como puede ser el problema de la overdispersión.

Una vez generado el modelo, se compararon el valor de estimación del modelo Hurdle Count Model para cada serie temporal de las captaciones con la serie temporal real para el año 2017 de las 11 tiendas presentes en el estudio. En la Figura-5 se muestra un ejemplo de la comparación para una de las 11 tiendas de estas dos series temporales expuestas anteriormente:

Figura-5. Serie temporal de captaciones estimadas por el Hurdle Count Model versus serie temporal real de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-5. Serie temporal de captaciones estimadas por el Hurdle Count Model versus serie temporal real de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017