Category: Big Data e Inteligencia Artificial

Business Analytics o su acepción en español, Analítica Empresarial, consiste en llevar a cabo una serie de soluciones empresariales para satisfacer las necesidades de un negocio, lograr metas y alcanzar objetivos. En otras palabras, la analítica empresarial se centra en recopilar datos, enriquecerlos, gestionarlos y analizarlos para extraer la información relevante para la toma de decisiones de un negocio.

Por este motivo, podemos afirmar que la Analítica Empresaria puede servir de apoyo a las estrategias de marketing de una empresa ya que, para fundamentar algunas decisiones estratégicas, éstas estarán basadas en la información que el análisis de datos nos ha aportado.

Por tanto, la analítica empresarial nos permite:

  • Alcanzar objetivos empresariales a partir del análisis de grandes volúmenes de datos.
  • Detectar tendencias y realizar pronósticos a partir de modelos predictivos.
  • Utilizar estos modelos predictivos para optimizar los procesos de negocio.

Una forma de clasificar la Analítica Empresarial podrían ser estas tres áreas más o menos superpuestas:

  • Analítica Descriptiva o Descriptive Analytics. Utiliza los datos para explicar el pasado. Consiste en preparar y analizar datos históricos para identificar patrones y tendencias. Técnicas como modelos de regresión, el modelado de datos y visualización suelen ser usados en la Analítica Descriptiva.
  • Analítica Predictiva o Predictive Analytics. Utiliza los datos para determinar que puede pasar en el futuro. La Analítica Predictiva permite determinar la probabilidad asociada a eventos futuros a partir del análisis de la información disponible (presente y pasada), además permite descubrir relaciones entre los datos que normalmente no es detectada con un análisis menos sofisticado. Técnicas como la minería de datos (data mining) y los modelos predictivos son utilizados.
  • Analítica Prescriptiva o Prescriptive Analytics. Utiliza los datos para prescribir aquellas acciones que incrementen nuestras posibilidades de obtener los mejores resultados. La Analítica Prescriptiva determina nuevos forma de operar que permitan alcanzar nuestros objetivos de negocio. Técnicas como la optimización o la simulación son utilizadas, aunque normalmente se requiere la creación de un modelo predictivo previo.

¿Qué ventaja ofrece la analítica empresarial?

En su día, la llegada de Internet generó un fenómeno completamente nuevo en el que el mercado realizaba sus propios análisis comparando ofertas, intercambiando experiencias, etc. Esta nueva realidad implicó que las marcas tuvieran que adaptarse a un nuevo contexto en el que los consumidores cada vez sabían más sobre los productos que van a comprar. Sin embargo, actualmente, no basta solo con conocer más al consumidor, sino que la información acerca del mercado y sus tendencias o incluso la información sobre los clientes de otras compañías se convierte en algo muy aprovechable para las empresas.

Por este motivo, la analítica empresarial ofrece una ventaja primordial que hace que, en este nuevo contexto, las empresas puedan tomar decisiones estratégicas informadas. La toma de decisiones de negocios es más rápida, efectiva y contundente; éstas están basadas en información real y de calidad; y son capaces de triunfar y adaptarse al desarrollo de una empresa.

ALGORITMO.  En Ciencias de la Computación, un algoritmo es un conjunto de pasos para realizar una tarea. En otras palabras, una secuencia lógica  y con instrucciones que forman una fórmula matemática o estadística para realizar el análisis de datos.

ANÁLISIS DE SENTIMIENTO. El análisis de sentimiento se refiere a los diferentes métodos de lingüística computacional que ayudan a identificar y extraer información subjetiva del contenido existente en el mundo digital. Gracias al análisis del sentimiento, podemos ser capaces de extraer un valor tangible y directo, como puede ser determinar si un texto extraído de la red Internet contiene connotaciones positivas o negativas.

ANÁLISIS PREDICTIVO (AP). El análisis predictivo pertenece al área de la Analítica Empresarial. Se trata de utilizar los datos para determinar que puede pasar en el futuro. La AP permite determinar la probabilidad asociada a eventos futuros a partir del análisis de la información disponible (presente y pasada). También permite descubrir relaciones entre los datos que normalmente no es detectada con un análisis menos sofisticado. Técnicas como la minería de datos (data mining) y los modelos predictivos son utilizados.

ANALÍTICA EMPRESARIAL (AE). La Analítica Empresarial comprende los métodos y las técnicas que se utilizan para recopilar, analizar e investigar el conjunto de datos de una organización, lo cual genera conocimiento que se transforma en oportunidades de negocio y mejora la estrategia empresarial. AE permite una mejora en la toma de decisiones ya que éstas se basan en la obtención de datos reales y tiempo real y permite conseguir objetivos empresariales a partir del análisis de estos datos.

BIG DATA (Grande volúmenes de datos). Actualmente nos encontramos en un entorno en el que cada día se generan trillones de bytes de información. A esta enorme cantidad de datos producidos día a día, la denominamos Big Data. El crecimiento de los datos provocados en Internet y otras áreas (Ej. Genómica) hacen necesarias nuevas técnicas para poder acceder y utilizar estos datos. Al mismo tiempo estos grandes volúmenes de datos ofrecen nuevas posibilidades de conocimiento y nuevos modelos de negocio. En particular, en Internet, este crecimiento comienza con la multiplicación en el número de webs comenzando los buscadores (ej. Google) a buscar nuevas formas de almacenar y acceder a estos grandes volúmenes de datos. Esta tendencia (blogs, redes sociales, IoT …) está provocando la aparición de nuevas herramientas de Big Data y la generalización de su uso.

BUSINESS ANALYTICS (Analítica Empresarial). La Analítica Empresarial o Business Analytics permite conseguir los objetivos empresariales, a partir del análisis de datos. Básicamente permite detectar tendencias y realizar pronósticos a partir de modelos predictivos y utilizar estos modelos para optimizar los procesos de negocio.

BUSINESS INTELLIGENCE (Inteligencia de Negocio). Otro concepto relacionado con la AE es la Inteligencia Empresarial (IE) centrada en el uso de los datos de una empresa para facilitar también la toma de decisiones y anticipar acciones empresariales. La diferencia con la AE es que la IE es un concepto más amplio, no solo se centra en el análisis de datos sino que éste es un área dentro de la IE. Es decir, la IE se trata de un conjunto de estrategias, aplicaciones, datos, tecnología y arquitectura técnica entre las que se encuentra la AE; y todo ello, enfocado a la creación de nuevo conocimiento a través de los datos existentes de la empresa

DATA MINING o minería de datos. Data Mining (minería de datos) es también conocida como Knowledge Discovery in database (KDD). Es comúnmente definida como el proceso para descubrir patrones útiles o conocimientos a partir de fuentes de datos tales como Bases de Datos, textos, imágenes, la web, etc.  Los patrones deben ser válidos, potencialmente útiles y entendibles. La minería de datos es un campo multidisciplinar que incluye: aprendizaje automático, estadísticas, sistemas de base de datos, inteligencia artificial, Information Retrieval, visualización de la información, … El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior.

DATA SCIENCE (Ciencia de datos).  La oportunidad que los datos ofrecen para generar nuevo conocimiento requiere de técnicas sofisticadas de preparación de estos datos (estructuración) y análisis de los mismos. Así en Internet, sistemas de recomendación, traducción automática y otros sistemas de Inteligencia Artificial se basan en técnicas de Data Science.

DATA SCIENTIST. El data scientist, como su propio nombre indica, es un experto en la Ciencia de Datos (Data Science). Su trabajo se centra en extraer conocimiento a partir de grandes volúmenes de datos (Big Data) extraídos de diversas fuentes y múltiples formatos para dar respuesta a las cuestiones que se planteen.

DEEP LEARNING o aprendizaje profundo es una técnica dentro del machine learning basado en arquitecturas neuronales. Un modelo basado en deep learning puede aprender a realizar tareas de clasificación directamente a partir de imágenes, texto o sonido, etc. Sin necesidad de intervención humana para la selección de características, esto se puede considera la principal característica y ventaja del deep learning, llamada “feature discovering”. Pueden, además, poseer una precisión que supera al ser humano.

GEOMARKETING. El análisis conjunto de los datos demográficos, económicos y geográficos posibilita estudios de mercado para rentabilizar las estrategias de marketing. El análisis de este tipo de datos se puede llevar a cabo a través del Geomarketing. Tal como su propio nombre indica, Geomarketing es una confluencia entre geografía y marketing. Se trata de un sistema integrado de información -datos de diversa índole-, métodos estadísticos y representaciones gráficas orientados a dar respuestas a cuestiones de marketing de forma rápida y sencilla.

INTELIGENCIA ARTIFICIAL. En computación se trata de programas o bots diseñados para realizar determinadas operaciones que se consideran propias de la inteligencia humana. Se trata de hacer que éstos sean tan inteligentes como un humano. La idea es que perciban su entorno y actúen en base a ello, centrado en el auto-aprendizaje, sean capaces  de reaccionar ante nuevas situaciones.

INTELIGENCIA ELECTORAL. Este nuevo término “Inteligencia Electoral (IE)” es la adaptación de modelos matemáticos y de Inteligencia Artificial a las peculiaridades de una campaña electoral. El objetivo de esta inteligencia es la obtención de una ventaja competitiva en los procesos electorales. ¿Sabes cómo funciona?

INTERNET OF THINGS (IoT). Este concepto, Internet de las Cosas, fue creado por Kevin Ashton y hace referencia al ecosistema en el que los objetos cotidianos están interconectados a través de Internet.

MACHIEN LEARNIN (Aprendizaje automático). Este término hace referencia a la creación de sistemas a través de la Inteligencia Artificial,  donde lo que realmente aprende es un algoritmo, el cual supervisa los datos con la intención de poder predecir comportamientos futuros.

MINERÍA WEB. La minería web tiene como objeto descubrir información útil o el conocimiento (KNOWLEDGE) procedente de la estructura de hipervínculo web, contenido de la página y datos de usuario. Aunque la minería web utiliza muchas técnicas de minería de datos, no es meramente una aplicación de técnicas de minería de datos tradicionales, debido a la heterogeneidad y la naturaleza semi-estructurada o no estructurada de los datos de la web. La minería web o web mining comprende una serie de técnicas encaminadas a obtener inteligencia a partir de datos procedentes de la web. Aunque las técnicas utilizadas tienen su raíz en las técnicas de data mining o minería de datos, presentan características propias debido a las particularidades que presentan las páginas webs.

OPEN DATA. El Open Data es una práctica que tiene la intención de disponer de unos tipos de datos de forma libre para todo el mundo, sin restricciones de derecho de autor, patentes u otros mecanismos. Su objetivo es que estos datos puedan ser consultados, redistribuidos y reutilizados libremente por cualquiera, respetando siempre la privacidad y seguridad de la información.

PERIODISMO DE DATOS (periodismo computacional). De una forma simple y directa, se trata del periodismo que para crear artículos o investigaciones periodísticas se requiere del conocimiento de técnicas del áreas de data science, big data, inteligencia artificial, entre otras. El periodista de datos debe ser  capaz de dar soporte a sus artículos mediante el análisis de datos, utilizando técnicas analíticas como el análisis de redes sociales, clustering, information retrieval, recommendation systems, etc.

PROCESAMIENTO DEL LENGUAJE NATURAL (PLN). Del procesamiento conjunto de la ciencia computacional y la lingüística aplicada, nace el Procesamiento de Lenguaje Natural (PLN o NLP en inglés), cuyo objetivo no es otro que el de hacer posible la compresión y procesamiento asistidos por ordenador de información expresada en lenguaje humano, o lo que es lo mismo, hacer posible la comunicación entre personas y máquinas.

PRODUCT MATCHING. El Product Matching es un área perteneciente a Data Matching o Record Linkage encargada de identificar automáticamente aquellas ofertas, productos o entidades en general, que aparecen en la web procedente de diversas fuentes, aparentemente de forma distinta e independiente, pero que hacen referencia a una misma entidad real. En otras palabras, el proceso de Product Matching consiste en relacionar para distintas fuentes aquellos productos que son el mismo.

 

  • Buaala es una app inteligente de contenidos audiovisuales que ofrece a sus usuarios construir su propia programación televisiva. 
  • A partir de nuestros gustos o tendencias,  Buaala sabe lo que aún no sabemos qué queremos ver.

Así es Buaala, una aplicación móvil inteligente basada en Inteligencia Artificial y enfocada a ofrecer a los usuarios qué ver en televisión en base a sus gustos y preferencias de la parrilla mediática.  El creador de esta smart app es Felipe García CEO de la compañía Knowdle Media Group, basada en el conocimiento abierto bioinspirado, en la inteligencia colectiva y apoyado en el concepto de “el conocimiento como servicio”.

buaala-app-parrilla-inteligente

La aplicación Buaala cuenta con un motor de inteligencia artificial totalmente proactivo. Permite a los usuarios descubrir y recomendar contenidos relacionados con el cine, películas, series, shows de TV… y, actualmente, posee un catálogo de más de 70.000 productos de Amazón. Está disponible en formato para iOS como para Android.

El concepto de Buaala nació en 2011, su fundador, Felipe García decidió unir dos conceptos: inteligencia artificial e inteligencia colectiva. En 2014, el proyecto recibió casi 2 millones de euros de financiación pública para el desarrollo de un protipo no comercial. Finalmente en 2016, tras un periodo de investigación y desarrollo, surge Buaala como app móvil gratuita.

Funciona como una parrilla inteligente de contenidos audiovisuales, desde la TDT hasta los contenidos que ofrecen Netflix, HBO y Movistar Fusión+.  Aunque algunas de estas mismas plataformas poseen recomendaciones según el historial de contenidos visualizados, Buaala posee un algortimo mucho más complejo. Además de atender a los patrones de consumo de un usuario,  se  tienen en cuenta los criterios que siguen el resto de espectadores de televisión a la hora de escoger  un contenido audiovisual. De esta forma, Buaala recomienda a un usuario qué, cómo y cuándo ver un contenido a través de recomendaciones de amigos, reseñas/críticas, de blogs especializados, campañas promocionales, comentarios de usuarios en redes sociales etc. La idea reside en: cuanto más utilicemos su sistema, su algoritmo más aprenderá sobre ti y tus gustos.

buaal-app-recomendaciones

Además, esta aplicación posee funciones similares a las de una red social especializada en cine y televisión ya que permite: enviar solicitudes se seguimiento a otros usuarios, ver qué contenidos están viendo tus amigos, acceder a foros de comentarios, crear chats privados o chats con varios usuarios, …

CÓMO FUNCIONA BUAALA

Tal como hemos mencionado antes, Buaala aprende de sus usuarios de tal forma que cuanto más uso le den a la app, sus recomendaciones serán más afines al gusto del usuario. Todo esto es gracias a su algoritmo de inteligencia artificial basado en inteligencia colectiva con el que nos propone qué ver. En resumen, nos ayuda a construir nuestra propia programación televisiva.

¿Qué funciones permite Buaala? Podemos reunir algunas a las que se irán uniendo otras muy interesantes en un futuro próximo:

  • OCIO: sugerencias de planes, conciertos, series y películasque ni sabías que podían ser de tu agrado.
  • CINE: si estás con amigos y os apetece ir al cine, Buaala os sugerirá la película perfecta para todos.
  • INFORMACIÓN PERSONALIZADA: Buaala te ofrece todas las curiosidades sobre series, programas y películas de tu interés.
  • CRÍTICAS Y VALORACIONES: podrás leer comentarios/opiniones de otros usuarios, de expertos en cine así como recomendaciones de terceros.
  • ECONOMÍA DEL TIEMPO: con Buaala ahorrarás tiempo buscando cuándo echan tu series, película o programa favorito. Con Buaala lo que te gusta, te encuentra.
  • COMUNICACIÓN 2.0: incorpora un chat con el que poder hablar con amigos en privado o crear un grupo privado de chat.

  • ITELLIGENT, GRUPO TOPDigital y el Cluster Andalucía Smart City colaboran en el proyecto SIPREDE
  • El objetivo ha sido mejorar el conocimiento de la demanda en las tiendas físicas de TOPDigital – Vodafone

portada-proyecto-siprede-itelligent

El consorcio formado por las empresas TOPDigital y Itelligent Information Technologies y el Cluster Andalucía Smart City recibió el pasado 2017 financiación del Ministerio de Industria, Energía y Turismo, dentro del programa Agrupaciones Empresariales Innovadoras (AEI), en su convocatoria 2017, para el desarrollo del proyecto “Sistema de previsión de la demanda”, (SIPREDE).

El Cluster Andalucía Smart City, está formado por la alianza de multitud de empresas e instituciones andaluzas dedicadas al desarrollo de ciudades inteligentes, eficientes, sostenibles y confortables. TOPDigital, es un grupo enfocado a diversas actividades en los sectores de las telecomunicaciones, la eficiencia energética, la consultoría, el marketing, los electrodomésticos, el equipamiento de hogar y profesional, el emprendimiento así como el desarrollo de software. ITELLIGENT Information Technologies es una empresa pionera en España en las áreas de la Inteligencia Artificial, el Big Data y el Procesamiento del Lenguaje Natural (PLN) dedicada desde el 2008 al desarrollo de proyectos en dichas áreas.

El objetivo del proyecto SIPREDE ha sido mejorar el conocimiento de la demanda de las tiendas de TOPDigital y para ello se han realizado la hibridación de datos internos del cliente (demanda) y datos procedentes de Open Data (ej. Dataos sociodemográficos, meteorológicos, etc…) y se ha tenido en cuenta la geolocalización de mucho de estos datos. A partir de esta hibridación se han creado modelos que teniendo en cuenta las capacidades explicativas y predictivas de dichos datos y la distribución espacial de los mismos, permitan una mejora en el conocimiento de la demanda y poder tomar decisiones más informadas.

Los resultados del proyecto obtenidos han sido satisfactorios y abren una oportunidad a muchas otras empresas, las cuales puedan aprovechar la información que aportan la hibridación de sus datos, tanto temporales como geoespaciales y demográficos y de esta forma mejorar el conocimiento de su demanda y con posterioridad poder tomar decisiones mucho más informadas y óptimas que las actualmente consideradas, entre las cuales podían no estar contenidas las ventajas que los datos anteriormente expuestos aportan.

A continuación, se va a realizar una pequeña descripción técnica del proyecto, el cual se fundamenta en el análisis de los factores que más influyen a la hora de producirse una acción de venta. Se han tenido en cuenta 11 tiendas de telefonía propias del grupo TOPDigital en colaboración con uno de sus principales asociados, el operador de telefonía móvil Vodafone. Las tiendas están localizadas en el municipio de Malaga y los datos han sido del año 2017.

Este artículo se centrará en el análisis el análisis de la captación de usuarios (creación de una nueva línea móvil). Para el análisis disponíamos además de los datos de las captaciones las direcciones de dichas tiendas a través de las cuales fueron geolocalizadas determinando su ubicación, latitud/longitud.

Una vez tenida en cuenta esta información, se realizó una búsqueda anexa de la información contenida en Google tanto de las opiniones de los usuarios que realizaron alguna actividad en alguna de las tiendas de estudios, (cantidad de reseñas y puntuaciones aportadas), como de los centros comerciales presentes en la ciudad de Málaga, dentro de los cuales podría encontrarse (o no) alguna de las citadas 11 tiendas. En la siguiente figura, Figura-1, mostramos un ejemplo de la ubicación de 6 de las 11 tiendas anteriormente mencionadas:

Figura-1. Muestra localización de 6 de las 11 tiendas Vodafone-TOPDigital de la ciudad de Málaga

Figura-1. Muestra localización de 6 de las 11 tiendas Vodafone-TOPDigital de la ciudad de Málaga

Como últimos recursos a considerar se tomaron los datos meteorológicos, temperatura media y precipitaciones, aportadas por la Agencia Estatal de Meteorología,  , así como las horas de sol del día estimadas por el Instituto Geográfico Nacional a través de las puesta y la salida del sol, y los días laborales, festivos y de apertura especiales de los centros comerciales recogidos en Boletines Oficiales del Estados, BOE, de la provincia de Málaga.

Antes de proceder a modelar los datos de venta decidimos aplicar diversos análisis estadísticos para determinar las características de cada factor, entre los cuales no se tuvieron en cuenta los de carácter espacial (latitud/longitud, presencia en centros comerciales, reseñas de Google) que serán considerados posteriormente, solo los de carácter temporal (series temporales de captación, meses del año, días horas de sol, etc…). En las siguientes figuras, Figura-2, Figura-3, Figura-4, mostramos un pequeño ejemplo de los análisis de influencia de los factores temporales para una de las 11 tiendas, serie temporal, influencia de dos de los factores, meses del año y las horas que poseen los días:

Figura-2. Serie temporal de captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-2. Serie temporal de captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-3. Influencia del factor meses del año en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-3. Influencia del factor meses del año en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-4. Influencia del factor horas de sol en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-4. Influencia del factor horas de sol en las captaciones de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Una vez consideradas tanto el formato de los datos como las influencias anteriormente descritas y las características aportadas por el problema con respecto a los factores espaciales decimos aplicar un modelo Generalizad Linear Models, espacial y autoregresivo, una variante del Hurdle Count Model, el cual aporta ventajas sobre otros count models, principalmente porque permite corregir ciertas discapacidades como puede ser el problema de la overdispersión.

Una vez generado el modelo, se compararon el valor de estimación del modelo Hurdle Count Model para cada serie temporal de las captaciones con la serie temporal real para el año 2017 de las 11 tiendas presentes en el estudio. En la Figura-5 se muestra un ejemplo de la comparación para una de las 11 tiendas de estas dos series temporales expuestas anteriormente:

Figura-5. Serie temporal de captaciones estimadas por el Hurdle Count Model versus serie temporal real de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017

Figura-5. Serie temporal de captaciones estimadas por el Hurdle Count Model versus serie temporal real de una determinada tienda Vodafone-TOPDigital de la ciudad de Málaga, año 2017